1. 首页
  2. 编程语言
  3. Python
  4. Python爬虫简单运用爬取代理IP的实现

Python爬虫简单运用爬取代理IP的实现

上传者: 2022-04-24 21:53:05上传 PDF文件 1.10 MB 热度 39次

环境:python3.8+pycharm分析网页源码:选中div元素后右键找到Copy再深入子菜单找到Copy Xpath点击一下就复制到XPath我们复制下来的Xpth内容为:/html/body/div/div[3]/div[2]/table/tbody/tr[50]/td[1]从上图可以看出,只匹配到了一个Ip,我们稍作修改,即可达到目的经过上面的规则学习后,我们修改为://*[@class=‘mt-0 mb-2 table-responsive']/table/tbody/tr/td[1],再利用xpthhelp工具验证一下:这样我们就可以爬取整个页面的Ip地址了,为了方便爬取更多的I

下载地址
用户评论