1. 首页
  2. 数据库
  3. 其它
  4. Python3 实现爬取网站下所有URL方式

Python3 实现爬取网站下所有URL方式

上传者: 2020-12-31 16:36:35上传 PDF文件 45.29KB 热度 17次
获取首页元素信息: 目标 test_URL:http://www.xxx.com.cn/ 首先检查元素,a 标签下是我们需要爬取得链接,通过获取链接路径,定位出我们需要的信息 soup = Bs4(reaponse.text, "lxml") urls_li = soup.select("#mainmenu_top > div > div > ul > li") 首页的URL链接获取: 完成首页的URL链接获取,具体代码如下: ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已经上传群文件,可以自行下载! ''' def get_first_url()
下载地址
用户评论