网络爬虫(三) BS4提取之find_all
网络爬虫(三) BS4提取之find_all 2.2 find_all爬取酷狗top500 我们利用selector方法对酷狗top500进行了爬取,但此方法提取数据很不健壮,当对方对html源码修改进行修改,这个爬虫就不能使用了,因为这方法是按照 html 树一层一层元素的选取,当有一个元素修改,树状结构发生变化,就不再可用。 这里我们使用 find_all 方法提取数据,就如字面意思,找到所有符合的元素,这种方法比 select 更健壮,因为不管 html 树状结构如何改变,此方法都会选择特定的元素而不受 html 树状结构的影响。 2.2.1 环境配置 Selector方法中我们安装了b
下载地址
用户评论