1. 首页
  2. 编程语言
  3. Python
  4. Python爬虫爬取微博热搜保存为 Markdown 文件的源码

Python爬虫爬取微博热搜保存为 Markdown 文件的源码

上传者: 2021-06-13 16:16:32上传 PDF文件 519.49 KB 热度 41次

网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。上面关于爬虫可以做什么,定义了一个前提,是浏览器可以访问到的任何资源,特别是对于知晓web请求生命周期的学者来说,爬虫的本质就更简单了。爬虫的本质就是模拟浏览器打开网页,获取网页中我们想要的那部分数据。微博热搜榜python爬虫,仅供学习交流源码及注释:运行:运行结束后会在当前文件夹下生成以时间命名的文件夹,并且会生成以具体小时为单位的具体时间命名的 Markdown 文件,如下:查看:

用户评论