1. 首页
  2. 编程语言
  3. Python
  4. 新浪微博爬虫代码+结果

新浪微博爬虫代码+结果

上传者: 2018-12-09 10:04:41上传 RAR文件 111.15KB 热度 45次
新浪爬虫的python代码以及部分结果整理 文件列表 1. spider_try.py 爬虫主程序,采用抓取html源码解析的方式获取用户信息。针对每个用户按照person类定义解析。 2. person.py 定义person类,将相应的html标签段解析为可读形式 3. format.py 将最终的结果输出为gexf标准格式方便图处理
用户评论