基于python的网络爬虫设计 上传者:u86409 2019-04-29 05:30:16上传 ZIP文件 642.47KB 热度 62次 以世纪佳缘网为例,思考自己所需要的数据资源,并以此为基础设计自己的爬虫程序。应用python伪装成浏览器自动登陆世纪佳缘网,加入变量打开多个网页。通过python的urllib2函数进行世纪佳缘网源代码的获取。用正则表达式分析源代码,找到所需信息导入excel。连接数据库,将爬下的数据存储在数据库中。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论