1. 首页
  2. 数据库
  3. 其它
  4. 通过requests库re库进行淘宝商品爬虫爬取(对中国大学mooc嵩天老师爬虫进行修改)

通过requests库re库进行淘宝商品爬虫爬取(对中国大学mooc嵩天老师爬虫进行修改)

上传者: 2020-12-30 23:56:37上传 PDF文件 394.11KB 热度 25次
中国大学mooc上的爬取淘宝页面商品已经因为淘宝的维护而无法爬取 比如,只出现个表头: 这是我按照嵩天老师代码学习,遇到的问题。 原代码如下: import requests import re def getHTMLText(url): try: r= requests.get(url,timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" def parseP
下载地址
用户评论