第一个爬虫——斗鱼分类下的人气排行
from urllib import request from io import BytesIO import gzip import re class Spider(): def __init__(self): self.url='https://www.douyu.com/g_LOL' self.root_pattern='\n([\\s\\S]*?)\n\n' self.number_pattern='([\\s\\S]*?)' self.name_pattern='([\\s\\S]*?)' def __fetch_content(self): headers
用户评论