Python3爬取小说并保存到文件
问题 python课上,老师给同学们布置了一个问题,因为这节课上学的是正则表达式,所以要求利用python爬取小说网的任意小说并保存到文件。 我选的网站的URL是 ‘https://www.biqukan.com/0_159/’ 解决方法 首先先思考解决方式。 先获取到网页源码,从源码中找出小说的名字和目录结构 创建文件保存的目录,目录名是小说名 从网页代码中获取小说的目录列表 循环遍历目录,获取目录中每篇的超链接和文章标题 如果是超链接就继续发请求访问从而获取这章小说的正文 将正文写入创建好的目录,文件名是这章小说的标题名 使用之前需要导入相关的模块,requests模块,re正则的模块,o
下载地址
用户评论