详解python定时简单爬取网页新闻存入数据库并发送邮件
本人小白一枚,简单记录下学校作业项目,代码十分简单,主要是对各个库的理解,希望能给别的初学者一点启发。 一、项目要求 1、程序可以从北京工业大学首页上爬取新闻内容:http://www.bjut.edu.cn 2、程序可以将爬取下来的数据写入本地MySQL数据库中。 3、程序可以将爬取下来的数据发送到邮箱。 4、程序可以定时执行。 二、项目分析 1、爬虫部分利用requests库爬取html文本,再利用bs4中的BeaultifulSoup库来解析html文本,提取需要的内容。 2、使用pymysql库连接MySQL数据库,实现建表和插入内容操作。 3、使用smtplib库建立邮箱连接,再使
用户评论