scrape_project 源码
我们正在使用IMDb网站,该网站是世界上最受欢迎,最大的在线信息数据库,主要与电影和电视连续剧有关。 我们从前250个电影页面入手,并为每部电影收集了不同的信息,例如:标题,剧组(导演和明星演员),每部电影的整体评分,其在图表中的排名,选民人数,电影的发行年份。 (将添加更多待处理的数据)我们在python中使用了request和BeautifulSoup模块,以便访问此特定页面的信息,并选择了与所需数据相关的html标签。 这样做之后,我们获得了所有250部电影的列表,并运行了一个for循环以提取每部电影的相关信息。 运行代码可以输出全部250部电影,每部电影的相关数据都在同一行(年份,星号等)。检查Requirements.txt以进行所有必需的安装并运行main.py文件。
用户评论