基于代理IP的豆瓣电影排行榜爬取及Excel存储

Name: 基于代理IP的豆瓣电影排行榜爬取及Excel存储
Rating: 4.5 (59 reviews)
Author: iceberg_8932

上传者：iceberg_8932 2024-07-02 22:23:44上传 RAR文件 4.95KB 热度 59次

介绍如何使用 Python 编写爬虫程序，利用代理 IP 获取豆瓣电影排行榜数据，并将数据存储到 Excel 文件中。

代码实现

# 导入必要的库
import requests
from bs4 import BeautifulSoup
import pandas as pd

# 设置代理 IP
proxies = {
    'http': 'http://your_proxy_ip:your_proxy_port',
    'https': 'https://your_proxy_ip:your_proxy_port'
}

# 设置请求头
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}

# 发送请求获取网页源代码
url = 'https://movie.douban.com/chart'
response = requests.get(url, headers=headers, proxies=proxies)

# 解析网页源代码
soup = BeautifulSoup(response.text, 'lxml')

# 提取电影信息
movies = soup.find_all('div', class_='pl2')
movie_list = []
for movie in movies:
    title = movie.find('a').text.strip()
    rating = movie.find('span', class_='rating_nums').text
    movie_list.append([title, rating])

# 将数据存储到 Excel 文件
df = pd.DataFrame(movie_list, columns=['电影名称', '评分'])
df.to_excel('豆瓣电影排行榜.xlsx', index=False)

注意事项

请将代码中的 your_proxy_ip 和 your_proxy_port 替换为实际的代理 IP 地址和端口号。
爬取过程中请遵循 robots 协议，合理设置请求频率，避免对目标网站造成压力。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于代理IP的豆瓣电影排行榜爬取及Excel存储

介绍如何使用 Python 编写爬虫程序，利用代理 IP 获取豆瓣电影排行榜数据，并将数据存储到 E...

大小：4.95KB | 2024-07-02 22:23:44
Python爬取豆瓣电影排行榜

爬取豆瓣电影排行榜TOP250并输出至txt文件中输出格式如下排名电影名评分影评1肖申克的救赎The...

大小：18.6KB | 2023-01-30 11:51:01
python爬取豆瓣新片排行榜

python爬取豆瓣新片排行榜

大小：3KB | 2021-04-26 16:46:52
爬取豆瓣排行榜电影数据含GUI界面版

这个项目源于大三某课程设计。平常经常需要搜索一些电影，但是不知道哪些评分高且评价人数多的电影。为了方...

大小：14.95MB | 2020-07-20 23:57:01
Python爬虫实战：代理IP爬取某瓣电影排行榜写入Excel(1).html

使用Python爬虫，利用代理IP获取某瓣电影排行榜数据，并将数据写入Excel文件。

大小：16.64KB | 2024-05-26 05:11:48
Python爬取豆瓣TOP250电影排行榜小甲鱼

Python爬取豆瓣TOP250电影排行榜(小甲鱼)，学习python爬虫的好资料，你值得拥有！

大小：0B | 2019-05-01 04:59:44
使用urllib爬取猫眼电影排行榜信息

大小：0B | 2018-12-08 05:39:58
爬取猫眼电影的排行榜前100名

本次爬虫没有采用scrapy框架，只是用了requests请求，然后用正则表达式进行网页的解析，最后...

大小：0B | 2019-06-04 12:41:26
python爬虫爬取豆瓣电影排行榜并通过pandas保存到Excel文件当中

我们的需求是利用python爬虫爬取豆瓣电影排行榜数据,并将数据通过pandas保存到Excel文件...

大小：320KB | 2020-12-31 03:50:12
猫眼电影排行榜前100名电影爬取资料

用正则表达式爬取猫眼电影前100名的电影详情,有电影影评和电影的各类信息介绍,如果你不知道看什么电影...

大小：4KB | 2020-08-30 01:45:30
爬虫爬取豆瓣2019电影排行榜的信息不是top250那个

抓取js动态数据的练手之作,项目抓取了豆瓣2019电影排行榜的相关电影信息,并将其改为json格式存...

大小：3KB | 2020-10-19 17:44:38
爬取酷狗排行榜歌曲

爬虫歌曲下载可直接运行，可以爬取酷狗排行榜的歌曲不需要会员还是不错的来源自java团长

大小：0B | 2019-06-04 03:13:44
Python使用Beautiful Soup爬取豆瓣音乐排行榜过程解析

主要介绍了Python使用Beautiful Soup爬取网页过程解析,文中通过示例代码介绍的非常详...

大小：450KB | 2020-09-21 15:20:16
python爬取酷狗音乐排行榜

主要为大家详细介绍了python爬取酷狗音乐排行榜,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

大小：29KB | 2020-12-02 16:43:21
爬取中国大学排行榜.zip

python爬取中国大学排行榜,并对前十做可视化柱状图分析

大小：8KB | 2021-04-12 21:16:55
爬取TIOBE的编程语言排行榜

写在前面: 我是「虐猫人薛定谔i」,一个不满足于现状,有梦想,有追求的00后 \quad 本博客主要...

大小：729KB | 2021-02-01 10:34:35