1. 首页
  2. 大数据
  3. Hadoop
  4. 豆瓣电影大数据分析【附带爬虫豆瓣对数据处理数据分析可视化】

豆瓣电影大数据分析【附带爬虫豆瓣对数据处理数据分析可视化】

上传者: 2020-05-15 21:19:57上传 ZIP文件 10.63MB 热度 86次
平台部分主要是hadoop分布式系统,基于该系统融合了组件Spark,Hbase,Hive,Sqoop,Mahout等。继而进行相关的数据分析 该项目主要分为以下几部分: 1:数据采集 主要是基于豆瓣电影的数据,进行分析,所以首先要爬取相关的电影数据,对应的源代码在DouBan_Spider目录下,主要是采用Python+BeautifulSoup+urllib进行数据采集 2:ETL预处理 3:数据分析 4:可视化 代码封装完好, 适用于对作影视感情分析,影评分析,电影类型分析,推荐系统的建立
用户评论
码姐姐匿名网友 2020-05-15 21:19:57

请问怎么搭建环境,那个网址挂了

码姐姐匿名网友 2020-05-15 21:19:57

可以运行,谢谢分享