1. 首页
  2. 数据库
  3. 其它
  4. 大学大数据应用淘宝双11数据;数据分析;Spark;可视化分析含论文

大学大数据应用淘宝双11数据;数据分析;Spark;可视化分析含论文

上传者: 2020-08-21 06:31:48上传 ZIP文件 4.7MB 热度 32次
本实验涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。淘宝购物行为数据集共有5000万条记录,本实验选取的数据集为:第4350万-4500万行,共150万条数据。 首先,实验将本地数据集上传到数据仓库Hive,然后在Hive数据仓库下进行数据分析,接着本实验将数据从Hive导入到MySQL,利用Spark预测回头客行为,最后本实验利用ECharts在eclipse IDE 下进行数据可视化分析,得出了所有买家各消费行为对比、男女买家
用户评论