1. 首页
  2. 数据库
  3. 其它
  4. CS5811 分布式数据分析 ML HPCI:小组项目 源码

CS5811 分布式数据分析 ML HPCI:小组项目 源码

上传者: 2021-02-24 21:25:41上传 ZIP文件 5.27MB 热度 6次
CS5811-分布式数据分析 分组项目管道以进行分布式数据分析 链接到主要数据集:- Netflix的数据集(Zaahir): - 。 Netflix的数据集(Rashmi): - 。 Netflix的原稿(阿利亚): - 数据集变量: Show_id 类型 标题 导向器 国家 添加日期 发行年份 缺失数据:- 我们需要为每个电影和电视节目标题添加的数据(imdb数据)。 任何其他会增加维度的数据 任务:-(按任务依赖性排序)。 数据加入:Zaahir。 数据清理:Aliyah和Qamar。 探索性数据分析:侯赛因和拉什米。
用户评论