CS5811 分布式数据分析 ML HPCI:小组项目 源码
CS5811-分布式数据分析 分组项目管道以进行分布式数据分析 链接到主要数据集:- Netflix的数据集(Zaahir): - 。 Netflix的数据集(Rashmi): - 。 Netflix的原稿(阿利亚): - 数据集变量: Show_id 类型 标题 导向器 国家 添加日期 发行年份 缺失数据:- 我们需要为每个电影和电视节目标题添加的数据(imdb数据)。 任何其他会增加维度的数据 任务:-(按任务依赖性排序)。 数据加入:Zaahir。 数据清理:Aliyah和Qamar。 探索性数据分析:侯赛因和拉什米。
下载地址
用户评论