Yelp Recommendation Analysis 数据提取与处理指南
Yelp-推荐-分析===信息组:本项目Yelp推荐分析由Siddharth Boobna、Yash Parikh和Prateek Sinha开发,专为大数据分析设计。三位开发者均为哥伦比亚大学计算机科学系的学生,分别是:悉达多·布布纳(ssb2171 [at] 哥伦比亚[dot] edu)、亚什·帕里克(yp2348 [at] 哥伦比亚[dot] edu) 和普拉提克·辛哈(ps2791 [at] 哥伦比亚[dot] edu)。
如何使用该项目?
-
下载源代码和数据集。
-
运行项目中的数据提取器文件,该文件将生成可与Hive一起使用的CSV文件。
-
您可能需要根据需要修改提取脚本,以设置您选择的路径和文件名。
-
您还可以根据数据需求修改选择的列,以使用不同的数据集。
注意:完成数据提取后,您可以开始数据分析过程。
下载地址
用户评论