Yelp Recommendation System 源码
推荐系统 数据集 评论来自数据集和业务数据集。 用于勘探的数据是从原始数据集中随机抽样的。 数据探索-评论数据集 cd data-exploration spark-submit reviews.py 5 10 reviewsExploration.txt 根据我们的抽样评论数据集: 从2004年到2018年,评论数量逐年增加 超过560k的独立用户发表了书面评论 每个用户平均留下2条评论 最常使用的用户在Yelp上留下了700多条评论 评论文本中使用的前10个常用词是:“食物”,“地点”,“好”,“很棒”,“服务”,“喜欢”,“时间”,“得到”,“一个”,“会” (不包括停用词和标点符号) 但是,仅了解评论数据集中的数据还不够。 借助业务数据集,可以将诸如业务类别之类的信息与评论数据进行组合。 数据探索-业务数据集和评论数据集 cd data-exploration spark-su
用户评论