1. 首页
  2. 数据库
  3. 其它
  4. Amazon_Vine_Analysis:使用PySpark分析亚马逊评论 源码

Amazon_Vine_Analysis:使用PySpark分析亚马逊评论 源码

上传者: 2021-05-07 20:46:23上传 ZIP文件 13.23KB 热度 19次
Amazon_Vine_Analysis 使用PySpark分析亚马逊评论 项目概况 分析由付费Amazon Vine计划成员撰写的Amazon评论。 Amazon Vine程序是一项服务,允许制造商和发布者接收对其产品的评论。 我使用PySpark执行ETL过程以提取数据集,转换数据,连接到AWS RDS实例并将转换后的数据加载到pgAdmin中。 然后,我使用PySpark来确定我的数据集中Vine成员是否对偏爱的评论有任何偏见。 资源 数据源:Amazon Review数据集,amazon_reviews_us_Outdoors_v1_00.tsv 软体:Google Colab Notebook,PostgreSQL 11.9,pgAdmin 4,AWS 结果 评论总数 葡萄藤评论 非葡萄评论 5星级评论的总数 葡萄藤评论 非葡萄评论 5星级评论的百分比 葡萄藤评论
用户评论