1. 首页
  2. 数据库
  3. 其它
  4. subreddit analyzer:全面的数据和文本挖掘工作流程可处理来自任何给定公共subreddit的提交和评论 源码

subreddit analyzer:全面的数据和文本挖掘工作流程可处理来自任何给定公共subreddit的提交和评论 源码

上传者: 2021-02-15 18:57:45上传 ZIP文件 18.32MB 热度 11次
Subreddit分析器 该项目记录了使用Pushshift API下载大量Reddit提交和评论的过程,以获取有趣的见解,例如按工作日,小时和最常用词的分发方式。 该项目分为三个主要部分,即ETL过程,NLP管道以及图表和见解的生成。 以下是所包含脚本的摘要: subreddit_comments.py-一个Python脚本,可从Pushshift API下载固定数量的注释。 subreddit_submissions.py-一个Python脚本,可从Pushshift API下载固定数量的提交。 subreddit_comments_alt.py-一个Python脚本,可从Pus
下载地址
用户评论