Reddit Data Science Posts:关于Reddit上的Date Science的帖子 源码
Reddit数据科学职位 Reddit上的Data Science Community每年都在增长。 如今,该网络已成为许多专业人士和爱好者的平台,他们分享了宝贵的材料和经验。 一项有趣的任务是分析专门针对数据科学的帖子: 寻找有趣的话题, 研究随时间变化的趋势, 通过标题和文本等预测Reddit上帖子的潜在受欢迎程度。 随着时间的流逝,我将通过添加其他子reddit的帖子来增加此数据集的大小,从而提高分析和建模的质量。 随时在此数据集和 上留下您的评论。 我将尝试使数据集更好和更大。 当前的目标是750k +帖子(破坏者:在那之后,将有100万!) 该数据集包括19个Date Science子目录中的500,000多个帖子: , , , , , , , , , , , , , , , , , , 数据是从 (由Jason Baumgartn
用户评论