Fake_Real_News 源码
项目的高级描述 在过去的几年中,由于技术发展和社交媒体的使用,我们注意到黄色新闻业的增长。 假新闻封装了可能是恶作剧的新闻,通常通过社交媒体传播。 通常,主要原因是进一步传播或强加某些想法。 此类包含虚假或声明的新闻最终被算法赋予了生命。 介绍 该项目探索了约44898个虚假和真实新闻的数据集。 该项目的目标是使用此数据集构建一种算法,该算法可识别新闻是否为假新闻。 该数据集是从Kaggel获得的。 探索的数据集由两个文档组成,其中包含在2015年3月30日至2018年2月18日之间发布的新闻(已经标记为真或假)。 基本信息数据集 “标题”-文章标题 “文本”-文章的文本 “主题”-文章的主题(政策,新闻,左新闻,Goverbment新闻,美国新闻) “日期”-发布文章的日期 “标志”-假的或真实的(合并两个数据框后增加了列) 探索性数据分析
下载地址
用户评论