br_fake_news_detection:对以巴西葡萄牙语撰写的文本进行虚假新闻检测 源码
BR假新闻检测 通过对以巴西葡萄牙语编写的文本进行深度学习来伪造新闻检测功能。 用于训练和测试模型的所有数据均在以下获得: : 。 测试了两种不同的方法:一种使用词袋,另一种使用GloVe词嵌入。 方法 在词袋法中,每个文本都由一个向量表示,该向量包含训练语料库中前1000个最常用词的频率。 在对文本进行处理之前,对文本进行了标准化(小写和词干),并删除了停用词。 使用的学习算法是MLP,在10倍交叉验证中模型的平均准确性为88.65%。 在词嵌入方法中,每个文本由一系列100维GloVe词向量表示。 每个文本中允许的最大令牌数设置为200-较大的文本被截断。 使用的学习算法是一个深层的BiLSTM神经网络,该模型在10倍交叉验证中的平均准确性为93,56%。 由于缺少RAM,尝试使用文本的完整版本以及较大尺寸的单词嵌入失败。 结果 最终结果(通过10倍交叉验证计算的平均性能): 参
下载地址
用户评论