harley_the_bot:伯特驱动的机器人可以帮助您识别用户 源码
由bert驱动的机器人可以帮助您识别用户。 概述 该项目的目标是确定使用“ SunXiaoChuan”模式发布消息的用户。 背景 2019年11月,一波名为``孙小川258''的巨魔军队到达了Twitter中国用户。 他们来自哪里,他们的组织方式和背景是未知的。 但是,它们具有非常相似的语言行为。 这是学习如何将NLP与深度学习结合使用以识别它们的绝好机会。 训练数据集 来自“孙晓川”及其关注者网络的20,000条推文。 来自普通Twitter用户的20,000条推文。 搜寻器脚本是tools / fetch.py和tools / tweets.py 下载培训集: : 微调语言模型 BERT-Base,中文 中文-BERT-WWM 结果 BERT-Base,中文82.4% 中国-BERT-WWM 83.6% 结果样本 孙小川正面:result_samples / positi
下载地址
用户评论