political bias classifier::scroll:将文本序列分类为“党派”或“中立”的程序 源码
概括 该程序使用机器学习和情感分析将文本序列分类为“党派”或“中立”。 型号和数据 训练后的模型以腌制文件的形式存储在compressed_trained_model.pklz ,该文件为85.6 MB,可以在此下载。 请注意,初始模型训练是作为我的计算机科学课的扩展项目的一部分进行的。 因此,我无法发布训练模型的代码。 简而言之,该模型是在data/train.csv上训练并在data/train.csv进行评估的朴素贝叶斯分类data/test.csv 。 使用了Textblob库。 原始数据是从改编的,并进行了手动预处理。 pred.py文件包含一个可在pred.py程序文件中使用的函数predict_text ,该函数可加载模型,处理输入的文本并返回结果。 运行说明 您可以通过在本地服务器上运行,要么使用程序,或者你可以conveniantly使用它通过以下网站: 如果您想在本
用户评论