DSC180B 源码
DSC180B 该存储库主要是试图弄清我们的主要目的,即“获得更准确的加权和公式以解决Wikipedia文章的争议”。 我们制作了一些python文件来处理与该主题相关的数据和分析。 但是我们尚未完成这项研究。 编码部分 我们正在努力生成最终使用的数据框,并对所有编码文件进行情感分析。 特别: 对于get_data.py,它的主要功能是从Wikipedia XML文件下载并提取评论部分 对于deal_withcomment.py,此python文件的主要功能是更正那些XML文件中存在的格式问题。 得到正确的格式后,我们将开始将从XML文件获得的数据帧合并到英语light dump数据中 对
下载地址
用户评论