LIBSVM_Classify_E mail.zip 上传者:qqinvestigator63129 2020-12-20 21:19:42上传 ZIP文件 29.9MB 热度 6次 利用libsvm算法对中文邮件二分类 1.按照索引读取数据,将索引用字符“d”切割;对前半部分提取索引值为0的字符,根据该字符为“s”或“h”分别可以将读取的每个文件写入其它的路径。 2.读取每一个邮件的同时,利用正则表达式去除文本中的英文和数字以及特殊字符,剔除无关的数据。 3.在读取数据的同时对文本进行分词(这里采用的分词工具为ansj),这里在分词后需要再此利用正则表达是去掉分词后的词性标注,并将词语用空格分割 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论 qqinvestigator63129 资源:1 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com