SVMCLS 文本自动分类器(可编译Release完整版)--李荣陆
之前的最好资源描述如下:svmcls2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词程序和数据导致分词程序初始化失败,还有的缺少直接训练测试的语料库。本人经过整理和编译测试,保证本压缩包解压后不仅有可以直接使用的.exe程序,
下载地址
用户评论
还不错,程序可以使用,十分感谢李老师的分享!
很棒的资源,我正在研究文本挖掘,很有参考价值,只是源码编译还是有一个错误,自己找找问题出在哪儿吧,谢谢李荣陆老师的无私分享
正在学习SVM文本挖掘,C++的比较好。速度快
有一定帮助,但是主要还是要看自己的了解
可以直接运行,数据集,源程序都有,感谢楼主,感谢李荣陆老师。
要自己再装一下Xerces-C++
还不错,能运行
确实可以跑,分类效果也还行
SVMCLS 文本自动分类器(可编译Release完整版)--李荣陆 非常好用,已经测试
确实可以跑,分类效果也还行,但读起来确实困难