使用最大熵模型进行中文文本分类
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技末1由于最大嫡模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结来.但是,将最大嫡模型应用在文本分类中的研究却非常少,而使用最大嫡模型进行中文文本分类的研究尚未见到.使用最大墒模型进行了中文文本分类.通过实验比较和分析了不同的中文文本特征生成方法、不同的特征数目,以及在使用平滑技术的情况下,基于最大嫡模型的分类器的分匆险能并且将其和BayeS,KNN,SVM三种典型的文本分类器进行了比较,结果显示它的分类性能胜于Bayes方法,与KNN和svM方法相当,表明这是一种非常有前途的文本分类方
用户评论
值得学习的内容,不过实现起来还是需要点时间的。
资源很好,别地儿下太麻烦。最大熵模型还在学习啊,
最大熵在文本分类中的应用,谢谢分享
对我来说有点难度,还需要好好学习
看的不是很明白
分类效果还不错 谢谢了