1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究最大熵模型在邮件分类中的应用.pdf

论文研究最大熵模型在邮件分类中的应用.pdf

上传者: 2020-05-27 12:35:18上传 .PDF文件 771KB 热度 28次
邮件分类是指在给定的分类体系下,根据邮件的内容和属性,确定其类别标签的过程。将最大熵模型应用于邮件分类中,给出了邮件的预处理过程,介绍了邮件信头特征,分析比较了特征数量和迭代次数、邮件特征字段对分类结果的影响,以及对层次分类和平面分类的效果进行了比较。实验表明,特征数量和迭代次数分别取2000和250时为宜;充分利用邮件各字段信息,取得的总体分类效果最好,但对合法邮件,利用邮件头及邮件标题却取得了最好结果,并在层次分类中验证了这点,层次分类效果要优于平面分类。最后进行了总结和展望。
用户评论