1. 首页
  2. 移动开发
  3. 其他
  4. 突现分析算法实现的文档结构及应用场景

突现分析算法实现的文档结构及应用场景

上传者: 2023-07-29 00:55:14上传 PDF文件 237.16KB 热度 15次

文本数据挖掘中,针对连续到达的文档流,提取有意义的结构是一个基本问题。这篇文档着重研究了“突发活动”所呈现的爆发现象,并提出了一种形式化方法来对其建模。该方法利用无限状态自动机对流进行建模,并通过状态转换来识别爆发现象,从而为内容分析提供了组织框架。实验结果表明,该算法在处理电子邮件和研究文献资料方面具有高效性,并产生了一个具有层次结构的爆发集合。这种结构在术语上与其产生的内容具有自然意义。

下载地址
用户评论