1. 首页
  2. 数据库
  3. 其它
  4. 基于斜率密度聚类的相似文本标定

基于斜率密度聚类的相似文本标定

上传者: 2021-02-21 18:26:12上传 PDF文件 1.14MB 热度 16次
相似文本标定是抄袭检测的一个重要环节,现有标定方法大多采用直接对文本或指纹进行合井的方式,标定精度受干扰信息影响较大。针对这种局限性,分析了匹配指纹对的语义特征,提出基于斜率密度的相似文本聚类方法,将文本匹配合井问题转化成稠密样本点聚类问题,井在 PAN 公用语料库上对该方法进行了测试,得到的主要指标优于 PAN10 前 3 名。目前已将该方法用于华南理工大学特色专业教学平台的作业查抄,取得了较好的效果。
用户评论