1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于LDA和DBSCAN的软件多版本克隆群映射方法.pdf

论文研究基于LDA和DBSCAN的软件多版本克隆群映射方法.pdf

上传者: 2020-06-10 18:33:17上传 PDF文件 1.06MB 热度 17次
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法。首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果。对五款开源软件83个版本进行了映射实验,结果表明查全率、查准率均在98%以上,为克隆代码分析、管理提供了有力支持。
用户评论