基于向量空间模型的中文文本相似度的研究

Name: 基于向量空间模型的中文文本相似度的研究
Rating: 4.5 (54 reviews)
Author: dongjtu

上传者：dongjtu 2021-01-31 15:59:34上传 PDF文件 1.57MB 热度 54次

在文本聚类中需要衡量中文文本之间的相似性。本文首先讨论了文本相似度的概念和常用计算算法,详细介绍了向量空间模型和算法步骤,采用删除去除词表、近义词合并、修改文件长度3中策略对算法进行了改进。最后借助盘古分词组件和搜狗实验室的互联网词库,在Visual Studio 2008环境下使用C#语言对算法进行了实现。使用在CNKI上得到的5个不同领域的500篇学术论文的中文摘要对算法进行了测试,结果表明新算法在误差率方面有较大改善,但运行时间较长。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于向量空间模型的中文文本相似度的研究

在文本聚类中需要衡量中文文本之间的相似性。本文首先讨论了文本相似度的概念和常用计算算法,详细介绍了向...

大小：1.57MB | 2021-01-31 15:59:34
空间向量模型比较文本相似度

大小：0B | 2019-03-03 06:10:33
向量空间模型快速文本相似度计算

使用向量空间模型以最快速度计算文本之间的相似度，JAVA源码+数据

大小：0B | 2020-05-26 18:22:12
基于分词的中文文本相似度计算研究

大小：0B | 2019-01-06 11:07:49
向量空间模型快速文本相似度计算java源码加数据

使用向量空间模型以最快速度计算文本之间的相似度，JAVA源码+数据

大小：0B | 2019-05-15 02:18:34
文本相似度研究

文本相似度研究NLPC文本分类语义识别，google关于文本相似度最新研究

大小：0B | 2019-05-16 11:55:31
中文文本相似度匹配算法

中文文本相似度匹配算法simHash海明距离IK分词完整的可运行的示例代码包含simHash算法，使...

大小：0B | 2019-06-05 06:47:36
基于词向量的文本相似函数

基于词向量的文本相似函数。包含WDS的Java版本的代码; WDS1-1 WDS1-2 WDS2 ...

大小：1.48MB | 2020-08-17 13:08:50
基于GVSM的文本相似度算法研究

提出了一种基于WordNet和GVSM的文本相似度算法,通过语义的路径长度和路径深度计算两个词的语义...

大小：240KB | 2020-10-28 01:35:01
基于HybridDL模型的文本相似度检测方法

为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet ...

大小：75KB | 2020-10-28 02:59:13
文本相似度

计算文本相似度,文本相似度计算,用于鉴别文章是否存在抄袭

大小：2KB | 2020-08-21 08:05:12
基于向量空间模型的中文文本分类技术研究

0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展....

大小：0B | 2019-09-20 10:52:05
vsm模型计算文本相似度

1.采用经典的vsm模型实现的文本相似度计算。2.采用中科院ictclas的开源分词系统3.包含全部...

大小：0B | 2019-05-16 11:54:54
论文研究基于依存句法分析的中文文本相似度计算研究.pdf

基于依存句法分析的中文文本相似度计算研究，赵白玉，彭黎，中文文本相似度的计算在中文信息处理中起着极为...

大小：0B | 2019-09-07 07:47:52
gensim包的tfidf方法计算中文文本相似度

gensim包的tfidf方法计算中文文本相似度，代码可直接运行，包含中文停用词，方便。

大小：0B | 2019-05-07 12:55:13
基于LCS的文本相似度计算

Text similarity calculation based on LCS

大小：0B | 2019-06-23 04:08:19