Python实现中文论文相似度比较（jieba库用法）

Name: Python实现中文论文相似度比较（jieba库用法）
Rating: 4.5 (44 reviews)
Author: disaster_72339

上传者：disaster_72339 2023-10-04 19:58:34上传 ZIP文件 118.07MB 热度 44次

利用jieba库对中文论文进行相似度比较和分类。源码包括001.py、003.py、004.py三个文件。001.py用于将原文转换为utf-8格式，用户可直接运行。003.py使用jieba库对训练集中的论文进行分词，并按词频排序输出至文档，停用词库存放在文件夹中的stopwords.txt中。004.py可进行论文相似度分析并输出结果。复旦大学中文文本分类数据集已包含在文档中，用户可从中选择训练集和测试集。运行001.py完成格式转换后，执行003.py可在List文件夹中生成训练集各类论文分词后的文档，测试集中的论文需与代码同级目录下。最后执行004.py获得相似度结果。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Python实现中文论文相似度比较（jieba库用法）

利用jieba库对中文论文进行相似度比较和分类。源码包括001.py、003.py、004.py三个...

大小：118.07MB | 2023-10-04 19:58:34
Python jieba库用法及实例解析

主要介绍了Python jieba库用法及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者...

大小：250KB | 2020-11-06 21:09:21
Python中文分词库jieba pkusegwg性能准确度比较

中文分词，将中文语句切割成单独的词组。英文使用空格来分开每个单词的，而中文单独一个汉字跟词有时候完全...

大小：584.79 KB | 2021-06-04 05:56:11
Python jieba库分词模式实例用法

在中文分词中，jiebe库是最为常见的，主要的原因还是它独特的支持分词模式如：全模式：精确模式：搜索...

大小：49.00 KB | 2021-06-12 20:19:08
图像相似度比较

大小：0B | 2019-01-07 17:37:19
OpenCv相似度比较

大小：0B | 2019-01-02 02:49:27
图片相似度比较

实现两张图片相似度的对比的算法，参数两个图片，返回double类型的相似度

大小：0B | 2019-09-20 16:14:27
比较曲线相似度

用余弦相似度与距离差比较曲线相似度，提出位移比较法对曲线初始位置不一致有较好处理效果，纯C代码未调第...

大小：0B | 2019-05-04 05:39:42
比较图片相似度技术

C#比较图片相似度技术，能达到100%.

大小：0B | 2019-09-07 02:23:56
图形相似度比较

NULL博文链接：https://guoapeng.iteye.com/blog/2118962

大小：0B | 2020-05-14 15:06:09
词语相似度比较工具

这是一个比较好用的词语相似度计算的工具

大小：0B | 2019-06-05 06:48:32
文本相似度比较

能够对text文档进行语义相似度比较，并能进行术语之间的相似度计算。

大小：0B | 2019-05-28 06:09:18
AudioCompare 音频相似度比较

大小：0B | 2018-12-09 00:13:26
图像对比相似度比较

图像对比相似度比较

大小：9KB | 2020-12-28 08:16:46
Python人工智能之路jieba gensim最好别分家之最简单的相似度实现

主要介绍了Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现 ,非常...

大小：62KB | 2020-12-16 07:26:12
文档相似度比较TFIDF算法的实现C

大小：0B | 2019-01-15 14:46:00