论文研究基于互信息和邻接熵的新词发现算法.pdf

Name: 论文研究基于互信息和邻接熵的新词发现算法.pdf
Rating: 4.5 (65 reviews)
Author: Xieminsen

上传者：Xieminsen 2019-09-14 00:10:24上传 PDF文件 1.06MB 热度 65次

如何快速高效地识别新词是自然语言处理中一项非常重要的任务。针对当前新词发现存在的问题，提出了一种从左至右逐字在未切词的微博语料中发现新词的算法。通过计算候选词语与其右邻接字的互信息来逐字扩展，得到候选新词；并通过计算邻接熵、删除候选新词的首尾停用词和过滤旧词语等方法来过滤候选新词，最终得到新词集。解决了因切词错误导致部分新词无法识别以及通过n-gram方法导致大量重复词串和垃圾词串识别为新词的问题。最后通过实验验证了该算法的有效性。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究基于互信息和邻接熵的新词发现算法.pdf

如何快速高效地识别新词是自然语言处理中一项非常重要的任务。针对当前新词发现存在的问题，提出了一种从左...

大小：0B | 2019-09-14 00:10:24
基于改进互信息和邻接熵的微博新词发现方法

基于改进互信息和邻接熵的微博新词发现方法，大数据，自然语言处理

大小：0B | 2019-09-14 00:10:35
Pythonpython3实现互信息和左右熵的新词发现

python3利用互信息和左右信息熵的中文分词新词发现

大小：0B | 2019-09-27 19:19:31
图像信息熵和互信息的计算

介绍了信息熵的概念，计算方法和互信息的概念计算，用matlab实现。

大小：0B | 2019-04-29 09:14:41
信息熵·互信息代码

可以利用此代码完成信息熵及其互信息直接的计算，解决的·互信息在实际计算中不好求解的情况。此代码在ma...

大小：0B | 2019-04-29 09:14:02
论文研究基于互信息熵的国家风险相关性研究.pdf

论文研究-基于互信息熵的国家风险相关性研究.pdf, 国家间国家风险的相互关联状况, 已成为影响全...

大小：972KB | 2020-07-16 05:16:53
论文研究基于最大互信息最大相关熵的特征选择方法.pdf

特征选择算法主要分为filter和wrapper两大类，并已提出基于不同理论的算法模型，但依然存在算...

大小：471KB | 2020-07-18 17:43:03
论文研究结合互信息和主题模型的微博话题发现方法.pdf

为了解决短文本信息流的特征稀疏性对热点话题发现带来的挑战，提出了结合词语互信息和概率主题模型的微博热...

大小：0B | 2020-05-04 11:32:11
计算信息熵及其互信息

1.理解信源的概念。2.了解如何获得信息。3.学会计算信息熵。4.学会计算两个信息的互信息。

大小：0B | 2019-05-01 16:00:42
论文研究_快速互信息轮廓匹配算法.pdf

将插值曲线约束于给定的区域之内是曲线形状控制中的重要问题。构造了一种仅依赖于函数值的分母为二次的有理...

大小：535KB | 2020-07-16 04:48:07
论文研究基于最近邻互信息的特征选择算法.pdf

针对邻域信息系统的特征选择模型存在人为设定邻域参数值的问题。分别计算样本与最近同类样本和最近异类样本...

大小：0B | 2020-05-22 16:57:14
基于互信息的图像配准算法研究

本文对基于互信息的图像配准方法进行研究。主要工作有：（1）详细研究了互信息的基本理论和互信息配准方法...

大小：0B | 2019-06-01 10:47:14
论文研究基于EMD和互信息熵的微震信号自适应去噪.pdf

针对强干扰背景下的微震信号提取，提出一种基于经验模态分解（EmpiricalModeDecompos...

大小：0B | 2020-06-10 16:05:14
论文研究基于分块互信息的图像配准.pdf

提出了一种自适应canny算子进行树上柑橘图像边缘检测的方法。对获取的RGB真彩图像进行R-B色差空...

大小：0B | 2019-09-28 23:12:15
论文研究基于互信息的维吾尔文自适应组词算法.pdf

传统的分词方法将一个维吾尔文语义词（多词关联模式）拆分成与词意义不符的若干个片段,因此在维吾尔语文本...

大小：0B | 2020-05-17 10:50:53
互信息Renyi熵条件熵matlab代码linux

matlab代码,包含功能:计算互信息、香农熵、Renyi熵、条件熵、加权熵、加权互信息等。用法举例...

大小：80KB | 2020-09-11 11:45:23