MWEC:基于多语义词向量的中文新词发现方法及其论文支撑数据和复现代码
一种基于多语义词向量的中文新词发现方法MWEC,提供了相关论文支撑数据和WEBM简单复现代码。该方法基于词向量+n-gram频数、平均互信息和左右熵等算法,在大规模领域文本中有效检测中文新词。其中,简单新词发现结果已在soprts下得到验证。
下载地址
用户评论