1. 首页
  2. 数据库
  3. 其它
  4. 汉语单词向量:100多个汉语单词向量上百种预训练中文词向量 源码

汉语单词向量:100多个汉语单词向量上百种预训练中文词向量 源码

上传者: 2021-02-24 00:21:59上传 ZIP文件 346.81KB 热度 24次
中文单词向量 该项目提供了100多个中文单词向量(嵌入),它们经过不同的表示(密集和稀疏),上下文特征(单词,ngram,字符等)和语料库训练。 可以轻松获得具有不同属性的预训练向量,并将其用于下游任务。 此外,我们提供了一个中文类比推理数据集CA8和一个评估工具包,供用户评估其词向量的质量。 参考 如果使用这些嵌入和CA8数据集,请引用该论文。 沉力,赵哲,胡仁芬,李文思,刘涛,杜小勇, ,ACL 2018。 @InProceedings{P18-2023, author = "Li, Shen and Zhao, Zhe and Hu, Renfen
下载地址
用户评论