1. 首页
  2. 数据库
  3. 其它
  4. 土耳其语 Word2Vec:土耳其语的预训练Word2Vec模型 源码

土耳其语 Word2Vec:土耳其语的预训练Word2Vec模型 源码

上传者: 2021-02-06 01:10:05上传 ZIP文件 4.63KB 热度 30次
土耳其语预训练Word2Vec模型 (下面是土耳其语版本。/Türkçeiçinaşağıyabakın。) 本教程介绍了如何从Wikipedia转储中为土耳其语训练word2vec模型。 此代码使用库以Python 3编写。 土耳其语是一种凝集性语言,维基百科语料库中有很多词具有相同的词缀和不同的后缀。 我将写土耳其语lemmatizer来提高模型的质量。 您可以查看以了解更多详细信息。 如果您只想下载预训练的模型,则可以使用并且可以在github Wiki中的页面中查找示例。 其中一些如下: word_vectors.most_similar(positive=["kral","ka
用户评论