1. 首页
  2. 人工智能
  3. 机器学习
  4. 维基百科中文语料word2vec训练后结果

维基百科中文语料word2vec训练后结果

上传者: 2019-07-11 05:44:26上传 ZIP文件 234B 热度 40次
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
下载地址
用户评论
码姐姐匿名网友 2019-07-11 05:44:26

您说可以看您博客,但是我找了一下却没有看到呀,您能发下链接吗 不发这资源就是白下的了 另外 还特别想要您处理后的中文语料 就是没有经过分词的 您如果还有 方便的话麻烦您也给我发一份

码姐姐匿名网友 2019-07-11 05:44:26

可以的模型

码姐姐匿名网友 2019-07-11 05:44:26

还没使用。。等下试试

码姐姐匿名网友 2019-07-11 05:44:26

请问一下四个文件分别是什么用处啊?

码姐姐匿名网友 2019-07-11 05:44:26

你不是说这是训练后的模型吗,就是因为自己训练内存溢出才来下你的资源的呀o(╥﹏╥)o

码姐姐匿名网友 2019-07-11 05:44:26

非常好方法

码姐姐匿名网友 2019-07-11 05:44:26

我下载了,只有一个URL,不知道怎么用

码姐姐匿名网友 2019-07-11 05:44:26

介绍一下各个文件使用方法更好了,还是感谢

码姐姐匿名网友 2019-07-11 05:44:26

刚好在学习 Gensim 谢谢!