维基百科中文语料word2vec训练后结果

Name: 维基百科中文语料word2vec训练后结果
Rating: 4.5 (73 reviews)
Author: 假装未曾来过

上传者：假装未曾来过 2019-07-11 05:44:26上传 ZIP文件 234B 热度 73次

中文维基百科语料库，将其转换为文本文件后，进行繁体字转换为简体字，字符集转换，分词，然后训练得到模型以及向量。由于文件上传的大小限制是60MB，而训练后的所有文件大小有1G以上，所以这里只提供了下载链接，地址在网盘中。使用python中的gensim包进行训练得到的，运行时间较长，纯粹的维基百科中文语料训练后的结果，拿去可以直接使用。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

: 码姐姐匿名网友 2019-07-11 05:44:26

您说可以看您博客，但是我找了一下却没有看到呀，您能发下链接吗不发这资源就是白下的了另外还特别想要您处理后的中文语料就是没有经过分词的您如果还有方便的话麻烦您也给我发一份

: 码姐姐匿名网友 2019-07-11 05:44:26

可以的模型

: 码姐姐匿名网友 2019-07-11 05:44:26

还没使用。。等下试试

: 码姐姐匿名网友 2019-07-11 05:44:26

请问一下四个文件分别是什么用处啊？

: 码姐姐匿名网友 2019-07-11 05:44:26

你不是说这是训练后的模型吗，就是因为自己训练内存溢出才来下你的资源的呀o(╥﹏╥)o

: 码姐姐匿名网友 2019-07-11 05:44:26

非常好方法

: 码姐姐匿名网友 2019-07-11 05:44:26

我下载了，只有一个URL，不知道怎么用

: 码姐姐匿名网友 2019-07-11 05:44:26

介绍一下各个文件使用方法更好了，还是感谢

: 码姐姐匿名网友 2019-07-11 05:44:26

刚好在学习 Gensim 谢谢！

维基百科中文语料word2vec训练后结果

中文维基百科语料库，将其转换为文本文件后，进行繁体字转换为简体字，字符集转换，分词，然后训练得到模型...

大小：0B | 2019-07-11 05:44:26
中文维基百科语料

数据来源于中文维基百科，利用gensim进行数据抽取，再经过繁体字转换成简体字，得到纯净的文本语料，...

大小：0B | 2019-05-21 18:02:43
英文word2vec模型训练语料

本语料适合于使用word2vec英文训练的语料，共98M，包括常用的英文词汇，训练后效果不错。

大小：0B | 2019-04-30 07:39:10
英文维基百科词向量训练语料

enwiki-latest-pages-articles1.xml-p10p30302.bz2，维基...

大小：0B | 2019-04-30 07:39:54
word2vec入门训练语料.txt

word2vec入门训练语料,可以用来跑简单的word embedding训练流程,千里之行始于足下...

大小：60MB | 2020-10-27 06:40:59
中文维基语料Word2Vec训练模型

原文件为zhwiki-latest-pages-articles.xml.bz2，大小为1.7G，最...

大小：0B | 2019-09-21 04:19:14
维基百科中文语料已分词

自己用来训练word2vec的，已提取文本，做了分词处理，过滤了大部分的特殊字符。共包含327362...

大小：0B | 2020-05-19 03:13:45
维基百科维基百科维基百科维基百科.txt

网址:http://en.wikipedia.org/wiki/Wikipedia 数据获得描述: ...

大小：768B | 2021-02-07 03:09:38
利用wikipedia语料训练word2vec代码

利用wikipedia语料训练word2vec代码，中英文都可，语料自行下载

大小：0B | 2019-08-02 05:30:07
维基百科中文预训练数据

用于BERT预训练，Bidirectional Encoder Representation fro...

大小：489.93MB | 2020-07-21 03:11:27
wikipedia训练简体中文word2vec模型训练结果.rar

wikipedia 训练简体中文得到的word2vec模型，课程作业，仅供大家参考哈 Word2ve...

大小：115.34MB | 2020-07-30 09:37:57
word2Vec训练.zip

词向量训练,实现了Distributed Representations of Words and ...

大小：10.72MB | 2020-08-11 03:33:26
中文维基百科语料_已分词part1

中文维基百科语料-已分词part1，后面还有part2，请一起下载使用。

大小：0B | 2019-05-17 06:37:02
维基百科黑暗黑暗维基百科源码

适用于所有Wikimedia Wiki(wikipedia.org,wikidata.org,wik...

大小：3.06MB | 2021-02-01 22:16:19
中文维基百科优良词条

维基百科共有984,308篇条目，其中1,295(刷新)篇为优良条目（约每760篇条目中有一篇）。该...

大小：0B | 2018-12-25 01:18:48
中文维基百科hosts文件

中文维基百科hosts文件，拷贝到C:\Windows\System32\drivers\etc目录...

大小：0B | 2019-05-21 18:02:43