(维基百科单词映射数据集)
由text8数据集词汇(来自由维基百科),通过程序统计单词出现频率后得到,使用作为映射用的字典的话,(比如按照出现单词频率进行排序这种,构建词向量的部分),
下载地址
用户评论