1. 首页
  2. 数据库
  3. 其它
  4. gutenbergReverseIndex:读取大量的Gutenberg Project文本文件 源码

gutenbergReverseIndex:读取大量的Gutenberg Project文本文件 源码

上传者: 2021-02-22 17:31:55上传 ZIP文件 15MB 热度 10次
Indice Reverso-古腾堡的历史 jet虫 请按照以下格式进行分类: 格式: (帕拉夫拉(Palavra,idPalavra)) 关键的价格逆转是关键的,但存在的价值却是存在的。 格式:(palavraId,[docId1,docId2,docIdN]) 使用环境 在Hortonworks SandBox 2.6.5中,可以使用它。 可以使用Oracle Virtual Box在集群中进行服务,可以用于进行分类处理,可以在后部部署数个集群,并且可以并行处理。 ( ) 凡尔赛 Python 2.7.5 HDFS 2.7.3 火花2.3.0 HDP 2.6.5 脚步 克隆项目
下载地址
用户评论