PennTreeBank(PTB)数据集
来源于TomasMikolov网站上的PTB数据集http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz。该数据集已经预先处理过并且包含了全部的10000个不同的词语,其中包括语句结束标记符,以及标记稀有词语的特殊符号()。我们在reader.py中转换所有的词语,让他们各自有唯一的整型标识符,便于神经网络处理。
下载地址
用户评论
虽然没用到,很好