tang.npz 可以用numpy.load(tang.npz)直接读取
''' tang.npz中有三个对象 data:(57580,125)的numpy数组,共有57580首诗歌,每首诗歌的长度为125个字符 (不足125,在古诗前补足空格,超过125,超过部分删去,古诗的开头是,结尾是,这俩字符对应的数字,超过125,只有对应的起始符) word2ix:将词转化成它对应的序号 ix2word:将序号转化成它对应的词 '''
下载地址
用户评论