Datawhale 组对学习打卡营 任务10:机器翻译及相关技术
目录 机器翻译和数据集 数据预处理 分词 建立词典 载入数据集 Encoder-Decoder Sequence to Sequence模型 模型 具体结构 Encoder Decoder 损失函数 训练 测试 . . 机器翻译和数据集 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。【如:i am Chinese(3个词) 翻译成中文 我是中国人(5个词)】 import os os.listdir('/home/kesci/input/')
用户评论