1. 首页
  2. 数据库
  3. 其它
  4. 动手学深度学习 Task04 机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer

动手学深度学习 Task04 机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer

上传者: 2021-01-31 01:50:09上传 PDF文件 415.32KB 热度 10次
【一】机器翻译及相关技术 机器翻译(MT): 将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出的是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。 数据预处理 将数据集清洗、转化为神经网络的输入minbatch。字符在计算机里是以编码的形式存在,我们通常所用的空格是 \x20 ,是在标准ASCII可见字符 0x20~0x7e 范围内。 而 \xa0 属于 latin1 (ISO/IEC_8859-1)中的扩展字符集字符,代表不间断空白符nbsp(non-breaking space),超出gbk编码范围,是需要去除
用户评论