dab 源码
这是从vietai / dab(当前为私人回购)中复制的 :sparkles: 通过反向翻译(DAB)进行数据增强 :sparkles: 该存储库基于反向翻译[1]作为数据增强方法[2,3]的思想。 这个想法很简单:将一种语言的句子翻译成另一种语言,然后再翻译回原来的语言。 这样一来,任何NLP数据集的大小都可以相乘。 使用我们的代码的示例如下所示: 在此项目中,我们为人们提供了一个不错的界面,使人们可以交互地研究与任何tensor2tensor检查点一起使用的反翻译模型。 我们还提供了以批处理模式执行反向翻译的选项,以反向翻译完整的数据集,请参阅。 在这里,我们提供了两组训练有素的检查点: 英语-越南语: 。 有关如何训练和可视化自己的翻译模型的信息,请参阅 英文-法文: 。 这取自。 :notebook: 交互式反向翻译。 我们使用生成您在上面看到的GIF。 :notebook: 低资源语言的反向翻译案例研究 无监督数据增强[3]
用户评论