1. 首页
  2. 移动开发
  3. 其他
  4. TED平行语料库数据集

TED平行语料库数据集

上传者: 2024-08-17 14:01:12上传 ZIP文件 365.48MB 热度 27次

TED平行语料库是一个包含多语言平行语料库的重要资源,其中包括多语言并行语料库单语语料库。该语料库从TED会议中提取了109种世界语言的数据,形成了一个庞大的语料库集合。多语言平行语料库中,包含12种语言,并对超过1.2亿个句子进行了句子对齐,使其在多语言处理和机器翻译等领域具有广泛应用。所有的预处理工作都是自动完成的,极大地提升了使用效率。

对于具体的平行语料库资源,可以参考以下链接获取更详细的信息和相关文件:

这些资源能够帮助研究者和开发人员更好地利用TED平行语料库中的数据,为多语言处理提供支持,并提高机器翻译的质量。阅读相关文档将为您带来更丰富的视角与深入的理解。

下载地址
用户评论