TED平行语料库数据集

Name: TED平行语料库数据集
Rating: 4.5 (103 reviews)
Author: volcanosun

上传者：volcanosun 2024-08-17 14:01:12上传 ZIP文件 365.48MB 热度 103次

TED平行语料库是一个包含多语言平行语料库的重要资源，其中包括多语言并行语料库和单语语料库。该语料库从TED会议中提取了109种世界语言的数据，形成了一个庞大的语料库集合。多语言平行语料库中，包含12种语言，并对超过1.2亿个句子进行了句子对齐，使其在多语言处理和机器翻译等领域具有广泛应用。所有的预处理工作都是自动完成的，极大地提升了使用效率。

对于具体的平行语料库资源，可以参考以下链接获取更详细的信息和相关文件：

中英平行语料库：此资源提供了中英对齐的平行语料库，适合于中英双语的语言处理任务。
平行语料库用于机器翻译等的预处理语料：预处理好的平行语料库，适用于机器翻译等自然语言处理任务。
论文研究面向事件的多语平行语料库构建研究.pdf：提供了关于多语平行语料库构建的深入研究报告，适合学术研究使用。
中英平行语料库八万对句粒度：该链接提供的语料库包含八万对中英句子的对齐数据，适合更大规模的语言处理任务。

这些资源能够帮助研究者和开发人员更好地利用TED平行语料库中的数据，为多语言处理提供支持，并提高机器翻译的质量。阅读相关文档将为您带来更丰富的视角与深入的理解。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

TED平行语料库数据集

TED平行语料库是一个包含多语言平行语料库的重要资源，其中包括多语言并行语料库和单语语料库。该语料库...

大小：365.48MB | 2024-08-17 14:01:12
中英平行语料库

一万句对齐的中英文平行语料库，用于机器翻译，问答系统等模型的预处理语料。

大小：0B | 2019-05-25 06:29:43
中英平行语料库.zip

中英文平行语料库，用于机器翻译，问答系统等模型的预处理语料

大小：0B | 2019-09-09 19:33:50
中英平行语料库八万对句粒度

共8400多对中英语句，已预处理，中文用jieba分了词，标点符号没问题，保存于en-zh.csv，...

大小：0B | 2019-09-03 01:28:10
NiuTrans中英平行语料库10万句

NiuTrans的开源中英平行语料库，可以用来训练机器翻译。

大小：0B | 2019-05-13 16:19:50
中英平行语料库约10M

网上搜集的一些中英平行语料库，包括两部电影（约300k），白皮书（约8M），政治新闻（约2M）。送给...

大小：0B | 2019-05-13 16:19:58
数据集基于TFNMT利用带有Attention的ED模型训练测试中英文平行语料库)实现将英文翻译为中文的LSTM翻译中英文平行语料库)训练数据集

大小：0B | 2019-03-01 12:59:17
平行语料库用于机器翻译等的预处理语料

汉英双语语料和德英双语语料，可以用来训练NMT模型，谨供学术实验用

大小：0B | 2018-12-18 16:14:05
基于汉英平行语料库的中国时间关系解析

基于汉英平行语料库的中国时间关系解析

大小：469KB | 2021-05-02 19:39:55
一万句中英平行语料库不用预处理

平行语料库，用于机器翻译等大数据处理,有需要的可以下来用，可以直接用，不用全角半角变换

大小：0B | 2019-05-31 12:34:56
基于伪平行语料库的双语主动学习关系分类

基于伪平行语料库的双语主动学习关系分类

大小：327KB | 2021-05-02 19:39:59
汉维医疗平行语料库构建及特征分析

面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语...

大小：1.18MB | 2021-04-19 22:50:12
基于网络的汉英平行语料库构建系统开发

人工智能，语料库构建，机器翻译，网络爬虫，机器学习

大小：0B | 2019-05-15 15:31:51
论文研究面向事件的多语平行语料库构建研究.pdf

讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则，制定了...

大小：0B | 2019-09-18 05:27:33
一个面向信息抽取的中英文平行语料库

一个面向信息抽取的中英文平行语料库

大小：1.39MB | 2021-03-15 18:37:26
MSPC语言学语料库：BERT数据集

MSPC语言学语料库，即The Corpus of Linguistics，这是一个适用于BERT的...

大小：1.3MB | 2023-10-17 13:41:24