多语境下的预训练语言模型：通过扩展语言数量与MLM自监督训练实现跨语言理解

上传者：lihong99411 2023-12-12 11:34:15上传 ZIP文件 20.34MB 热度 57次

自然语言处理领域中，预训练语言模型（PLM）已成为至关重要的基础技术。在多语言研究中，通过在预训练阶段增加语言数量、采用MLM（掩码语言模型）自监督训练等方式，预训练模型得以具备多语言和跨语言理解的强大能力。为了推动中国少数民族语言信息处理的研究与发展，哈工大讯飞联合实验室（HFL）发布了少数民族语言预训练模型CINO（Chinese mINOrity PLM）。该模型的问世为跨文化交流、信息处理等领域提供了有力支持。

下载地址

用户评论

更多下载

下载地址

立即下载

收藏腾讯微博

用户评论

多语境下的预训练语言模型：通过扩展语言数量与MLM自监督训练实现跨语言理解

自然语言处理领域中，预训练语言模型（PLM）已成为至关重要的基础技术。在多语言研究中，通过在预训练阶...

大小：20.34MB | 2023-12-12 11:34:15
Python XLMFacebook用PyTorch实现的跨语言预训练语言模型

包含单语言BERT预训练语言模型和跨语言XLM预训练语言模型，支持监督/无监督机器翻译和跨语言文本分...

大小：103KB | 2020-07-30 12:27:28
最新弱监督预训练语言模型微调报告

迁移学习从根本上改变了自然语言处理(NLP)的处理范式。许多最先进的模型首先在大型文本语料库上进行预...

大小：4.63MB | 2020-12-28 22:35:25
Transformer预训练语言模型

Transformer 是强大的预训练语言模型，已在各种自然语言处理任务中取得了卓越的性能。通过大规...

大小：112.74KB | 2024-05-01 07:17:25
Transformer预训练语言模型

Transformer 预训练语言模型在自然语言处理领域发挥着至关重要的作用，提供卓越的语言理解和生...

大小：3.17MB | 2024-05-01 07:28:24
探索语言的奥秘：预训练模型

凭借海量文本数据的训练，预训练语言模型能够捕捉语言的复杂模式和规律，为各种自然语言处理任务奠定坚实基...

大小：453.07MB | 2024-05-06 18:04:41
xlnet XLNet用于语言理解的广义自回归预训练源码

介绍 XLNet是一种基于新型广义置换语言建模目标的新型无监督语言表示学习方法。此外,XLNet使...

大小：2.9MB | 2021-02-06 06:26:06
NLP预训练模型自然语言处理预训练模型的集合源码

NLP预训练模型:自然语言处理预训练模型的集合

大小：852KB | 2021-02-17 10:31:45
AliceMind：前沿预训练语言模型架构

AliceMind以其先进的预训练语言模型体系而著称。该体系由阿里巴巴MinD（达摩机器智能）实验室...

大小：27.39MB | 2023-12-12 12:03:19
ERNIE ERNIE的语言理解实现包括预训练模型和微调工具源码

|简体中文 ERNIE是百度开创性提出的基于知识增强的持续学习语义理解框架,该框架将大数据预训练与多...

大小：2.3MB | 2021-02-20 03:01:20