t5 pegasus:中文生成式预训练模型源码

Name: t5 pegasus:中文生成式预训练模型 源码
Rating: 4.5 (39 reviews)
Author: wrapping807

上传者：wrapping807 2021-05-05 12:50:59上传 ZIP文件 418.5KB 热度 39次

T5飞马中文生成式预训练模型,以mT5为基础架构和初始权重,通过类似PEGASUS的方式进行预训练。详情可见: ://kexue.fm/archives/8209 分词器我们将T5 PEGASUS的令牌生成器转换成BERT的令牌生成器,它对中文更友好。同时,我们重新排列一版词表,从而里边的字,词都更加完善,目前的vocab.txt共包含5万个token,真正覆盖了中文的常用字,词。预训练任务具体来说,假设一个文档有n个句子,我们从中挑出大约n / 4个句子(可以不连续),因此这n / 4个句子拼起来的文本,跟剩下的3n / 4个句子拼写的文本,更长公共子序列重置长,然后我们将3n / 4个句子拼写的文本视为标题,n / 4个句子拼起来的文本透视摘要,通过这样的方式构成一个“(Reuters,摘要)”的伪摘要数据对。模型下载目前开源的T5 PEGASUS是基本版,总参数量为2

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

t5pegasus中文生成式预训练模型源码

T5飞马中文生成式预训练模型,以mT5为基础架构和初始权重,通过类似PEGASUS的方式进行预训练...

大小：418KB | 2021-05-05 12:50:59
chinese gen中文生成式预训练模型源码

中文生成式预训练模型 NLU的预训练模型大家应该见过不少了,NLG的预训练资源还比较少。这里汇总一些...

大小：1KB | 2021-05-03 12:52:57
哈尔滨工业大学-ChatGPT生成式对话预训练模型.zip

ChatGPT生成式对话预训练模型是由美国人工智能公司OpenAI于2022年11月推出的。它能够通...

大小：20.07MB | 2023-10-09 06:58:28
中文XLNet预训练中文XLNet中文XLNet预训练模型源码

| 本项目提供了针对中文的XLNet预训练模型,扩展了丰富的自然语言处理资源,提供多种中文预训练模型...

大小：227KB | 2021-03-22 02:43:22
很棒的预训练中文nlp模型很棒的预训练中文NLP模型可以替换中文预训练模型集合源码

很棒的预训练中文nlp模型:很棒的预训练中文NLP模型,可以替换中文预训练模型集合

大小：9KB | 2021-02-17 10:31:48
multilingual t5源码

mT5:多语言T5 多语言T5(mT5)是一种大规模的多语言预训练文本到文本转换器模型,遵循与类似的...

大小：24KB | 2021-04-08 19:20:50
ELECTRA中文预训练ELECTRA模型源码

ELECTRA 中文预训练 ELECTREA 模型: 基于对抗学习 pretrain Chines...

大小：3KB | 2021-05-04 00:19:34
官方bert中文预训练模型

Google官方中文Bert预训练模型,当前模型为bert base模型.

大小：364.49MB | 2020-08-21 16:03:56
T5模型的代码实战与应用

T5模型是一种基于Transformer的自然语言处理模型，它可以应用于多种任务，比如翻译、句子接受...

大小：605.97KB | 2023-08-31 23:30:38
中文ELECTRA训练有素的中文ELECTRA中文ELECTRA预训练模型源码

| 谷歌与斯坦福大学共同研发的最新预训练模型ELECTRA因其小巧的模型体积以及良好的模型性能受到了...

大小：314KB | 2021-02-21 08:35:49
判别式模型和生成式模型的区别

其实机器学习的任务是从属性X预测标记Y,即求概率P(Y|X)。判别式模型对于判别式模型来说求得P...

大小：206KB | 2021-01-09 22:31:43
ChatGPT生成式对话模型指南

ChatGPT 使用指南模型交互使用自然语言与 ChatGPT 进行交互，提出问题或指令。清晰简洁地...

大小：37.67KB | 2024-06-06 00:48:44
yolov5预训练模型.zip

此文件是yolov5的预先训练模型(包含yolov5s.pt、yolov5x.pt、yolov5l....

大小：258.09MB | 2020-08-17 07:17:32
YOLOv5预训练模型权重

YOLOv5四个权重文件 yolov5s.pt yolov5m.pt yolov5l.pt yolo...

大小：294.61MB | 2020-12-11 01:41:01
GPT GNN KDD20图形神经网络的生成式预训练的代码源码

GPT-GNN:图神经网络的生成式预训练 GPT-GNN是通过生成式预训练来初始化GNN的预训练框架...

大小：1.88MB | 2021-04-20 06:29:13
IBRNet预训练模型

IBRNet预训练模型

大小：94.77MB | 2023-01-11 15:58:11

t5 pegasus:中文生成式预训练模型 源码

t5 pegasus:中文生成式预训练模型源码