大型语言模型事实准确性与上下文关联数据集

上传者：jiangyuelong 2025-01-03 13:37:04上传 ZIP文件 4.53MB 热度 15次

Google DeepMind和Google Research联合创建的数据集，用于评估和提升大型语言模型（LLMs）在事实准确性和上下文关联（grounding）方面的表现。数据集包含1719个示例，涵盖金融、科技、零售、医疗和法律等多个领域。每个示例要求模型基于长达32000个token（约20000字）的文档生成详细响应。

数据集中的每个示例包括系统指令（system_instruction），用户请求（user_request），以及提供回答所需信息的长文档（context_document）。此外，还包含用于评估模型生成响应的评价提示。为确保公正性，数据集分为“公共”（860个示例）和“私有”（859个示例）两部分。公共部分已公开，供研究人员和开发者使用，私有部分用于排行榜评分，防止基准污染和作弊。

评估模型响应的任务由三款领先的LLMs执行：Gemini 1.5Pro、GPT-4o和Claude 3.5Sonnet。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

大型语言模型事实准确性与上下文关联数据集

Google DeepMind和Google Research联合创建的数据集，用于评估和提升大型语...

大小：4.53MB | 2025-01-03 13:37:04
驾驭语言模型：ChatGPT准确性攻略

驾驭语言模型：ChatGPT准确性攻略1. 明确指令，减少歧义使用清晰、简洁的语言描述你的问题或任务...

大小：37.37KB | 2024-05-03 19:44:22
ChatGPT数据集标注与准确性评估

本指南介绍ChatGPT技术中数据集标注的构建过程和准确性检验方法。

大小：37.67KB | 2024-05-19 13:33:36
Meta大型语言模型LLaMA 2

Meta公司开发的大型语言模型LLaMA 2，拥有强大的文本处理能力。

大小：5.06MB | 2024-05-07 00:00:08
语言模型与数据集.md

语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为 T 的词的序列 w1,w2,....

大小：5KB | 2020-08-20 00:47:52
大型语言模型能够自我改进

大型语言模型能够自我改进.pdf

大小：531.56KB | 2023-07-22 12:27:23
语言模型训练：从海量数据中学习上下文联系

语言模型训练是指通过海量数据的学习，让计算机能够理解和预测自然语言中的上下文联系。通过建立统计模型，...

大小：618.02KB | 2023-06-20 22:40:44
上下文菜单与上下文操作模式

在Android应用开发中，上下文菜单(Context Menu)和上下文操作模式(Contextu...

大小：971.02KB | 2024-07-13 21:11:46
ChatGPT上下文理解与关联技巧

本教程涵盖ChatGPT的使用方法和技巧，包括功能介绍、常见问题解答和注意事项。

大小：37.54KB | 2024-05-07 05:22:18
cxDBTreeList的Check关联数据集

大小：0B | 2019-01-13 21:37:38
大型语言模型领域垂直性能评估数据

在评估大型语言模型在特定领域的垂直性能时，我们需要依赖验证基础能力的数据集。自从ChatGPT发布以...

大小：63.75KB | 2023-11-30 19:50:45
有哪些大型语言模型比ChatGPT更先进？

除了ChatGPT之外，还有很多大型的语言模型。下面小编介绍一些主要的大型语言模型。 1. BERT...

大小：10.65KB | 2023-05-20 07:47:26
Spring Context Spring上下文上下文源码

Spring-Context:Spring上下文上下文

大小：2.1MB | 2021-04-23 06:23:28
关于评估基于代码训练的大型语言模型.pdf

本文主要探讨了评估基于代码训练的大型语言模型的相关问题。语言模型在计算机编程领域具有重要的作用，因此...

大小：1.8MB | 2023-07-22 12:28:17
上下文菜单

上下文菜单的使用案例很简单对于初学者而言的，高手请略过

大小：0B | 2019-07-10 06:39:40
聊天GPT和大型语言模型（LLMs）的应用指南

想了解聊天GPT的实际工作原理吗？这门课程将给您提供大型语言模型（LLM）的所有信息，包括提示设计、...

大小：220.22MB | 2023-06-26 07:09:51