1. 首页
  2. 信息化
  3. 管理软件
  4. chatGPT学习笔记-人类反馈系统的提升方式

chatGPT学习笔记-人类反馈系统的提升方式

上传者: 2023-07-28 15:28:54上传 RAR文件 440.84KB 热度 12次

chatGPT学习笔记中提到,chatGPT之所以获得了提升是因为引入了人类的反馈系统。该系统包括了三个步骤:首先是人类进行方案模型微调,然后通过模型生成答案进行训练,最后利用奖励模型对答案进行评分并优化。这种迭代的方式让chatGPT能够不断改进和提升。然而,需要注意的是,chatGPT目前只是一个离线模型,所以获取的知识仅限于2021年之前的内容。另外,由于它只返回文本信息,对于行业数据的积累相对较少。此外,chatGPT的训练成本非常高昂,估计超过1200万美元,而且运行成本也很高。相比之下,拓尔思作为一个数据市场,在数据量大的情况下能够有更好的表现。同时,拓尔思还有自主研发的技术和丰富的客户沉淀,已经被超过1万家企业级用户广泛使用。

用户评论