ChatGPT是如何被训练出来的?
ChatGPT是通过四个阶段的学习来训练的,包括学习文字接龙、人类老师引导接龙的方向、模仿人类老师的偏好和用增强式学习向模拟老师学习。通过收集网络上大量的文字句子,让GPT进行学习,帮助GPT提升“接龙”的能力。此外,ChatGPT与InstructGPT两者模型的训练步骤高度相似,ChatGPT将模型GPT-3优化至GPT-3.5。
下载地址
用户评论