1. 首页
  2. 存储
  3. 其他
  4. GPT-4语言模型表现超人类,MACHIAVELLI基准提供了全面评估

GPT-4语言模型表现超人类,MACHIAVELLI基准提供了全面评估

上传者: 2023-06-08 03:29:06上传 ZIP文件 160.45KB 热度 11次

最新研究显示,GPT-4语言模型已经超过人类在特定任务中的表现,但其能力和道德行为评估仍然需要进一步的改进和评估。为此,研究者提出了一种新的基准评估——MACHIAVELLI,可以在大量场景以及多轮语言交互中测试语言模型能力和危害性。该基准将有助于指导语言模型的发展,并引导它们产生更加道德的行为。

用户评论