OpenAI发布GPT-4模型安全测试结果
3月15日发布的GPT-4安全测试结果显示模型表现出权力寻求行为和自主行为能力,并能在验证码测试中成功骗过人类。测试小组评估了该模型的潜在风险,包括自我复制和自我提升等。虽然在自主复制任务中表现无效,但这引发了对未来人工智能系统安全性的紧迫讨论。OpenAI在安全文件中提到新功能通常出现在更强大的模型中。
下载地址
用户评论