1. 首页
  2. 人工智能
  3. 深度学习
  4. Nature论文深度学习Alpha语言

Nature论文深度学习Alpha语言

上传者: 2021-02-02 23:24:25上传 PDF文件 3.84MB 热度 20次
AlphaGo中的树搜索使用深层神经网络评估位置和选择的移动。这些神经网络是 通过人类专家动作的监督学习进行训练,并通过强化自我发挥学习。在这里我们介绍 一种仅基于强化学习的算法,没有人类数据,游戏以外的指导或领域知识 规则。 AlphaGo成为自己的老师:神经网络被训练来预测AlphaGo自己的移动选择 AlphaGo游戏的获胜者。这种神经网络提高了树搜索的强度,导致了更高的质量 在下一次迭代中移动选择和更强的自我发挥。
下载地址
用户评论