AlphaZero_Gomoku_MPI:带有Gomoku的AlphaGo零算法的异步并行方法 源码
AlphaZero-Gomoku-MPI 更新中 2019.03.05-上传15x15电路板 请自己下载并尝试。 如果您对AlphaZero和MCTS有任何疑问或想法,请随时发给我,也许我们可以做一些改进。 总览 此回购基于 ,由衷的感谢。 我做这些事情: 像AlphaGo Zero的方法一样,并行实现异步自学训练管道 对抗时写一个根并行MCTS(使用合奏方式投票) 使用ResNet结构来训练模型,并设置转移学习API以根据小板的模型来训练较大的板模型(例如,为了节省时间的预训练方法) 强度 当前型号位于11x11板上,测试时可播放400次 玩,无论黑与白,总是可以赢 使用进行一些粗略
用户评论