AlphaSnake Zero:基于AlphaGo Zero的算法的增强型学习AI可以玩同步策略游戏《战栗》源码

Name: AlphaSnake Zero:基于AlphaGo Zero的算法的增强型学习AI可以玩同步策略游戏《战栗》 源码
Rating: 4.5 (49 reviews)
Author: strengthen1834

上传者：strengthen1834 2021-04-18 04:40:11上传 ZIP文件 1.84MB 热度 49次

介绍<iframe src =“ ” width =“ 640” height =“ 480” frameborder =“ 0” allowfullscreen =“ true”> </ iframe>有关算法的详细说明,请检查。抽象的最近,有关强化学习的研究很多。 Q学习或DQN试图解决单人与环境的问题,而AlphaGo等其他方法则尝试双人游戏。在这个项目中,我们尝试找到一种算法来生成在多主体同步策略游戏中表现良好的主体。尽管此项目特定于称为Battlesnake的游戏,但我们使用的方法和算法不限于此。数学适用于具有有限状态和动作空间的任何同步游戏。要求: 的Python 3.7.6 NumPy 1.18.1 TensorFlow 2.1.0 指示: 转到“代码”文件夹并运行train.py以开始训练模型。它将要求您输入内容。如果输入的起始迭代编号大于0,它将尝试开始使用现

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

AlphaSnake Zero基于AlphaGo Zero的算法的增强型学习AI可以玩同步策略游戏战栗源码

介绍<iframe src =“ ” width =“ 640” height =“ ...

大小：1.84MB | 2021-04-18 04:40:11
AlphaGo Zero介绍Presentation

用于AlphaGo-Zero的课堂展示,整理了其特点以及一些基本思想。

大小：670KB | 2020-08-07 17:41:54
AlphaGo Zero nature论文

DeepMind公布了AlphaGo的最新升级版本AlphaGoZero，并于最新一期的《自然》杂志...

大小：0B | 2020-06-10 04:37:30
深度强化学习进展从AlphaGo到AlphaGo Zero

2016年初, AlphaGo战胜李世石成为人工智能的里程碑事件. 其核心技术深度强化学习受到人们的...

大小：2.50MB | 2021-04-18 04:40:11
leela zero无引擎提供的Go引擎以AlphaGo Zero论文为模型源码

什么没有人提供知识的Go程序。使用MCTS(但没有蒙特卡罗播报)和深度残差卷积神经网络堆栈。这...

大小：1.76MB | 2021-02-28 01:35:11
Alphago Zero自我对弈50盘

经典的2018年的Alphago Zero自我对弈50盘，格式为sgf，需要下载MultiGo之类的...

大小：81KB | 2020-07-25 15:42:08
增强型多人游戏源码

增强型多人游戏所有这些就是增强多人游戏体验。去做一切已完成没有

大小：56KB | 2021-02-21 01:50:12
增强型深度确定策略梯度算法

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该...

大小：1.07MB | 2021-01-16 22:28:25
Zero to AI.pdf

A Nontechnical, Hype-Free Guide To Prospering In T...

大小：16.61MB | 2020-08-10 06:18:33
如何理解AlphaGo Zero背后涉及到的技术

详细讲解AlphaGo Zero背后涉及到的知识点，以及论文流程讲解分析。

大小：0B | 2018-12-21 07:04:35
nature AlphaGo zero Mastering the game of Go without human knowledge

natureAlphaGozeroMasteringthegameofGowithouthumank...

大小：0B | 2020-05-13 00:01:52
Mastering the Game of Go without Human Knowledge AlphaGo Zero论文

DeepMind介绍AlphaGoZero的Nature论文。AlphaGoZero第一次让机器可以...

大小：0B | 2020-05-13 00:01:54
ZERO的Tool

收集了一些常用的工具集，但目前不完整，请勿下载

大小：0B | 2019-07-15 10:11:22
zero zero um ITA22的Projeto da Disciplina源码

零零um CES-22航空科学技术研究所(Projeto da disciplina de CES-...

大小：872KB | 2021-04-27 03:48:59
基于增强型演进图的车载网路由算法

演进图能够反映一段时间间隔内网络拓扑的变化情况,被用来研究具有高度动态变化网络拓扑的车载网的路由机制...

大小：342KB | 2020-10-28 02:51:59
增强型区间二型FCM算法

不确定性存在于图像处理、模式识别等众多领域的实际应用中, 模糊?? 均值聚类(FCM) 算法虽广泛应...

大小：378KB | 2021-01-16 10:48:29

AlphaSnake Zero:基于AlphaGo Zero的算法的增强型学习AI可以玩同步策略游戏《战栗》 源码

AlphaSnake Zero:基于AlphaGo Zero的算法的增强型学习AI可以玩同步策略游戏《战栗》源码