muzero ray:使用ray库实现的MuZero for Atari 源码
学习玩雅达利 这是使用光线分布式处理库的MuZero的实现。 它旨在玩Atari游戏Breakout。 不幸的是,尽管训练将继续进行,但是该模型无法学习。 显然存在未发现的错误或错误的超参数。 超参数在run.py muzero/muzero.py中设置,并在run.py覆盖。 设置 make venv 跑 首先,打开run.py并编辑ray配置,以具有所需的GPU,CPU和内存数量。 目前,它设置为在具有12个内核和64 GB RAM的3 GPU机器上运行。 然后从此仓库的根目录运行 source venv/bin/activate python run.py --logdir ./results --loglevel error breakout Ray仪表板将在。 如果在服务器上运行代码,请运行ssh -L 8265:localhost:8265 username@server以
用户评论