jax sac:具有连续动作空间的深度强化学习的软演员关键(SAC)的Jax(亚麻)实现 源码
贾克斯(亚麻)柔软演员评论家 这是的Jax(Flax)实现,。 该存储库的目标是提供一个简单而干净的实现,以在此基础上进行研究。 请不要将此存储库用于基线结果,而应使用SAC的原始实现。 安装 安装并激活Anaconda环境 conda env create -f environment.yml conda activate jax-sac 如果要在GPU上运行此代码,请按照说明进行操作。 请按照使用快速的无头GPU渲染构建mujoco-py。 跑 OpenAI Gym MuJoCo任务 python train.py --env_name=HalfCheetah-v2 --save_dir=./tmp/ DeepMind控制套件(--env-name = dmc-domain-task) python train.py --env_name=dmc-cheetah-run -
用户评论