1. 首页
  2. 数据库
  3. 其它
  4. 探索 重新实现:重新实现我的控制探索工作 源码

探索 重新实现:重新实现我的控制探索工作 源码

上传者: 2021-04-05 13:03:57上传 ZIP文件 4.54MB 热度 22次
高效采样 arXiv论文中的实验 没有奖励 Gridworld: 我们的方法(因子+快速+乐观): python main.py --eval_every 1 --env gridworld --task default --n_state_bins 20 --env_size 20 --n_action_bins 4 --max_steps 100 --policy uniform --name grid20_puniform 不乐观: python main.py --eval_every 1 --env gridworld --task default --n_state_bins 20 --env_size 20 --n_action_bins 4 --max_steps 100 --policy uniform --no_optimistic_updates --no_opt
下载地址
用户评论