pytorch_DGN:DGN的pytorch实现 源码
pytorch_DGN 这是的pytorch实现。 幸存 在这里,我们提出了一种能够在大规模情况下评估DGN的多代理环境。 有$ 100 $的代理人与环境互动。 每个代理对应一个网格,并具有变化有限的局部观测值,其中包含一个正方形视图,其中$ 3 \乘以3 $网格位于代理。 代理可以使用$ 7 x 7网格与正方形区域中的相邻代理通信。 在每个时间步长,每个代理都可以移动到四个相邻网格之一或在其位置食用食物。 代理以$ 10 $的生命开始,每步失去$ 1 $的健康。 吃食物可以增进健康。 如果代理达到$ 0 $的生命值,它将获得$ -0.2 $的奖励,否则奖励为$ 0.4 $。 引文 如果您使
用户评论