ergo_mdp:使用MDP形式主义进行遍历经济学模拟 源码
ergo_mdp 使用MDP形式主义进行遍历经济学模拟 这需要一些工作,但仍然无法解决 “......显然是这样,但是假设你扔了足够多的硬币......假设有一天,它落在了它的边缘。” 凯恩的遗产:噬魂者II 间歇式MDP与非间歇式MDP不同,它们具有遍历特性 [ \ \ R \ left((x,win),null \ right)= 0.5x \ R \ left((x,lose),null \ right)= -0.4x \ R \ left((x,choose),stop \ right)= 0 \ \ P((x,win)|(x,choose),play)= 0.5 \ P((x,lose)|(x,choose),play)= 0.5 \ P((x,stopped)|(x,选择),停止)= 1 \ P((x + 0.5x,choose)|(x,win),null)= 1 \
下载地址
用户评论