Google DeepMind的David Silver的强化学习课程讲义
,包括Markov Decision Processes、Planning by Dynamic Programming、Model-Free Prediction、Model-Free Control、Function Approximation、Policy Gradient Methods、Integrating Learning and Planning、Exploration and Exploitation以及游戏案例分析
下载地址
用户评论