课程简介

A05.强化学习基础

本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。

本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。课程主要内容包含有限马尔可夫决策过程,动态规划,无模型预测与控制(SASA,Q-Learning),价值函数逼近(DQN),策略梯度方法(REINFORCE),执行者/评论者方法(AC,TRPO,PPO),连续动作空间的确定性策略(DDPG)。

课程资源

若Github链接打不开,请使用Gitee或蓝奏云入口下载资源

Github:  [课件]  

Gitee:  [课件]  

蓝奏云:密码(1b1z)  [课件]  [课件打包](课程结束后发布)  

任务点 摘要 资料下载
01.强化学习介绍 强化学习介绍 [课件(Github)] [课件(Gitee)] [课件(蓝奏)]
02.马尔可夫决策过程 马尔可夫决策过程 [课件(Github)] [课件(Gitee)] [课件(蓝奏)]
03.动态规划 动态规划 [课件(Github)] [课件(Gitee)] [课件(蓝奏)]
04.无模型预测 无模型预测 [课件(Github)] [课件(Gitee)] [课件(蓝奏)]
05.无模型控制 无模型控制 [课件(Github)] [课件(Gitee)] [课件(蓝奏)]
作业 该课程作业待发布,请稍候…… 这里还什么都没有啦~
书籍推荐 1. Reinforcement Learning by Richard S. Sutton and Andrew G. Barto
2. 深入浅出强化学习远离入门 郭宪,方勇纯 著
3. 动手学强化学习 张伟楠,沈键,俞勇 著
4. 强化学习:原理与Python实现 肖智清 著