课程简介
A05.强化学习基础
本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。
本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。课程主要内容包含有限马尔可夫决策过程,动态规划,无模型预测与控制(SASA,Q-Learning),价值函数逼近(DQN),策略梯度方法(REINFORCE),执行者/评论者方法(AC,TRPO,PPO),连续动作空间的确定性策略(DDPG)。
视频资源
课程资源
若Github链接打不开,请使用Gitee或蓝奏云入口下载资源
Github: [课件]
Gitee: [课件]
蓝奏云:密码(1b1z) [课件] [课件打包](课程结束后发布)
任务点 | 摘要 | 资料下载 |
---|---|---|
01.强化学习介绍 | 强化学习介绍 | [课件(Github)] [课件(Gitee)] [课件(蓝奏)] |
02.马尔可夫决策过程 | 马尔可夫决策过程 | [课件(Github)] [课件(Gitee)] [课件(蓝奏)] |
03.动态规划 | 动态规划 | [课件(Github)] [课件(Gitee)] [课件(蓝奏)] |
04.无模型预测 | 无模型预测 | [课件(Github)] [课件(Gitee)] [课件(蓝奏)] |
05.无模型控制 | 无模型控制 | [课件(Github)] [课件(Gitee)] [课件(蓝奏)] |
作业 | 该课程作业待发布,请稍候…… | 这里还什么都没有啦~ |
书籍推荐 | 1. Reinforcement Learning by Richard S. Sutton and Andrew G. Barto 2. 深入浅出强化学习远离入门 郭宪,方勇纯 著 3. 动手学强化学习 张伟楠,沈键,俞勇 著 4. 强化学习:原理与Python实现 肖智清 著 |