- 深度强化学习理论及其在机器人运动控制中的应用实践
- 姚世选
- 20字
- 2024-01-18 12:10:20
第2章 深度强化学习及非线性最优化基础理论
2.1 引言
本章对强化学习中的马尔可夫决策过程、强化学习目标及强化学习原理进行详细介绍,对比不同强化学习方法之间的差异;分析强化学习现存的局限性,引入深度学习和强化学习相结合的深度强化学习;对目前深度强化学习中的一些基本算法原理进行介绍。本章作为深度强化学习的理论部分,为后续的研究提供了一定的理论基础。
本章对强化学习中的马尔可夫决策过程、强化学习目标及强化学习原理进行详细介绍,对比不同强化学习方法之间的差异;分析强化学习现存的局限性,引入深度学习和强化学习相结合的深度强化学习;对目前深度强化学习中的一些基本算法原理进行介绍。本章作为深度强化学习的理论部分,为后续的研究提供了一定的理论基础。