机读格式显示(MARC)
- 000 01208nam0 2200277 450
- 010 __ |a 978-7-115-58470-0 |d CNY99.90
- 100 __ |a 20220318d2022 em y0chiy50 ea
- 200 1_ |a EASY RL强化学习教程 |9 EASY RL qiang hua xue xi jiao cheng |b 专著 |f 王琦,杨毅远,江季编著
- 210 __ |a 北京 |c 人民邮电出版社 |d 2022
- 215 __ |a 245页 |c 图,照片 |d 23cm
- 300 __ |a 异步图书 异步社区 Datawhale
- 330 __ |a 本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容,在理论严谨的基础上介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q学习等传统强化学习算法,以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。
- 701 _0 |a 王琦 |9 wang qi |4 编著
- 701 _0 |a 杨毅远 |9 yang yi yuan |4 编著
- 701 _0 |a 江季 |9 jiang ji |4 编著
- 801 _0 |a CN |b 浙江省新华书店集团公司 |c 20220318
- 801 _2 |a CN |b Wuxilib |c 20220801
- 905 __ |a Wuxilib |d TP181/214