电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请 购买正版书籍(jd.com)

图灵程序设计丛书--深度学习入门4:强化学习
chinese

图灵程序设计丛书--深度学习入门4:强化学习

作者:[日] 斋藤康毅
4
5.0
ISBN:9787115649171
出版社:人民邮电出版社
发布时间:2024年
页数:333
★本书前半部分介绍强化学习的重要思想和基础知识,后半部分介绍如何将深度学习应用于强化学习,遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入,依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程,以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后,神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。本书延续“鱼书”系列的风格,搭配丰富的图、表、代码示例,加上轻松、简明的讲解,让人循序渐进地理解强化学习中各种方法之间的关系,于不知不觉中登堂入室。