分类导航 / Navigation
|
![]() Esay RL 强化学习教程_王琦、杨毅远、江季_人民邮电出版社,2022.03
价 格:¥ 25.80
商品详情
注意:链接有问题的书请登录邮箱查收!!!
即时起网站不再提供充点下载服务,点数没有使用完的顾客需要什么书请直接联系客服!! 此书为PDF电子版,不是纸书,付款后自动发货,弹出百度云盘下载地址和密码,自己下载即可!阅读后如感兴趣,可以去书店购买相应的纸质书籍,下载24小时内请删除!本站展示只是部分图书,如需别的电子书请联系客服! 购买时请填写真实邮箱。邮箱请填写正确并请填写常用邮箱! 电子书购买后不予退款。 切记,付款完成后不要关闭网页,等自动返回。如遇链接失效或密码错误,请于24小时内登录购买时留下的邮箱查收文件。 成功付款,但没有弹出下载地址请联系客服处理。不主动联系客服产生的损失请自负。 即日起网站开通VIP会员,VIP会员直接购买打八折,VIP会员购书流程: 1.注册本站会员 2.登录网站,进入会员中心,点击左边导航“在线充值”,选中“购买VIP会员”,再点充值并付款,完成VIP会员购买。 (链接地址为:http://www.fou001.com/e/member/buygroup/) 3.确认选购的电子书,点立即购买,填写收货人信息,填入优惠码:ODAE4VYFG5UJJDXQWDHH 4.下一步,付款,完成购买
书名:Esay RL 强化学习教程
作者:王琦、杨毅远、江季 ISBN:978-7-115-58470-0 出版社:人民邮电出版社 出版日期:2022.03 强化学习作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容,在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q学习等传统强化学习算法,以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。此外,本书还提供较为全面的习题解答以及Python代码实现,可以让读者进行端到端、从理论到轻松实践的全生态学习,充分掌握强化学习算法的原理并能进行实战。本书适合对强化学习感兴趣的读者阅读,也可以作为相关课程的配套教材。 免责申明:
本站仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请联系我们,我们将尽快予以处理。
|



