深入浅出强化学习 编程实战_郭宪、宋俊潇、方勇纯_电子工业出版社,2020.03
价      格:¥ 25.80
VIP优惠 文件类型 清晰程度 文件大小
8折 pdf或epub或扫描版 pdf或epub或扫描版
点击在线交谈 无需注册会员,可以直接购买!
商品详情
注意:链接有问题的书请登录邮箱查收!!!

即时起网站不再提供充点下载服务,点数没有使用完的顾客需要什么书请直接联系客服!!




此书为PDF电子版,不是纸书,付款后自动发货,弹出百度云盘下载地址和密码,自己下载即可!阅读后如感兴趣,可以去书店购买相应的纸质书籍,下载24小时内请删除!本站展示只是部分图书,如需别的电子书请联系客服!
购买时请填写真实邮箱。邮箱请填写正确并请填写常用邮箱!
电子书购买后不予退款。
切记,付款完成后不要关闭网页,等自动返回。如遇链接失效或密码错误,请于24小时内登录购买时留下的邮箱查收文件。
成功付款,但没有弹出下载地址请联系客服处理。不主动联系客服产生的损失请自负。

即日起网站开通VIP会员,VIP会员直接购买打八折,VIP会员购书流程:
1.注册本站会员
2.登录网站,进入会员中心,点击左边导航“在线充值”,选中“购买VIP会员”,再点充值并付款,完成VIP会员购买。
(链接地址为:http://www.fou001.com/e/member/buygroup/)
3.确认选购的电子书,点立即购买,填写收货人信息,填入优惠码:ODAE4VYFG5UJJDXQWDHH
4.下一步,付款,完成购买

书名:深入浅出强化学习 编程实战
作者:郭宪、宋俊潇、方勇纯
ISBN:978-7-121-36746-5
出版社:电子工业出版社
出版日期:2020.03
本书是《深入浅出强化学习:原理入门》的姊妹篇,写作的初衷是通过编程实例帮助那些想要学习强化学习算法的读者更深入、更清楚地理解算法。本书首先介绍马尔可夫决策过程的理论框架,然后介绍基于动态规划的策略迭代算法和值迭代算法,在此基础上分3篇介绍了目前强化学习算法中最基本的算法。第1篇讲解基于值函数的强化学习算法,介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法,以及如何将函数逼近的方法引入强化学习算法中。第2篇讲解直接策略搜索方法,介绍了基本的策略梯度方法、AC方法、PPO方法和DDPG算法。第3篇讲解基于模型的强化学习方法,介绍了基于MPC的方法、AlphaZero算法基本原理及在五子棋上的具体实现细节。建议读者根据书中的代码亲自动手编程,并修改程序中的超参数,根据运行结果不断体会算法原理。
免责申明:
本站仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请联系我们,我们将尽快予以处理。