深入大型数据集 并行与分布化Python代码_约翰·沃勒翰、张若飞_电子工业出版社,2021.02
价      格:¥ 25.80
VIP优惠 文件类型 清晰程度 文件大小
8折 pdf或epub或扫描版 pdf或epub或扫描版
点击在线交谈 无需注册会员,可以直接购买!
商品详情
注意:链接有问题的书请登录邮箱查收!!!

即时起网站不再提供充点下载服务,点数没有使用完的顾客需要什么书请直接联系客服!!




此书为PDF电子版,不是纸书,付款后自动发货,弹出百度云盘下载地址和密码,自己下载即可!阅读后如感兴趣,可以去书店购买相应的纸质书籍,下载24小时内请删除!本站展示只是部分图书,如需别的电子书请联系客服!
购买时请填写真实邮箱。邮箱请填写正确并请填写常用邮箱!
电子书购买后不予退款。
切记,付款完成后不要关闭网页,等自动返回。如遇链接失效或密码错误,请于24小时内登录购买时留下的邮箱查收文件。
成功付款,但没有弹出下载地址请联系客服处理。不主动联系客服产生的损失请自负。

即日起网站开通VIP会员,VIP会员直接购买打八折,VIP会员购书流程:
1.注册本站会员
2.登录网站,进入会员中心,点击左边导航“在线充值”,选中“购买VIP会员”,再点充值并付款,完成VIP会员购买。
(链接地址为:http://www.fou001.com/e/member/buygroup/)
3.确认选购的电子书,点立即购买,填写收货人信息,填入优惠码:ODAE4VYFG5UJJDXQWDHH
4.下一步,付款,完成购买

书名:深入大型数据集 并行与分布化Python代码
作者:约翰·沃勒翰、张若飞
ISBN:978-7-121-40368-2
出版社:电子工业出版社
出版日期:2021.02
本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识,包括如何通过boto3的Python库将文件上传到AWSS3服务,以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。本书适合有一定Python编程基础,且希望掌握大型数据集处理能力的开发人员和数据科学家阅读。
免责申明:
本站仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请联系我们,我们将尽快予以处理。