分类导航 / Navigation
|
![]() 深入大型数据集 并行与分布化Python代码_约翰·沃勒翰、张若飞_电子工业出版社,2021.02
价 格:¥ 25.80
商品详情
注意:链接有问题的书请登录邮箱查收!!!
即时起网站不再提供充点下载服务,点数没有使用完的顾客需要什么书请直接联系客服!! 此书为PDF电子版,不是纸书,付款后自动发货,弹出百度云盘下载地址和密码,自己下载即可!阅读后如感兴趣,可以去书店购买相应的纸质书籍,下载24小时内请删除!本站展示只是部分图书,如需别的电子书请联系客服! 购买时请填写真实邮箱。邮箱请填写正确并请填写常用邮箱! 电子书购买后不予退款。 切记,付款完成后不要关闭网页,等自动返回。如遇链接失效或密码错误,请于24小时内登录购买时留下的邮箱查收文件。 成功付款,但没有弹出下载地址请联系客服处理。不主动联系客服产生的损失请自负。 即日起网站开通VIP会员,VIP会员直接购买打八折,VIP会员购书流程: 1.注册本站会员 2.登录网站,进入会员中心,点击左边导航“在线充值”,选中“购买VIP会员”,再点充值并付款,完成VIP会员购买。 (链接地址为:http://www.fou001.com/e/member/buygroup/) 3.确认选购的电子书,点立即购买,填写收货人信息,填入优惠码:ODAE4VYFG5UJJDXQWDHH 4.下一步,付款,完成购买
书名:深入大型数据集 并行与分布化Python代码
作者:约翰·沃勒翰、张若飞 ISBN:978-7-121-40368-2 出版社:电子工业出版社 出版日期:2021.02 本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识,包括如何通过boto3的Python库将文件上传到AWSS3服务,以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。本书适合有一定Python编程基础,且希望掌握大型数据集处理能力的开发人员和数据科学家阅读。 免责申明:
本站仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请联系我们,我们将尽快予以处理。
|



