Hands-On Big Data Analytics with PySpark最新章节全文无弹窗在线阅读-QQ阅读男频都市网

ApacheSparkisanopensourceparallel-processingframeworkthathasbeenaroundforquitesometimenow.OneofthemanyusesofApacheSparkisfordataanalyticsapplicationsacrossclusteredcomputers.Inthisbook,youwillnotonlylearnhowtouseSparkandthePythonAPItocreatehigh-performanceanalyticswithbigdata,butalsodiscovertechniquesfortesting,immunizing,andparallelizingSparkjobs.Youwilllearnhowtosourcedatafromallpopulardatahostingplatforms,includingHDFS,Hive,JSON,andS3,anddealwithlargedatasetswithPySparktogainpracticalbigdataexperience.Thisbookwillhelpyouworkonprototypesonlocalmachinesandsubsequentlygoontohandlemessydatainproductionandatscale.ThisbookcoversinstallingandsettingupPySpark,RDDoperations,bigdatacleaningandwrangling,andaggregatingandsummarizingdataintousefulreports.YouwillalsolearnhowtoimplementsomepracticalandproventechniquestoimprovecertainaspectsofprogrammingandadministrationinApacheSpark.Bytheendofthebook,youwillbeabletobuildbigdataanalyticalsolutionsusingthevariousPySparkofferingsandalsooptimizethemeffectively.

品牌：中图公司

上架时间：2019-03-29 00:00:00

出版社：Packt Publishing

本书数字版权由中图公司提供，并由其授权上海阅文信息技术有限公司制作发行

加书架

下载

听书

Hands-On Big Data Analytics with PySpark

最新章节

Power BI商业数据分析完全自学教程

一本书讲透首席数据官：CDO知识体系与能力模型详解

业务数据分析：五招破解业务难题

城市计算

数据挖掘算法实践与案例详解

AI时代的数据价值创造：从数据底座到大模型应用落地

数据产品开发与经营：从数据资源到数据资本

Redis应用实例

云计算与大数据应用