
会员
Spark SQL入门与实践指南
纪涵更新时间:2019-12-06 16:38:46
最新章节:9.9 本章小结开会员,本书免费读 >
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
纪涵
主页
同类热门书
最新上架
同类书籍最近更新
- 会员
大数据时代的数据挖掘
本书以当前热点的数据挖掘应用贯穿全书,通过详解大数据挖掘技术在系统日志、工作票、可持续性研究、推荐系统、智能问答系统、社交媒体、生物信息学与健康医疗、隐私保护等方面的实际应用案例,阐述了如何更好地应用和学习数据挖掘技术。本书融入了数据挖掘前沿技术和典型应用,不仅适合热爱和关心数据挖掘技术的学术界和工业界人士阅读,还适合作为各大高校的数据挖掘和机器学习课堂的实践教材和参考书籍。本书有助于读者更好地理自动化30万字 - 会员
网络信息安全项目教程
本书采用全新的项目实做的编排方式,真正实现了基于工作过程、项目教学的理念。本书由4个项目11个模块组成:项目1实现了配置单机系统安全,包括Windows系统加固和病毒的防治;项目2实现了防护网络安全,从防火墙、网络监听、网络扫描和黑客攻击与入侵检测的角度介绍了网络安全的策略、措施、技术和方法;项目3实现了信息安全,从信息加密、数字签名和数据存储的角度介绍了保证信息安全的方法、技术、手段;项目4实现自动化20.9万字 - 会员
流处理器研究与设计
本书介绍了一种新型的非冯•;诺依曼体系结构——流体系结构。作者在前人的研究基础上,结合自己多年科研工作的体会,介绍了流处理的主要思想、流体系结构及其运行机制、编程模型及编译器设计,以JPEG和H264等典型应用为例详述了应用的流化方法;并叙述了多核流体系结构设计、程序设计与编译、VLSI特性等多个方面的内容;最后就流体系结构的未来发展进行了讨论。本书在介绍流体系结构这一专业领域的知识和技自动化15.2万字 - 会员
具比例时滞递归神经网络的稳定性及其仿真与应用
本书系统地介绍了若干具比例时滞递归神经网络模型和各种稳定性,通过构造Lyapunov泛函、时滞微分不等式、非线性测度、内积性质和线性矩阵不等式等方法讨论了具比例时滞递归神经网络的渐近稳定性、多项式稳定性、周期性、概周期性及反周期性、散逸性等性质,并且给出相应的数值算例及仿真,同时对具比例时滞神经网络在二次规划问题的求解方面的应用进行了初步探讨。本书旨在引领具比例时滞神经网络动力学的深入研究,对具比自动化9万字 - 会员
数字多媒体技术基础
本书根据高职高专多媒体技术基础教学大纲编写,介绍多媒体技术的基本概念、硬件知识、软件知识、美学知识、制作多媒体素材的知识、制作光盘的知识等。本书重点在于应用,旨在提高计算机应用水平,提高学生的综合素质。本书共10章。第1章多媒体技术基础;第2章多媒体个人计算机;第3章图像的浏览及简单处理;第4章图像高级处理;第5章制作动画;第6章制作视频;第7章制作声音;第8章素材组合与演示;第9章制作多媒体光盘自动化13.3万字 - 会员
仿狗机器人的设计与制作
本书主要针对提高汽车的操纵稳定性的四轮转向系统展开研究,并对不确定参数汽车的直接横摆力矩控制做部分研究工作。操纵稳定性包含的内容十分广泛,本书针对提高操纵稳定性的电子控制系统如四轮转向系统和动力学控制系统(稳定性程序)展开分析,并将上述电子控制系统应用到半挂汽车列车上,仿真分析了其优越性。四轮转向(4WS)和直接横摆力矩控制作为最常见的主动安全系统,研究其控制策略和其非线性特性,对指导汽车如何提高自动化11.5万字