Spark最佳实践 PDF 高清电子书 免费下载 完整版 在线阅读- 高飞网
现在已经01点44分了,请注意休息
Spark最佳实践

Spark最佳实践

陈欢 林世飞
Spark
浏览人数:212 在读人数:6
本书是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。

第1章 Spark与大数据 1   
1.1 大数据的发展及现状 1   
1.2 Spark应时而生 4   
第2章 Spark基础 8   
2.1 Spark本地单机模式体验 8   
2.2 高可用Spark分布式集群部署 25   
2.3 Spark编程指南 43   
2.4 打包和提交 54   
第3章 Spark工作机制 58   
3.1 调度管理 58   
3.2 内存管理 65   
3.3 容错机制 67   
3.4 监控管理 69   
3.5 Spark程序配置管理 73   
第4章 Spark内核讲解 77   
4.1 Spark核心数据结构RDD 77   
4.2 SparkContext 84   
4.3 DAG调度 87   
第5章 Spark SQL与数据仓库 92   
5.1 Spark SQL基础 93   
5.2 Spark SQL原理和运行机制 104   
5.3 应用场景:基于淘宝数据建立电商数据仓库 110   
第6章 Spark流式计算 122   
6.1 Spark Streaming基础知识 123   
6.2 深入理解Spark Streaming 132   
6.3 应用场景:一个类似百度统计的流式实时系统 139   
第7章 Spark图计算 149   
7.1 什么是图计算 149   
7.2 Spark GraphX简介 151   
7.3 应用场景:基于新浪微博数据的社交网络分析 153   
第8章 Spark MLlib 169   
8.1 机器学习简介 169   
8.2 MLlib库简介 174   
8.3 应用场景:搜索广告点击率预估系统 178   
附录 Scala语言参考 197   
看过本书的人还看过