JobPlus知识库 书籍
[书籍] 深入理解Spark:核心思想与源码分析
作者: 耿嘉安
出版社: 机械工业出版社
简介: 本书对Spark源代码进行了全面而深入的分析,旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐,阿里巴巴资深Java开发和大数据专家撰写。本书对Spark的核心模块、部署和协作模块的实现原理与使用技巧进行了深入的剖析与解读。 本书分为三篇: 准备篇(第1~2章),介绍了Spark的环境搭建、设计理念与基本架构,帮助读者了解一些背景知识。 核心设计篇(第3~7章),着重讲解SparkContext的初始化、存储体系、任务提交与执行、计算引擎及部署模式的原理和源码分析。通过这部分的内容,读者可以通过源码剖析更加深入理解Spark的核心设计与实现,以便在实际使用中能够快速解决线上问题并对性能进行调优。 扩展篇(第8~11章),主要讲解基于Spark核心的各种扩展及应用,包括SQL处理引擎、Hive处理、流式计算框架Spark Streaming、图计算框架GraphX、机器学习库MLlib等内容。通过阅读这部分内容,读者可以扩展实际项目中对Spark的应用场景,让Spark焕发活力。
  
分享到
用户推荐(0)

暂无推荐,你也可以发布推荐哦:)

0 人收藏了这本书籍
腾讯云CDN拥有顶尖加速能力,丰富的功能全面覆盖各业务场景的加速需求,最为用户考虑的加速产品
广告
扫码APP

扫描使用APP

扫码使用

扫描使用小程序