机读格式显示(MARC)

000 01413nam0 2200289 450

001 0000899367

005 20190513141500.0

010 __ |a 978-7-121-34314-8 |d CNY69.00

100 __ |a 20180905d2018 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a Spark SQL内核剖析 |A Spark SQLnei he pou xi |f 朱锋, 张韶全, 黄明著

210 __ |a 北京 |c 电子工业出版社 |d 2018

215 __ |a XII, 276 |c 图 |d 24cm

320 __ |a 有书目 (第273-276页)

330 __ |a 经过多年的发展，大数据处理技术逐步成熟。作为业界大数据计算的事实标准，Apache Spark系统已经广泛应用于各大企业与研究机构，并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案，Spark SQL已经成为了业界的重要选择方案，同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统，对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析，涉及到SQL编译、逻辑计划、物理执行计划、重要查询（如Aggregation与Join等）的技术细节。此外，本书内容上还会结合生产环境的海量应用，分享大量真实开发案例与实践优化经验。

333 __ |a 系统架构师

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP274 |v 5

701 _0 |a 朱锋 |A zhu feng |4 明著

701 _0 |a 张韶全 |A zhang shao quan |4 明著

701 _0 |a 黄明 |A huang ming |4 著

801 _0 |a CN |b 江苏新华 |c 20180619

801 _2 |a CN |b Wuxilib |c 20190513

905 __ |a Wuxilib |d TP274/337