机读格式显示(MARC)
- 000 01413nam0 2200289 450
- 010 __ |a 978-7-121-34314-8 |d CNY69.00
- 100 __ |a 20180905d2018 em y0chiy50 ea
- 200 1_ |a Spark SQL内核剖析 |A Spark SQLnei he pou xi |f 朱锋, 张韶全, 黄明著
- 210 __ |a 北京 |c 电子工业出版社 |d 2018
- 215 __ |a XII, 276 |c 图 |d 24cm
- 320 __ |a 有书目 (第273-276页)
- 330 __ |a 经过多年的发展,大数据处理技术逐步成熟。作为业界大数据计算的事实标准,Apache Spark系统已经广泛应用于各大企业与研究机构,并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案,Spark SQL已经成为了业界的重要选择方案,同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统,对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析,涉及到SQL编译、逻辑计划、物理执行计划、重要查询(如Aggregation与Join等)的技术细节。此外,本书内容上还会结合生产环境的海量应用,分享大量真实开发案例与实践优化经验。
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _0 |a 朱锋 |A zhu feng |4 明著
- 701 _0 |a 张韶全 |A zhang shao quan |4 明著
- 701 _0 |a 黄明 |A huang ming |4 著
- 801 _0 |a CN |b 江苏新华 |c 20180619
- 801 _2 |a CN |b Wuxilib |c 20190513
- 905 __ |a Wuxilib |d TP274/337