机读格式显示(MARC)
- 000 01249nam0 2200253 450
- 010 __ |a 978-7-302-61450-0 |d CNY89.00
- 100 __ |a 20220922d2022 em y0chiy50 ea
- 200 1_ |a Spark 3.x大数据分析实战 |9 Spark 3.x da shu ju fen xi shi zhan |b 专著 |e 视频教学版 |f 张伟洋著
- 210 __ |a 北京 |c 清华大学出版社 |d 2022
- 330 __ |a 本书基于Spark 3.2.x版本,从Spark核心编程语言Scala讲起,涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章,第1章讲解了Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行;第3-9章讲解了离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。
- 701 _0 |a 张伟洋 |9 zhang wei yang |4 著
- 801 _0 |a CN |b 浙江省新华书店集团公司 |c 20220922
- 801 _2 |a CN |b Wuxilib |c 20230627
- 905 __ |a Wuxilib |d TP274/558