机读格式显示(MARC)

000 01354nam0 2200253 450

001 0000989793

005 20201126154900.0

010 __ |a 978-7-302-55695-4 |d CNY79.00

100 __ |a 20200402d2020 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a Spark大数据分析实战 |A Sparkda shu ju fen xi shi zhan |f 张伟洋著

210 __ |a 北京 |c 清华大学出版社 |d 2020.8

215 __ |a 365页 |c 图 |d 26cm

330 __ |a 本书基于Spark 2.4.x新版本编写，从Spark核心编程语言Scala讲起，涵盖当前整个Spark生态系统主流的大数据开发技术。全书共9章，章讲解Scala语言的基础知识，包括IDEA工具的使用等；第2章讲解Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行；第3~9章讲解离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理，同时包括常用Shell命令、API操作、内核源码剖析，并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。本书内容丰富，以实操案例为主，理论为辅，可作为Spark新手的入门书，也可作为大数据开发人员和从业者的学习用等

333 __ |a 数据处理软件研究人员

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP274 |v 5

701 _0 |a 张伟洋 |A zhang wei yang |4 著

801 _0 |a CN |b 江苏新华 |c 20200402

801 _2 |a CN |b Wuxilib |c 20201126

905 __ |a Wuxilib |d TP274/446