Spark 新作《循序渐进 Spark 大数据应用开发》简介

《循序渐进Spark大数据应用开发》由清华大学出版社出版,已于近期上市。该书基于Spark 3.5.1编写,提供24个实战案例+26个上机练习,可谓是目前市面上最新的Spark力作。

本文对《循序渐进Spark大数据应用开发》一书做个大致的介绍。

封面部分

首先是介绍封面部分。

《循序渐进Spark大数据应用开发》封面部分是采用了比较Q的风格设计,充满活力。

可以看到,左上角和右上角体现了本书的特色,案例丰富,同时也提供了源码和教学课件。

底部是出版社“清华大学出版社”字样。

封底部分

介绍封底部分。

封底部分可以看到主要是对本书的简介。

本书主要是面向对Spark大数据应用感兴趣的学生、开发人员及架构师,也适合培作为高校大数据及相关专业的教学用书。

全书篇幅274页,定价为89元,也算良心了。极具性价比。

内容简介

《循序渐进Spark大数据应用开发》结合作者一线开发实践,循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章,第1章和第2章主要介绍Spark的基本概念、安装,并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理,帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL,这是处理结构化数据的基础工具。第6章展示了Spark Web UI,通过界面化的方式了解Spark集群运行状况。第7章和第8章分别介绍了Spark流式数据处理框架Spark Streaming和Structured Streaming。第9章和第10章则分别介绍了业界流行的机器学习和图计算处理框架MLlib和GraphX。书中各章节还提供了丰富的实战案例和上机练习题,以便读者在学习的同时进行实际操作,迅速提升动手能力。
《循序渐进Spark大数据应用开发》技术先进,案例丰富,适合对Spark大数据应用感兴趣的学生、大数据开发人员及架构师使用,也可作为培训机构和高校大数据课程的教学用书。

《循序渐进Spark大数据应用开发》是一本深入浅出的Spark大数据开发实战指南,专为希望掌握Apache Spark 3.x技术栈的开发者量身定制。《循序渐进Spark大数据应用开发》不仅涵盖了Spark的基础概念和安装步骤,更通过丰富的实战案例和上机练习,引导读者逐步深入理解并掌握Spark的核心组件、集群管理、SQL处理、流式数据处理以及机器学习与图计算等高级功能。
作者凭借一线开发经验,精心编排了10个章节的内容,确保读者能够循序渐进地学习Spark的各项关键技术。从最简单的Spark程序编写开始,逐步过渡到复杂的数据处理和分析任务,每一章都充满了实用价值和操作指导。

特别值得一提的是,《循序渐进Spark大数据应用开发》提供了24个精心设计的实战案例和26个上机练习题,这些内容旨在帮助读者将理论知识转化为实践技能,快速提升解决实际问题的能力。无论是对于学生、大数据开发人员还是架构师来说,这都是一本不可多得的宝贵资源。

写作背景

笔者在华为技术有限公司担任架构师期间,主导过MetaERP项目高级调度系统计算引擎的自研。在这期间,笔者也大规模使用了Spark平台作为分布式计算的底座,因此积累了大量Spark的使用经验。同时,笔者在业余时间撰写和分享了大量有关Spark的技术博客,这些技术博客都被汇总到了我的开源电子书《跟老卫学Apache Spark开发》。《跟老卫学Apache Spark开发》是一本Spark应用开发的开源学习教程,主要介绍如何从0开始开发Spark应用。

本书在《跟老卫学Apache Spark开发》基础之上,做了补充和完善,加入了大量当前Spark最新的特性以及案例。希望帮助读者轻松入门Spark。

配套资源

本书提供的素材和源代码可从以下网址下载:

https://github.com/waylau/apache-spark-tutorial

勘误和交流

本书如有勘误,会在以下网址发布:
https://github.com/waylau/apache-spark-tutorial/issues

视频介绍

见B站:https://www.bilibili.com/video/BV1Uhm1YKEdb/

配套书籍、课程

如果你喜欢本开源书,也欢迎支持下该书的正式出版物,实体店及各大网店有售。

  • 京东
  • 当当

参考引用

  • 原文同步至:https://waylau.com/about-spark-tutorial-book/
  • 《跟老卫学Apache Spark开发》:https://github.com/waylau/apache-spark-tutorial

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/11352.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【王木头】最大似然估计、最大后验估计

目录 一、最大似然估计(MLE) 二、最大后验估计(MAP) 三、MLE 和 MAP 的本质区别 四、当先验是均匀分布时,MLE 和 MAP 等价 五、总结 本文理论参考王木头的视频: 贝叶斯解释“L1和L2正则化”&#xff…

算法|牛客网华为机试41-52C++

牛客网华为机试 上篇:算法|牛客网华为机试21-30C 文章目录 HJ41 称砝码HJ42 学英语HJ43 迷宫问题HJ44 SudokuHJ45 名字的漂亮度HJ46 截取字符串HJ48 从单向链表中删除指定值的节点HJ50 四则运算HJ51 输出单向链表中倒数第k个结点HJ52 计算字符串的编辑距离 HJ41 称砝…

【国产桌面操作系统开发】制作桌面快捷方式

前言 目前使用最广的国产桌面操作系统是麒麟kylin操作系统和统信UOS操作系统,在国产系统上开发应用,需要在桌面提供一个快捷方式给用户使用,国产系统是Linux阵营,与window系统是有差异的。 国产系统桌面 国产系统桌面是一个xxx.d…

AndroidStudio-常用布局

一、线性布局LinearLayout 线性布局内部的各视图有两种排列方式: 1.orientation属性值为horizontal时,内部视图在水平方向从左往右排列。 2.orientation属性值为vertical时,内部视图在垂直方向从上往下排列。 如果不指定orientation属性,…

UEditor(百度开源的在线编辑器,修改版)

dc-UEditor,rich text 富文本编辑器,基于百度UEditor 1.4.3.3-utf8-php版修改。 修复了Uploader.class.php的安全隐患。 新增了以下功能: 1、上传图片是否加水印。 2、新增了单独调用上传的接口。 3、表情本地化,预防百度UEd…

Docker安装部署RabbitMQ

1. Docker环境准备 1.1 安装Docker 在开始Docker安装部署RabbitMQ之前,确保您的系统环境已经满足Docker的运行要求。以下是在不同操作系统上安装Docker的步骤和命令行演示。 对于Linux系统 在基于Debian的系统(如Ubuntu)上,您…

通义千问API调用测试 (colab-python,vue)

文章目录 代码(来自官网)colab中用python测试Qwen2.5在官网上查看并确定过期时间这里看到我的免费额度到25年5月在同一个页面,点击API示例 前端调用直接在前端调用的优缺点以vue为例(代码是基于官网node.js的代码转换而来&#xf…

BLDC基础知识复习【一】

焊接DDR的时候用镊子轻轻抖动一下,能晃动后复位代表焊接成功;用棉签和洗板水清洗板子,不要用纸擦 无刷没有定子和换向器,转子和定子反过来了: KV值越大,电机转速越大。电机转速 KV * 供电电压 外转子电机…

鸿蒙UI开发——自定义UI绘制帧率

1、概 述 随着设备屏幕的不断演进,当前主流设备采用LTPO屏幕(可变刷新率屏幕),此类屏幕支持在多个档位之间切换屏幕帧率。 对于快速变化的内容,如射击游戏,交互动画等,显示帧率越高&#xff0…

递归写斐波那契数

在思考一些C语言编程题的解法时我们经常会碰到的一种算法是递归,递归的字面意思是传递回归,会用例子来解释和运用。 递归 例:在控制台输出指定项数的斐波那契数 斐波那契数列数列是指:1,1,2,3,5,8,13,21,34......从第三项开始等…

手写JDK动态代理实现AOP

AOP底层? AOP(Aspect Oriented Programming,面向切面编程)在 Java 中的实现有多种方式,其中使用 JDK 动态代理和 CGLIB 代理较为常见。 当你的应用程序遵循面向接口编程的原则时,JDK 动态代理是一个自然的…

Gin框架

GoWeb框架 GIN框架 基于httprouter开发的Web框架 安装与使用 安装 下载并安装GIN go get -u github.com/gin-gonic/gin 示例 package mainimport ("github.com/gin-gonic/gin" )func main() {// 创建一个默认的路由引擎r : gin.Default()// GET:请…

nodejs - nodejs安装步骤

安装 NodeJS 1.下载 NodeJS下载官网:https://nodejs.cn/download/ 2.验证 下载后解压安装,运行如下命令验证安装是否成功: node -v npm -v3.查看默认存放位置 查看npm默认存放位置,运行命令如下: npm get prefix…

Spring Boot框架:计算机课程管理的工程认证之光

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了基于工程教育认证的计算机课程管理平台的开发全过程。通过分析基于工程教育认证的计算机课程管理平台管理的不足,创建了一个计算机管理基于工程教育认…

游戏设计:推箱子【easyx图形界面/c语言】

在之前写程序设计的大作业时,在哔哩哔哩上跟着一个视频的学习的成果【第一个练习的】 今天整理文件的时候看到的,就发出来一下【CSDN和B站都有详细教程】 不是大项目,只有两个界面 这个代码只有两百行不到,但通过这个把基本的运…

C++数学

前言 C算法与数据结构 打开打包代码的方法兼述单元测试 数论:质数、最大公约数、菲蜀定理 组合数学汇总 计算几何 博弈论 曼哈顿距离与切比雪夫距离 红线是哈曼顿距离,绿线是切比雪夫距离。 二维曼哈顿距离转切比雪夫距离 曼哈顿距离:|…

如何安装VMWare Workstation 16虚拟机

1、到VMware官网下载安装包。 2、下一步。 3、勾选同意协议,下一步。 4、更换安装路径,下一步。 5、取消全部勾选,下一步。 6、下一步。 7、安装。 8、等待安装完成。 9、安装完成,启动软件。 10、输入许可证ZF3R0…

光流分析技术

光流分析技术是一种重要的计算机视觉和图像处理技术,它通过分析连续帧图像中像素点的运动轨迹和速度,来捕捉图像中物体的运动和相邻帧之间的位移信息。以下是对光流分析技术的详细介绍: 一、光流的基本概念 光流(Optical Flow&am…

Bearer 和 Digest 两个区别

Bearer 和 Digest 是两种常见的身份验证机制,主要用于在网络通信中验证用户的身份,以下是它们之间的区别: 认证原理 Bearer:也称为承载令牌认证,其核心是使用一个令牌(Token)来代表用户的身份信息。用户在进行身份验证后,服务器会颁发一个令牌给客户端,客户端在后续…

H264三种RTP打包方式

1. 单一NALU模式 单一NALU模式 适用于小于MTU(最大传输单元)的NALU。这种模式下,一个RTP包包含一个完整的NALU。RTP头部之后紧跟着NALU头和NALU数据。 封装格式: RTP头 | NALU头 | NALU数据这种方式简单直接,但仅适…