【实时计算 Flink】检查点和快照超时的诊断方法与调优策略

Flink的状态管理是一个复杂而关键的领域,涉及到作业的性能、稳定性和资源利用等多个方面。通过对状态生成机制和优化策略地深入理解与正确应用,结合实时计算Flink版提供的产品能力,可以帮您有效地优化Flink作业以应对大规模状态作业带来的挑战,实现更高效、更可靠的实时数据处理。

Flink状态(State)介绍

Apache Flink是一个开源的流处理框架,用于处理和分析实时数据流。在Flink中,状态管理是流处理应用的核心概念之一,它允许算子在处理事件时保持操作状态信息。状态可以被视为算子的记忆,它使得算子能够在处理无界流数据时保持对历史数据的跟踪。状态可以是简单的键值对,也可以是更复杂的数据结构,如列表、集合或自定义对象。状态的更新和查询对于实现复杂的流处理逻辑至关重要。

状态管理与维护是阿里云实时计算Flink版中的重要功能,通过产品的控制台可以完成系统检查点生命周期的自动管理,并在保证不影响作业可用性的前提下最小化存储空间,同时产品的控制台支持快照的管理和共享,为不同场景下的快照提供了选择,而作业间的快照共享功能对大状态作业的A/B Test和主备链路切换具有极为实用的价值。

大状态作业导致的问题

在处理大规模状态作业的过程中,系统面临着调优的严峻挑战。随着作业状态的持续膨胀,多个问题逐步显现,对作业的整体性能产生不利影响:

  • 性能下降与作业反压

    随着有状态算子状态的累积,IO资源瓶颈问题日益凸显,引发作业反压。这不仅增加了处理延迟,还导致吞吐量(TPS)降低。

  • 资源利用效率低下

    有状态算子的CPU资源常出现大量闲置,且随着状态规模的增长,资源浪费问题更加严重。

  • 检查点与快照机制的时效性问题

    状态规模的扩大使得检查点和快照过程更易超时,这不仅增加了作业重启后追赶数据的时间成本,也对端到端的Exactly-once语义的实现带来了额外延迟。

  • 启动与扩缩容过程缓慢

    在作业启动和扩缩容过程中,每个算子节点需从全量数据中恢复并重建本地数据库,这一过程的时间消耗与状态规模成正比。拥有大状态作业的状态加载往往成为启动和扩缩容执行速度的瓶颈,进而延长业务中断时间。

大状态作业诊断调优整体思路

Flink处理数据时的性能减缓、检查点或快照超时问题以及作业启动和扩缩容过程缓慢问题,通常是由大规模状态的管理和维护不当所引起的,您可以遵循以下步骤来优化大状态作业。

  1. 识别作业瓶颈

    通过诊断工具结合具体业务产出情况,对作业目前的运行情况进行更为深入的了解,进而确定作业的性能瓶颈是否与状态管理有关,诊断工具使用请参见查看作业性能。

  2. 采用更新的引擎版本

    Flink持续优化状态模块,最新版本的引擎通常具有更高的性能。实时计算Flink版的企业级引擎VVR与Apache Flink完全兼容,并内置了专为流计算优化的状态后端存储GeminiStateBackend。GeminiStateBackend针对状态访问进行了设计,有效提升了性能、检查点和作业恢复能力,且参数自适应,无需手动配置。结合实时计算Flink版产品控制台,VVR为您提供了企业级的优化体验,确保性能达到最佳。在进行性能调优前,请确保已采用最新版引擎和相关配置,详情请参见企业级状态后端存储介绍、企业级状态后端存储配置和作业引擎版本升级。

  3. 针对不同问题采取特定调优策略

    • 运行时性能下降(作业反压)

      在这种情况下,调优应遵循以下顺序:首先优化SQL层,其次基于TTL(生存时间)减少状态数据,然后调整内存和并发资源以降低磁盘读取频率,详情请参见SQL作业大状态导致反压的调优原理与方法和DataStream作业大状态导致反压的调优原理与方法。

    • 检查点或快照超时

      在处理此类问题时,应先优化作业的运行时性能以减轻反压,接着优化同步阶段的性能,然后调整并发资源以降低单个并发任务的状态量,最后考虑使用原生快照功能来提高效率,详情请参见检查点和快照超时的诊断方法与调优策略。

    • 作业启动和扩缩容缓慢

      如果本地磁盘资源充足,可以优先考虑启用状态本地恢复(Local Recovery)功能。同时,利用GeminiStateBackend的懒加载特性和延迟剪裁技术,可以有效提升作业的启动和扩缩容速度,详情请参见作业启动和扩缩容速度优化。

本文为您介绍检查点和快照超时的诊断方法和调优策略。

运行原理

Flink的状态管理核心机制依赖于Chandy-Lamport算法,以确保数据的一致性和可靠性。在此框架下,检查点和快照的执行过程可以概括为两个主要阶段:

  1. 同步阶段:此阶段的关键在于Barrier的对齐和同步资源的维护。Barrier作为一种特殊的数据记录,在算子之间传递时,其对齐的时间与数据记录的延迟成正相关关系。

  2. 异步阶段:在此阶段算子会将本地状态数据上传至远程的持久化存储系统,上传时间的长短与状态数据的大小成正比。

说明

当Flink作业面临反压问题时,同步阶段的执行可能会变得缓慢,从而导致检查点和快照超时。因此,在遇到检查点和快照超时问题,并且监测到作业存在反压时,应首先参考SQL作业大状态导致反压的调优原理与方法和DataStream作业大状态导致反压的调优原理与方法优先解决反压问题,以提高作业的整体效率和稳定性。

问题诊断方法

在反压问题解决后,如果检查点与快照仍出现超时现象,则首先应分析同步阶段的对齐时间是否过长,随后考虑是否由庞大的状态数据引起。

Checkpoint UI

运维中心 > 作业运维页面作业日志页签下的Checkpoints > Checkpoints 历史中,观察不同级别(作业、算子、单并发)的Checkpoint指标,分析检查点和快照超时原因。

检查点和快照超时的诊断方法.jpg

您可以着重观察超时的Checkpoint的异常算子或正在进行的Checkpoint的算子,定位思路如下:

  • 其Sync Duration和Alignment Duration是否较长:如是,则可基本判定其瓶颈在同步阶段上,需要优先解决同步阶段问题。

  • 其Async Duration是否较长,以及其Checkpointed Data Size是否较大:如是,则可基本判定其瓶颈在异步阶段状态上传上。

Checkpoint指标

运维中心 > 作业运维页面监控告警页签查看lastCheckpointDuration和lastCheckpointSize指标,来粗粒度分析历史Checkpoint的耗时和大小。

调优策略

在进行性能调优之前,首先要确保运行时性能达到预期。如果当前性能水平不足,应优先根据运行时性能优化指南进行调整。在满足基本性能要求后,为了进一步提高检查点和快照的效率,可以考虑以下策略。

策略

策略说明

使用场景

配置方法

注意事项

使用Unaligned Checkpoint和Buffer Debloating

可以有效解决因等待数据对齐而导致的超时问题,适用于各种规模的作业。

检查点或快照同步超时

运行参数中配置,详情请参见Unaligned checkpoints和Buffer debloating使用方式。

请参见Limitations。

增加运行时的并发资源

通过增加并发资源,可以减少单个并发任务的状态量,从而加速异步快照的处理流程。

检查点或快照异步超时

在资源配置或细粒度资源配置中增加并发,详情请参见配置作业资源。

无。

使用原生快照

相比标准快照,原生快照生成速度更快,存储占用更小。

快照异步超时

对运行中的作业,创建原生格式的作业快照,详情请参见手动创建作业快照。

原生快照无法保证跨大版本兼容。

作业启动和扩缩容速度优化

在进行作业恢复时,从检查点或快照中恢复相较于无状态启动,关键在于高效地从远程持久存储中下载状态文件并重建状态引擎。这一步骤需要执行大量的输入输出操作,容易成为恢复过程中的效率瓶颈,可能会造成作业的长时间停滞。本文为您介绍作业启动和扩缩容过程中瓶颈问题的诊断方法和调优策略,助力您高效提升系统性能。

诊断步骤

在作业启动或进行扩容操作期间,如果发现作业长时间停留在初始化阶段,应首先诊断是否存在初始化瓶颈。以下是推荐的诊断步骤:

  1. 使用诊断工具分析算子状态:利用Thread Dump、线程动态分析和火焰图等工具,检查初始化阶段的算子线程栈。重点关注线程栈是否长时间处于等待状态,尤其是在Gemini等状态存储系统上的操作。诊断工具使用方式请参见分析工具使用方式。

  2. 识别状态算子的初始化问题:如果发现某个算子长时间处于初始化状态,且该算子涉及状态处理,那么可以推断问题可能出在状态的下载或重建过程中。

调优策略

为了提升作业启动和扩容效率,一旦确定大状态处理是作业初始化的瓶颈,您可以参考如下方案进行针对性调整。

策略

策略说明

配置方法

注意事项

动态扩缩容

可以实现更快的让参数配置生效,减少作业启停对业务的中断时间,方便进行TM动态扩缩容。

详情请参见动态扩缩容与参数动态更新。

动态更新为实验性功能,在动态更新参数时,业务并不是完全不中断。相比传统的参数修改模式,动态更新能够显著缩短中断时间,但中断的具体时长受到作业拓扑和状态大小等因素的影响,通常在5秒至1分钟之间。

Local Recovery:本地备份快照加速恢复

在本地同时存储快照,可减少恢复过程中的数据下载需求。当本地磁盘空间充裕时,为首选方案。

在运行参数中配置

state.backend.local-recovery: true

,配置方法请参见如何配置作业运行参数?

  • 实验性功能,VVR 8.0.8及以上版本推荐开启。

  • 适用于作业Failover或者动态参数更新的场景,手动停止重启无法生效。

  • 会多占用部分本地磁盘资源。

GeminiStateBackend智能懒加载和延迟剪裁:异步状态恢复方案

作为平台核心技术GeminiStateBackend,即使面对大规模状态的作业,也能仅通过下载必要的元数据快速启动,实现对数据的即时处理。随后,系统将通过异步下载和智能裁剪技术,有效处理远程检查点文件,显著降低作业中断时间,提升效率超过90%,详情请参见企业级状态后端存储介绍。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1558337.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

卫瓴科技,驶向「协同CRM」深水区

在卫瓴协同CRM的产品之上,能看到的不单纯是产品本身,即“提高转化率”这个单纯的指标,而更多的是在产品之中蕴含的“现代企业营销建设”的科学理念和认知。以此为基础,企业可以构建真正有价值且能长期驱动的品牌营销模型。 作者…

是德(Keysight)N9030A、N9030B PXA信号分析仪

Keysight N9030B PXA 信号分析仪是加速高要求应用创新的性能基准。 PXA 提供从优秀到卓越的测量选项,让您处于领先地位。利用高达 510 MHz 的分析带宽和优于 70 dB 的 SFDR 来分析最新信号,并通过本底噪声扩展 (NFE) 揭示以前隐藏的信号。要了解设备的真…

pdf怎么加密码怎么设置密码?这几种pdf设置密码的方法简单!

pdf怎么加密码怎么设置密码?PDF格式作为现代办公和学习中频繁使用的文档类型,其身影遍布于各类场景,然而,在享受PDF带来的便利之余,不少用户对其安全性产生了疑虑,尽管PDF文件相较于其他格式更难被直接编辑…

养生健康:从日常细节中寻觅长寿之钥

养生健康:从日常细节中寻觅长寿之钥 在这个快节奏的时代,健康似乎成了一种奢侈品,但实则不然。养生之道,不在于繁复的仪式,而在于融入日常的点点滴滴。今天,就让我们一起探讨几个简单却至关重要的养生习惯…

冷流还是热流

https://www.youtube.com/watch?vM8YtV47kaqA&t607s pl学习视频 什么是冷流&#xff1f; fun fibonacci(): Flow<BigInteger> flow {var x BigInteger.ZEROvar y BigInteger.ONEwhile (true) {println("fibonacci while $x")emit(x)x y.also {y x}…

【GESP】C++一级练习BCQM3033,略微复杂的计算,国庆七天乐

应该算第一道对小学生来说&#xff0c;计算逻辑稍微复杂一点的题目。多定义几个变量可能对解题过程更有帮助。 题解详见&#xff1a;https://www.coderli.com/gesp-1-bcqm3033/ 【GESP】C一级练习BCQM3033&#xff0c;略微复杂的计算&#xff0c;国庆七天乐 | OneCoder应该算第…

前端vue-安装pinia,它和vuex的区别

创建一个store的目录&#xff0c;任意一个js文件&#xff0c;再导入pinia&#xff0c;再定义

虚拟化数据恢复—互斥不当导致vmfs卷损坏的数据恢复案例

虚拟化数据恢复环境&#xff1a; 某企业信息管理平台&#xff0c; 几台VMware ESX Server主机共享一台存储设备&#xff0c;大约有几十台虚拟机。 虚拟化故障&原因&#xff1a; Vcenter报告虚拟磁盘丢失。管理员通过ssh远程到ESX中执行fdisk -l命令查看磁盘&#xff0c;发…

Authentication Lab | Client Side Auth

关注这个靶场的其它相关笔记&#xff1a;Authentication Lab —— 靶场笔记合集-CSDN博客 0x01&#xff1a;Client Side Auth 前情提要 有些时候&#xff0c;开发人员会将身份验证的逻辑写于前端&#xff0c;这样写是十分不安全的&#xff0c;因为前端的代码几乎全部都是可见的…

《Windows PE》5.1 导出表

导出表&#xff08;Export Table&#xff09;是一个在可执行文件或动态链接库&#xff08;DLL&#xff09;中的数据结构&#xff0c;用于描述该文件中导出的函数、变量和其他符号。导出表通常位于DLL动态链接库中。 本节必须掌握的知识点&#xff1a; 导入表数据结构 PE中的导…

【数据结构与算法】Divide and Conquer

4.4 Divide and Conquer 1) 概述 分治思想 将大问题划分为两个到多个子问题子问题可以继续拆分成更小的子问题&#xff0c;直到能够简单求解如有必要&#xff0c;将子问题的解进行合并&#xff0c;得到原始问题的解 之前学过的一些经典分而治之的例子 二分查找快速排序归并…

九、Drf序列化器

九、序列化器 9.1序列化 从数据库取QuerySet或数据对象转换成JSON 9.1.1序列化器的简易使用 #新建一张部门表 class Depart(models.Model):titlemodels.CharField(verbose_name部门,max_length32)ordermodels.IntegerField(verbose_name顺序)countmodels.IntegerField(verb…

软件测试学习笔记丨allure学习指南

本文转自测试人社区&#xff0c;原文链接&#xff1a;https://ceshiren.com/t/topic/32336 安装与下载 需要下载本地文件&#xff0c;并且添加到环境变量里 windows&#xff1a;下载&#xff0c;解压&#xff0c;并配置环境变量 mac&#xff1a;brew install allure 环境变量…

Docsify搭建个人博客

前提&#xff1a;电脑安装了Node.js 安装到本地 CMD命令下输入node -v查看是否已经安装了Node.js 安装docsify-cli工具&#xff1a;npm i docsify-cli -g 使用git下载docsify-Plus项目&#xff0c;Gitee地址&#xff1a;https://gitee.com/librarycodes/docsify-plus cd…

Linux的启动流程、移植到开发板

1、linux驱动开发与裸机开发的区别 Linux系统驱动和裸机驱动的主要区别在于运行时的环境和依赖。Linux系统驱动依赖于Linux内核提供的API和服务&#xff0c;而裸机驱动则是在没有操作系统支持的情况下直接与硬件交互。因此&#xff0c;两者的开发和调试方法也有很大差异。 2、…

【H2O2|全栈】关于CSS(11)flex——更加优雅的布局

目录 CSS3入门 前言 准备工作 布局优化 如何使用flex布局 容器与成员 概念 轴线 容器的属性 成员的属性 预告和回顾 后话 CSS3入门 前言 本系列博客主要介绍CSS有关知识点&#xff0c;当前章节讲述CSS3相关内容。 本章节讲述flex布局的相关知识。 部分内容仅代…

PCB缺陷检测数据集 xml 可转yolo格式 ,共10688张图片

PCB缺陷检测数据集&#xff08;yolov5,v7,v8&#xff09; 数据集总共有两个文件夹&#xff0c;一个是pcb整体标注&#xff0c;一个是pcb部分截图。 整体标注有6个分类&#xff0c;开路&#xff0c;短路等都已经标注&#xff0c;标注格式为xml&#xff0c;每个文件夹下有100多张…

【实时计算 Flink】SQL作业大状态导致反压的调优原理与方法

状态管理不仅影响应用的性能&#xff0c;还关系到系统的稳定性和资源的有效利用。如果状态管理不当&#xff0c;可能会导致性能下降、资源耗尽&#xff0c;甚至系统崩溃。本文为您介绍SQL作业大状态导致反压的调优原理与方法。 运行原理&#xff1a;状态算子的产生 作为一种特…

【Python】Twisted:让自定义网络应用开发变得简单

Twisted 是 Python 中一个成熟、功能强大的事件驱动网络编程框架。它支持多种协议&#xff0c;如 HTTP、FTP、SMTP 等&#xff0c;可以用于构建高性能的网络应用&#xff0c;包括网络服务器、客户端、代理服务器等。Twisted 的核心是基于事件驱动模型&#xff0c;能够有效处理大…

基于方块编码的图像压缩matlab仿真,带GUI界面

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 编码单元的表示 4.2编码单元的编码 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 下图是随着方块大小的变化&#xff0c;图像的压缩率以及对应的图像质量指标PSN…