Kafka面试题（三）

Kafka面试题（三）

news/2024/11/14 20:18:48/文章来源:https://blog.csdn.net/2301_79362607/article/details/143692829

1、kafka是如何做到高效读写

1）Kafka 本身是分布式集群，可以采用分区技术，并行度高。

2）读数据采用稀疏索引，可以快速定位要消费的数据。（mysql中索引多了之后，写入速度就慢了）。

3）顺序写磁盘：

Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。这与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址的时间。

4）页缓存 + 零拷贝技术：

零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高。

PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能。当上层有写操作时，操作系统只是将数据写入 PageCache。当读操作发生时，先从PageCache中查找，如果找不到，再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存都当做了磁盘缓存来使用。

2、Kafka集群中数据的存储是按照什么方式存储的？

按照topic和partition存储的，topic是逻辑上的概念partition是物理上的概念（实际存在的），每个partition对应一个log文件，该文件中存储的就是Producer生产的数据。Producer生产的数据会被不断地追加到log文件的末端，为了防止log文件过大而导致的数据定位效率低下，kafka采用了分片和索引机制将每个partition分为多个segment。每个segment包括.index文件和.log文件，这些文件位于一个文件夹下，该文件夹的命名规则为：topic名称+分区序号，例如：first-0。

3、kafka中是如何快速定位到一个offset的。

如题2中的图kafka使用稀疏索引机制，利用相对索引快速定位到offset。

4、简述kafka中的数据清理策略。

Kafka 中默认的日志（这个地方是数据的意思，就是Segment）保存时间为 7 天，可以通过调整如下参数修改保存时间。

log.retention.hours，最低优先级小时，默认 7 天。

log.retention.minutes，分钟。 --如果设置了该值，小时的设置不起作用。

log.retention.ms，最高优先级毫秒。 --如果设置了该值，分钟的设置不起作用。

log.retention.check.interval.ms，负责设置检查周期，默认 5 分钟。

那么日志一旦超过了设置的时间，怎么处理呢？

Kafka 中提供的日志清理策略有 delete 和 compact 两种。

1）delete 日志删除：将过期数据删除

log.cleanup.policy = delete 所有数据启用删除策略

（1）基于时间：默认打开。以 segment 中所有记录中的最大时间戳作为该文件时间戳。

（2）基于大小：默认关闭。超过设置的所有日志总大小，删除最早的 segment。

log.retention.bytes，默认等于-1，表示无穷大。

思考：如果一个 segment 中有一部分数据过期，一部分没有过期，怎么处理？

2）compact 日志压缩(合并的意思，不是真的压缩)

compact日志压缩：对于相同key的不同value值，只保留最后一个版本。

log.cleanup.policy = compact 所有数据启用压缩策略，这种策略只适合特殊场景，比如消息的key是用户ID，value是用户的资料，通过这种压缩策略，整个消息集里就保存了所有用户最新的资料。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/11949.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

【Pikachu】任意文件上传实战

【Pikachu】任意文件上传实战

将过去和羁绊全部丢弃，不要吝惜那为了梦想流下的泪水。 1.不安全的文件上传漏洞概述不安全的文件上传漏洞概述文件上传功能在web应用系统很常见，比如很多网站注册的时候需要上传头像、上传附件等等。当用户点击上传按钮后，后台会对上传的…

阅读更多...

C++【STL容器系列（二）】vector的模拟实现

C++【STL容器系列（二）】vector的模拟实现

文章目录 1. vector的结构2. vector的默认成员函数2.1构造函数2.1.1 默认构造2.1.2 迭代器构造2.1.3 用n个val初始化构造 2.2 拷贝构造2.3 析构函数2.4 operator 3. vector iterator函数3.1 begin 和 cbegin函数3.2 end() 和 cend()函数 4. vector的小函数4.1 size函数4.2 capa…

阅读更多...

边缘检测的100种方法

边缘检测的100种方法

文章目录什么是边缘检测 ?一、边缘检测算子：Sobel算子、Scharr算子、Laplacian算子、Canny算子二、梯度计算顶帽黑帽拉普拉斯金字塔三、相位一致性（Phase Congruency，PC）3.1、底层代码（2D）3.2、ski…

阅读更多...

【Linux探索学习】第十二弹——初识进程：进程的定义、描述和一些简单的相关操作

【Linux探索学习】第十二弹——初识进程：进程的定义、描述和一些简单的相关操作

Linux学习笔记： https://blog.csdn.net/2301_80220607/category_12805278.html?spm1001.2014.3001.5482 前言： 在前面经过那么多篇的铺垫后，今天我们正式进入Linux学习的第一个重难点——进程，理解进程对于我们学习操作系统的其…

阅读更多...

Java项目实战II基于微信小程序的订餐系统（开发文档+数据库+源码）

Java项目实战II基于微信小程序的订餐系统（开发文档+数据库+源码）

目录一、前言二、技术介绍三、系统实现四、文档参考五、核心代码六、源码获取全栈码农以及毕业设计实战开发，CSDN平台Java领域新星创作者，专注于大学生项目实战开发、讲解和毕业答疑辅导一、前言随着移动互联网技术的飞速发展&#xff0…

阅读更多...

触想染织厂MES产线终端工位机，打造数字化高效车间

触想染织厂MES产线终端工位机，打造数字化高效车间

一、行业发展背景在纺织细分领域中，印染行业一直是整个产业链的效率短板，因其涉及染色、定型及后整理加工等多个复杂工艺、上百个参数变量，质量波动较大，依赖个人经验和手工操作，常常陷入高成本、低效率发展困境。 △…

阅读更多...

CSS查缺补漏 two

CSS查缺补漏 two

11.6~11.11查缺补漏一、熟记1.结构伪类选择器2.伪元素选择器3.盒子模型4.居中对齐（重中之重！！！）5.清除默认样式6.元素溢出（滚动条）7.行内元素 – 内外边距问题8.圆角9 .盒子阴影（拓…

阅读更多...

Taro React-Native IOS 打包发布

Taro React-Native IOS 打包发布

http网络请求不到配置 fix react-native facebook::flipper::SocketCertificateProvider‘ (aka ‘int‘) is not a function or func_rn运行debug提示flipper-CSDN博客 Xcode 15（iOS17）编译适配报错_no template named function in namespace std-CS…

阅读更多...

本地搭建你的私有网盘：在Ubuntu上使用Portainer CE安装NextCloud

本地搭建你的私有网盘：在Ubuntu上使用Portainer CE安装NextCloud

文章目录前言1. 在PortainerCE中创建NextCloud容器2. 公网远程访问本地NextCloud容器2.1 内网穿透工具安装3.2 创建远程连接公网地址 3. 固定NextCloud私有云盘公网地址前言本篇文章介绍如何在本地使用Portainer CE可视化图形界面创建NextCloud私有网盘容器，并结…

阅读更多...

超好用shell脚本NuShell mac安装

超好用shell脚本NuShell mac安装

利用管道控制任意系统 Nu 可以在 Linux、macOS 和 Windows 上运行。一次学习，处处可用。一切皆数据 Nu 管道使用结构化数据，你可以用同样的方式安全地选择，过滤和排序。停止解析字符串，开始解决问题。强大的插件系统具备强…

阅读更多...

游戏引擎中LOD渲染技术

游戏引擎中LOD渲染技术

一.LOD(Level Of Detail) 为了降低GPU渲染压力,根据摄像机距离模型距离将面数较高的模型替换为面数较低的模型. LOD LOD0(distance<10) LOD1(distance<20) LOD2(distance<30) 故通常引擎中MetaMesh是由一个或多个LOD模型构成. MetaMesh mesh mesh.lod1 mesh.lod…

阅读更多...

web前端动画按钮（附源代码）

web前端动画按钮（附源代码）

效果图源代码 HTML部分 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> …

阅读更多...

昇思大模型平台打卡体验活动：项目5基于MindSpore实现Transformer机器翻译

昇思大模型平台打卡体验活动：项目5基于MindSpore实现Transformer机器翻译

首先仍然是先登录大模型体验平台 https://xihe.mindspore.cn/my/clouddev 启动！！ 进入环境之后，即可开始运行notebook， Transformer 模型与实现 Transformer 是一种由 Vaswani 等人在 2017 年提出的神经网络结构（论文…

阅读更多...

‌关于人工智能（AI）的发展现状和未来趋势的详细分析！

‌关于人工智能（AI）的发展现状和未来趋势的详细分析！

成长路上不孤单😊😊😊😊😊😊 【14后😊///C爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】今日将继续分享关于‌人工智能（AI&#x…

阅读更多...

提高排名的有效策略与实践指南

提高排名的有效策略与实践指南

内容概要在现代数字化时代，提高排名不仅是企业营销的关键，更是提升品牌知名度和客户粘性的有效途径。为了更好地理解这一主题，我们从多个方面进行详细分析。首先，明确"排名"的基本概念是非常重要的，它通常…

阅读更多...

【Linux】动静态库

【Linux】动静态库

目录 1、制作静态库 2、站在使用者角度使用库 3、制作动态库 4、动态库是怎么被加载的 1、制作静态库之前对动静态库的认识： libXXX.a-----静态库静态链接：将库当中的代码拷贝到最终的可执行程序里，也就是，自己的源代码会变成…

阅读更多...

AI绘画到底怎么画，才能出好图！一文详解

AI绘画到底怎么画，才能出好图！一文详解

前言在当今数字化的时代，AI 绘画以其强大的创造力和便捷性，成为了众多艺术爱好者和创作者的新宠。无论是专业画家想要拓展创作思路，还是业余爱好者渴望展现自己的创意，AI 绘画都提供了无限的可能。那么，究竟如何才能…

阅读更多...

【React】深入理解 JSX语法

【React】深入理解 JSX语法

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈｜ 炫酷HTML | JavaScript基础 💫个人格言: "如无必要，勿增实体" 文章目录深入理解 JSX语法1. JSX 简介2. JSX 的基本语法2.1 基本结构2.2 与普通 JavaScr…

阅读更多...

Kafka-Eagle 监控搭建

Kafka-Eagle 监控搭建

Kafka-Eagle 框架可以监控 Kafka 集群的整体运行情况，在生产环境中经常使用。在生产过程中，想创建topic、查看所有topic、想查看某个topic 想查看分区等，都需要写命令，能不能有一个图形化的界面，让我们操作呢&#x…

阅读更多...

5位机械工程师如何共享一台工作站的算力？

5位机械工程师如何共享一台工作站的算力？

在现代化的工程领域中，算力已成为推动创新与技术进步的关键因素之一。对于机械工程师而言，强大的计算资源意味着能够更快地进行复杂设计、模拟分析以及优化工作，从而明显提升工作效率与项目质量。然而，资源总是有限的，…

阅读更多...

最新文章