当前位置：首页 > news >正文

Kafka - 3.x Kafka消费者不完全指北

news 2026/2/9 8:11:49

文章目录

Kafka消费模式
Kakfa消费者工作流程
- 消费者总体工作流程
- 消费者组原理
- 消费者组初始化流程
- 消费者组详细消费流程
独立消费者案例（订阅主题）
消费者重要参数

Kafka消费模式

Kafka的consumer采用pull（拉）模式从broker中读取数据。

模式	优点	缺点
Push（推）模式	- 快速传递消息 - 消息发送速率由broker决定	- 难以适应不同消费者的消费速率 - 可能导致拒绝服务和网络拥塞
Pull（拉）模式	- 可以根据消费者的消费能力以适当速率消费消息	- 潜在的循环问题，如果Kafka没有数据，消费者可能会一直返回空数据 - 需要设置轮询的timeout以避免无限等待时长过长

Kakfa消费者工作流程

消费者总体工作流程

Kafka消费者的总体工作流程包括以下步骤：

配置消费者属性：首先，你需要配置消费者的属性，包括Kafka集群的地址、消费者组、主题名称、序列化/反序列化器、自动偏移提交等。
创建消费者实例：使用配置创建Kafka消费者实例。
订阅主题：使用消费者实例订阅一个或多个Kafka主题。这告诉Kafka消费者你想要从哪些主题中接收消息。
轮询数据：消费者使用poll()方法从Kafka broker中拉取消息。它会定期轮询（拉）Kafka集群以获取新消息。
处理消息：一旦从Kafka broker获取到消息，消费者会对消息进行处理，执行你的业务逻辑。这可能包括数据处理、计算、存储或其他操作。
提交偏移量：消费者可以选择手动或自动提交偏移量，以记录已处理消息的位置。这有助于防止消息重复处理。
处理异常：处理消息期间可能会出现异常，你需要处理这些异常，例如重试或记录错误日志。
关闭消费者：在不再需要消费者实例时，确保关闭它以释放资源。

在这里插入图片描述
这个工作流程涵盖了Kafka消费者从配置到数据处理再到资源管理的主要步骤。消费者通常是多线程或多进程的，以处理大量的消息，并能够根据需要调整消费速率。此外，Kafka的消费者库提供了很多功能，如自动负载均衡、自动偏移管理等，以简化消费者的开发和维护。

消费者组原理

Kafka消费者组（Consumer Group）是一种机制，用于协调和管理多个消费者并共同消费一个或多个Kafka主题的消息。消费者组的工作原理如下：

多个消费者：一个消费者组可以包含多个消费者实例，这些消费者实例协同工作以共同消费一个或多个主题的消息。
订阅主题：所有消费者实例都订阅相同的Kafka主题。这意味着每个消息都会被消费者组中的一个实例处理，从而实现消息的负载均衡。
消息分区：每个Kafka主题通常被分为多个分区，每个分区包含消息的一个子集。每个消费者实例负责消费一个或多个分区的消息。
协调者：消费者组中的消费者实例会选择一个协调者（Coordinator）来管理组内的消费者。协调者通常是ZooKeeper或Kafka自身的一个特殊主题。
偏移管理：协调者负责管理消费者组的偏移量（offset），这是消费者在主题分区中的当前位置。它会跟踪每个分区的消费进度，确保不会重复消费消息。
分配分区：协调者会定期重新分配分区给消费者实例，以确保负载均衡和故障恢复。如果有新消费者加入组或有消费者离开组，协调者会重新分配分区。
消费消息：每个消费者实例负责处理分配给它的分区中的消息。它会拉取消息，进行处理，并将偏移量提交给协调者。
自动重平衡：如果消费者实例加入或退出消费者组，或者分区的分配发生变化，消费者组会自动进行重新平衡，以确保消息均匀分配。
提交偏移量：消费者实例可以定期或根据需要提交已处理消息的偏移量，以便在故障时恢复消费进度。

在这里插入图片描述

通过这种方式，Kafka消费者组能够实现高可用性、负载均衡和容错，允许多个消费者并行处理消息，并根据需求动态调整分区分配。这使得消费者组成为了处理大规模流式数据的理想工具。

消费者组初始化流程

在这里插入图片描述

消费者组详细消费流程

Kafka消费者组的初始化流程包括一系列步骤，用于创建和配置消费者组的成员。以下是Kafka消费者组的初始化流程：

引入Kafka客户端库：首先，确保你的应用程序中引入了Kafka客户端库，以便能够使用Kafka相关的类和功能。
创建消费者配置：初始化消费者组前，需要创建一个消费者配置对象，其中包括了一些重要的属性，例如Kafka集群的地址、消费者组的ID、自动提交偏移量等。
创建消费者实例：使用消费者配置，创建一个或多个消费者实例。每个实例代表一个消费者组中的一个成员。实例会自动注册到Kafka broker，并与协调者建立连接。
订阅主题：通过消费者实例，使用subscribe()方法订阅一个或多个Kafka主题。这告诉Kafka你希望从哪些主题中接收消息。
启动消费者：调用poll()方法开始轮询消息。这将启动消费者实例并开始拉取消息。消费者组中的每个成员都会独立执行这个步骤。
消费消息：一旦消息被拉取，消费者实例会处理这些消息，执行你的业务逻辑。每个成员在自己的线程中处理消息。
提交偏移量：消费者实例可以选择手动或自动提交已处理消息的偏移量。这有助于记录每个分区中消息的处理进度。
处理异常：处理消息期间可能会出现异常，你需要适当地处理这些异常，例如重试消息或记录错误日志。
关闭消费者：当不再需要消费者实例时，确保关闭它以释放资源。
自动重平衡：如果有消费者实例加入或离开消费者组，或者分区的分配发生变化，Kafka会自动进行重新平衡，以确保消息均匀分配。

在这里插入图片描述

这个初始化流程涵盖了Kafka消费者组的基本步骤，从配置消费者组成员到消息的处理和消费。请注意，Kafka消费者组的初始化需要注意各个配置选项以及消费者组的协调过程，以确保正常运行和负载均衡。

独立消费者案例（订阅主题）

需求：创建一个独立消费者，消费artisan主题中的数据

注意：在消费者API代码中必须配置消费者组id。

package com.artisan.pc;import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;import java.time.Duration;
import java.util.ArrayList;
import java.util.Properties;/*** @author 小工匠* @version 1.0* @mark: show me the code , change the world*/
public class CustomConsumer {public static void main(String[] args) {// 1.创建消费者的配置对象Properties properties = new Properties();// 2.给消费者配置对象添加参数properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.126.171:9092");// 配置序列化 必须properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());// 配置消费者组 必须properties.put(ConsumerConfig.GROUP_ID_CONFIG, "artisan-group");// 3. 创建消费者对象KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(properties);// 4. 订阅主题ArrayList<String> topics = new ArrayList<>();topics.add("artisan");consumer.subscribe(topics);// 5. 拉取数据打印while (true) {ConsumerRecords<String, String> consumerRecords = consumer.poll(Duration.ofSeconds(1));// 6. 遍历并输出消费到的数据for (ConsumerRecord<String, String> consumerRecord : consumerRecords) {System.out.println(consumerRecord);}}}
}

① 在IDEA中执行消费者程序
② 服务器上中创建kafka生产者，并输入数据

在这里插入图片描述

③ 在IDEA中观察接收到的数据

ConsumerRecord(topic = artisan, partition = 2, leaderEpoch = 0, offset = 34, CreateTime = 1698630425187, serialized key size = -1, serialized value size = 13, headers = RecordHeaders(headers = [], isReadOnly = false), key = null, value = first message)
ConsumerRecord(topic = artisan, partition = 2, leaderEpoch = 0, offset = 35, CreateTime = 1698630429909, serialized key size = -1, serialized value size = 15, headers = RecordHeaders(headers = [], isReadOnly = false), key = null, value = seconde message)

消费者重要参数

参数名称	描述
bootstrap.servers	向Kafka集群建立初始连接用到的host/port列表。
key.deserializer	指定接收消息的key的反序列化类型。需要写全类名。
value.deserializer	指定接收消息的value的反序列化类型。需要写全类名。
group.id	标记消费者所属的消费者组。
enable.auto.commit	默认值为true，消费者会自动周期性地向服务器提交偏移量。
auto.commit.interval.ms	若enable.auto.commit=true，表示消费者提交偏移量的频率，默认为5秒。
auto.offset.reset	当Kafka中没有初始偏移量或当前偏移量在服务器中不存在时的处理方式。可选值包括"earliest"、“latest”、“none”、
offsets.topic.num.partitions	__consumer_offsets的分区数，默认是50个分区。
heartbeat.interval.ms	Kafka消费者和coordinator之间的心跳时间，默认为3秒。必须小于session.timeout.ms，也不应该高于session.timeout.ms的1/3。
session.timeout.ms	Kafka消费者和coordinator之间连接超时时间，默认为45秒。超过该值，消费者被移除，消费者组执行再平衡。
max.poll.interval.ms	消费者处理消息的最大时长，默认为5分钟。超过该值，消费者被移除，消费者组执行再平衡。
fetch.min.bytes	消费者获取服务器端一批消息最小的字节数，默认为1个字节。
fetch.max.wait.ms	默认为500毫秒。如果没有从服务器端获取到一批数据的最小字节数，等待时间到，仍然会返回数据。
fetch.max.bytes	默认为52428800（50兆字节）。消费者获取服务器端一批消息最大的字节数。如果服务器端一批次的数据大于该值，仍然可以拉取回这批数据，这不是一个绝对最大值，一批次的大小受message.max.bytes（broker配置）或max.message.bytes（topic配置）影响。
max.poll.records	一次poll拉取数据返回消息的最大条数，默认为500条。

在这里插入图片描述

Kafka - 3.x Kafka消费者不完全指北

文章目录 Kafka消费模式Kakfa消费者工作流程消费者总体工作流程消费者组原理消费者组初始化流程消费者组详细消费流程独立消费者案例（订阅主题）消费者重要参数 Kafka消费模式 Kafka的consumer采用pull（拉）模式从broker中读取数据…...

编程日记 2023/10/30 23:17:29

Gerrit | 重磅! 2.x 版本升级到 3.x 版本----转

Gerrit | 重磅! 2.x 版本升级到 3.x 版本为什么要做版本升级？ 2.x known bugs 重大问题不一一列举，这里仅仅是举几个例子： 安全或权限问题：普通用户能看到敏感数据，例如看到其他用户的 hashed api 密码&#xff0c…...

编程日记 2023/10/30 23:16:28

使用c++编程语言，用递归的方法求第n个斐波那契数，代码如下

#include<iostream> using namespace std;int fib_1(int n) {if (n < 1){return n;}return fib_1(n - 1) fib_1(n - 2); }int main() {cout << fib_1(6);return 0; }...

编程日记 2023/10/30 23:15:28

git pull 默认使用merge 可以使用 git pull --rebase 命令使用rebase 或者配置 git config pull.rebase true 使 git pull命令执行 git pull --rebase git config pull.rebase false 的作用是设置 Git 在执行 git pull 命令时默认使用 merge 而不是 rebase。 git pull 命…...

编程日记 2023/10/30 23:14:27

Spring面试题：（一）IoC，DI，AOP和BeanFactory，ApplicationContext

IoC，DI，AOP思想 IOC就是控制反转，是指创建对象的控制权的转移。以前创建对象的主动权和时机是由自己把控的，而现在这种权力转移到Spring容器中，并由容器根据配置文件去创建实例和管理各个实例之间的依赖关系。对象与对…...

编程日记 2023/10/30 23:13:26

RabbitMQ如何保证消息不丢失呢？

RabbitMQ 是一个流行的消息队列系统，用于在分布式应用程序之间传递消息。要确保消息不会丢失，可以采取以下一些措施： 持久化消息： RabbitMQ 允许你将消息标记为持久化的。这意味着消息将被写入磁盘，即使 RabbitMQ 服务…...

编程日记 2023/10/30 23:12:24

VR步进式漫游，轻松构建三维模型，带来展示新形式！

引言： 虚拟现实（Virtual Reality，简称VR）已经成为当今科技领域的一项创新力量，它正在逐渐渗透到不同的领域，其中步进式漫游是VR技术的一项重要应用，它能在各个行业的宣传中发挥重要作用。一&a…...

编程日记 2023/10/30 23:11:23

英语——分享篇——常用人物身份

常用人物身份家庭成员类 father 父亲 mother 母亲 grandmother（外）祖母 grandfather（外）祖父 son 儿子 daughter 女儿 uncle 叔叔，舅舅 aunt 婶母，舅母 brother 兄弟 sister 姐妹 nephew 侄子 niece…...

编程日记 2023/10/30 23:10:22

202310-宏基组学物种分析工具-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream

MetaPhlAn 4是一种基于DNA序列的微生物组分析工具，它能够从宏基因组测序数据中识别和分离微生物的组成。以下是安装和使用MetaPhlAn 4的步骤： 安装MetaPhlAn 4： 裸机环境，手动安装 1. 安装依赖项： MetaPhlAn 4需要…...

编程日记 2023/10/30 23:09:21

systrace/perfetto如何看surfaceflinger的vsync信号方法-android framework实战车载手机系统开发

背景： hi，粉丝朋友们： 大家好！近期分享了surfaceflinger相关的一些blog，有同学就对相关的一些内容产生了一些疑问。比如：vsync查看问题，即怎么才可以说是vsync到来了。比如perfetto中surfac…...

编程日记 2023/10/30 23:08:20

一文带你彻底弄懂js事件循环（Event Loop)

JavaScript事件循环是JavaScript运行时环境中处理异步操作的机制。它允许JavaScript在执行同步代码的同时处理异步任务，以避免阻塞线程并提供更好的用户体验。本文将在浏览器异步执行原理基础上带你彻底弄懂js的事件循环机制。浏览器JS异步执行原理 js是单线程…...

编程日记 2023/10/30 23:07:19

数据结构与算法：二叉树之“堆排序”

目录一、树概念及结构二、二叉树树概念及结构特殊的二叉树三、堆的概念及结构四、堆的创建 1、声明结构体 2、初始化 3、销毁 4、添加新元素 5、交换元素 6、向上调整 7、判断堆是否为空 8、移除堆顶元素 9、向下调整 10、获取堆元素个数五、使用堆排序…...

编程日记 2023/10/30 23:06:18

gma 2 教程（三）坐标参考系统：2.基准面/椭球体

安装 gma：pip install gma 地球是一个近似于椭球体的三维物体，而地球上的各种测量和计算都需要一个基准面来进行。基准面是一个虚拟的平面，用于测量和计算地球上的各种物理量。在地球科学中，基准面通常是一个参考椭球体&#xff0…...

编程日记 2023/10/30 23:05:17

【1day】复现广联达-Linkworks 协同办公管理平台信息泄露漏洞

注：该文章来自作者日常学习笔记，请勿利用文章内的相关技术从事非法测试，如因此产生的一切不良后果与作者无关。目录一、漏洞描述二、影响版本三、资产测绘四、漏洞复现...

编程日记 2023/10/30 23:04:16

Spring Cloud之ElasticSearch的学习【详细】

目录 ElasticSearch 正向索引与倒排索引数据库与elasticsearch概念对比安装ES、Kibana与分词器分词器作用自定义字典拓展词库禁用词库索引库操作 Mapping属性创建索引库查询索引库删除索引库修改索引库文档操作新增文档查找文档修改文档全量…...

编程日记 2023/10/30 23:03:15

vscode免密码认证ssh连接virtual box虚拟机

文章目录安装软件virtual box配置vscode配置创建并传递密钥连接虚拟机最后安装软件安装vscode和virtual box，直接官网下载对应软件包，下载之后，点击执行，最后傻瓜式下一步安装即可 virtual box配置创建一个仅主机网络的网卡 …...

编程日记 2023/10/30 23:01:13

【Linux】Centos yum源替换

YUM是基于RPM包管理，能够从指定的服务器自动下载RPM包并且安装，可以自动处理依赖性关系，并且一次安装所有依赖的软件包，无须繁琐地一次次下载、安装。 CentOS 8操作系统版本结束了生命周期（EOL）&#xff0…...

编程日记 2023/10/30 23:00:12

uniapp组件初始化的销毁（监听隐藏事件）

onHide是监听隐藏事件onHide() {console.log("销毁");this.clearTimer(); }, onShow(){console.log("初始化");this.getOrderInfo() },...

编程日记 2023/10/30 22:59:11

leetcode:1207. 独一无二的出现次数(python3解法)

难度：简单给你一个整数数组 arr，请你帮忙统计数组中每个数的出现次数。如果每个数的出现次数都是独一无二的，就返回 true；否则返回 false。示例 1： 输入：arr [1,2,2,1,1,3] 输出：true 解释&…...

编程日记 2023/10/30 22:57:09

2023秋《论文写作》课程总结

2023秋《论文写作》课程总结授课教师为闵帆教授，原文链接《论文写作》文章目录 2023秋《论文写作》课程总结一、关于写作工具二、关于写作中的单词、短语、语法等三、关于论文题目四、关于摘要和关键词五、关于引言部分六、关于方法及实验部分七、关于结论八、关…...

编程日记 2023/10/30 22:56:08

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中，时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志，到供应链系统的物流节点时间戳，时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库，其日期时间类型的…...

编程新知 2025/10/16 13:22:06

C++：std::is_convertible

C++标志库中提供is_convertible，可以测试一种类型是否可以转换为另一只类型： template <class From, class To> struct is_convertible; 使用举例： #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

编程新知 2025/6/11 15:23:57

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来，Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。同样的技术也是 Power BI 数据…...

编程新知 2026/2/1 19:08:45

Linux简单的操作

ls ls 查看当前目录 ll 查看详细内容 ls -a 查看所有的内容 ls --help 查看方法文档 pwd pwd 查看当前路径 cd cd 转路径 cd .. 转上一级路径 cd 名转换路径 …...

编程新知 2026/1/20 14:36:39

跨链模式：多链互操作架构与性能扩展方案

跨链模式：多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石一、跨链架构的核心范式演进 1. 分层协议栈：模块化解耦设计现代跨链系统采用分层协议栈实现灵活扩展（H2Cross架构）： 适配层&#xf…...

编程新知 2026/2/5 14:15:13

【HarmonyOS 5 开发速记】如何获取用户信息（头像/昵称/手机号）

1.获取 authorizationCode： 2.利用 authorizationCode 获取 accessToken：文档中心 3.获取手机：文档中心 4.获取昵称头像：文档中心首先创建 request 若要获取手机号，scope必填 phone，permissions 必填 …...

编程新知 2025/9/17 2:39:21

蓝桥杯3498 01串的熵

问题描述对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798， 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

编程新知 2026/2/6 2:05:50

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2026/2/2 18:33:19

#Uniapp篇：chrome调试unapp适配

chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器：Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

编程新知 2026/1/4 21:36:42

文章目录

Kafka消费模式

Kakfa消费者工作流程

消费者总体工作流程

消费者组原理

消费者组初始化流程

消费者组详细消费流程

独立消费者案例（订阅主题）

消费者重要参数

相关文章：