当前位置: 首页 > news >正文

netty报文解析之粘包半包问题

粘包问题

Netty 的粘包问题是指在网络传输过程中,由于 TCP 协议本身的特点,导致发送方发送的若干个小数据包被接收方合并成了一个大数据包。这种情况称为粘包。

TCP 协议是面向流的协议,没有数据边界,发送方发送的数据可能会被分成多个数据包进行发送,接收方则需要将这些数据包重新组装为原始数据。当接收方处理不当时,就可能会发生粘包等问题。

造成粘包问题的原因主要有以下几点:

  1. 传输的数据量过大或者传输速度过快。
  2. 数据包长度不固定,或者协议自定义导致变长。
  3. 接收方的读取缓存区大小设置不当。

解决粘包问题的方法有很多种,其中比较常用的方式包括以下几点:

  1. 定长解码器:针对长度固定的数据包,采用定长的编码和解码方式,可以有效避免粘包问题。
  2. 分隔符解码器:使用特定字符或字符串作为数据包的分隔符,在接收方收到分隔符时进行消息的解码。
  3. 消息头加长度字段:在数据包中添加一部分用来表示数据包长度的信息,以便于接收方进行消息的解码和切割。
  4. 自定义协议:设计自己的消息传输协议,包括消息格式、头部、长度字段等,来解决粘包问题。
半包问题

半包问题是指在网络传输过程中,接收方无法完整地接收到一个数据包,而只接收到了部分数据包的情况。这种情况称为半包。

造成半包问题的主要原因是数据包的长度超过了接收方的缓存区大小,导致接收方无法一次性接收完整的数据包。协议设计不合理、网络延迟等也可能引起半包问题。

解决半包问题方法和解决粘包问题基本一致。

下面看下具体的例子

定长报文

定长报文就是收发双方约定一次通信的报文长度是固定长度的,服务端按照规定长度接收,客户端按照固定长度返送。这里主要用到FixedLengthFrameDecoder解码器,其构造函数有一个入参来指定报文的长度。

server:

pipeline.addLast(new FixedLengthFrameDecoder(1024))

发送数据

// 消息解析
ByteBuf buf = (ByteBuf) msg;
byte[] bytes = new byte[buf.readableBytes()];
buf.readBytes(bytes);
String receivedMessage = new String(bytes, "UTF-8");
System.out.println("接收到消息:" + receivedMessage);
// 发送响应
String responseMessage = "Response";
byte[] responseBytes = responseMessage.getBytes("UTF-8");
ByteBuf responseBuf = ctx.alloc().buffer(responseBytes.length);
responseBuf.writeBytes(responseBytes);
ctx.writeAndFlush(responseBuf);// 释放资源
buf.release();

client:

客户端只要每次发送按约定长度组装报文即可

固定长度头

固定长度头就是报文整体有两部分组成:报文头+报文体。齐总报文头是固定位置长度,里面会表明报文体长度,消息接收方先定长读取报文头,然后根据报文头指定的报文体长度来定量读取报文体。

这里用到了LengthFieldBasedFrameDecoder解码器。

该解析其有几个重要参数:

maxFrameLength:最大消息长度,报文最大长度

lengthFieldOffset:长度字段的偏移量,如有些报文可能报文头上还有一些其它的标识位,可以将这些标识位跳过

lengthFieldLength:长度字段的长度

lengthAdjustment:长度调整值,这个值也有一定的用处。有些情况长度标识的是包含header头的长度,这个时候可以将该值配置成负数,最后继续往后解析的长度是:lengthFieldLength+lengthAdjustment

initialBytesToStrip:从开始位置截取掉的字节长度,可以把header去掉再往后传给下一个handler,不过一般会保留报文头,业务代理再去解析。LengthFieldBasedFrameDecoder只负责报文接收完整。

整个处理流程:

当接收到来自网络的字节流时,LengthFieldBasedFrameDecoder 首先根据指定的 lengthFieldOffset 和 lengthFieldLength 定位长度字段的位置,并读取长度字段的值。

接下来,根据读取到的长度字段值计算出消息的长度。如果消息的长度超过了指定的 maxFrameLength,则会触发异常处理机制。

如果消息的长度合法,则 LengthFieldBasedFrameDecoder 会读取接下来的指定长度的字节,构成一个完整的消息。

最后,根据配置的 initialBytesToStrip 参数,可以选择是否去除消息长度头。

解码器完成后,将解析出的完整消息传递给下一个处理器进行进一步的处理。

用例:

如我们定义以下一种报文:

长度头(4字节,只是报文体长度)+标识位(1字节)+报文体长度。

则创建LengthFieldBasedFrameDecoder要指定。

lengthFieldOffset=0,lengthFieldLength=4,lengthAdjustment=1,initialBytesToStrip=0(保留报文头)

具体代码:

server端pipeline添加LengthFieldBasedFrameDecoder解码器和FixedLengthServerHandler

pipeline.addLast(new LengthFieldBasedFrameDecoder(1024,0,4,1,0));
pipeline.addLast(new FixedLengthServerHandler());

FixedLengthServerHandler处理方法如下:

public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {ByteBuf buf = (ByteBuf) msg;//消息解析int length = buf.readInt();byte[] bytes = new byte[length];char flag = (char) buf.readByte();buf.readBytes(bytes);String receivedMessage = new String(bytes, "UTF-8");System.out.println("接收到消息:" + receivedMessage+",消息标识:"+flag);// 发送响应String responseMessage = "SUCC";byte[] responseBytes = responseMessage.getBytes("UTF-8");int responseLength = responseBytes.length;ByteBuf responseBuf = ctx.alloc().buffer(4 +1+ responseLength);responseBuf.writeInt(responseLength);responseBuf.writeBytes("Y".getBytes());responseBuf.writeBytes(responseBytes);ctx.writeAndFlush(responseBuf);buf.release();
}

client端:

同样的pipeline添加两个handler

pipeline.addLast(new LengthFieldBasedFrameDecoder(1024,0,4,1,0));
pipeline.addLast(new FixedLengthClientHandler());

构造消息发送:

ByteBuf buffer = Unpooled.buffer();
byte[] bytes = "hello".getBytes();
buffer.writeInt(bytes.length);
buffer.writeBytes("X".getBytes());
buffer.writeBytes(bytes);
channel.writeAndFlush(buffer);

FixedLengthClientHandler处理响应报文:

public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {ByteBuf buf = (ByteBuf) msg;// 消息处理int length = buf.readInt();char flag = (char) buf.readByte();byte[] bytes = new byte[length];buf.readBytes(bytes);String receivedMessage = new String(bytes, "UTF-8");System.out.println("接收到消息:" + receivedMessage+",flag="+flag);buf.release();
}

另外这里处理的都是字节流数据,使用原先阻塞BIO socket也是可以的,不局限于ByteBuf。

如socket发送接收上面定长报文头数据:

Socket socket = new Socket("localhost", 8080);
OutputStream outputStream = socket.getOutputStream();
InputStream inputStream = socket.getInputStream();// 发送消息
String message = "Hello";
byte[] data = message.getBytes();ByteBuffer buffer = ByteBuffer.allocate(4);
buffer.putInt(data.length);outputStream.write(buffer.array());
outputStream.write("X".getBytes());
outputStream.write(data);
outputStream.flush();
//接收响应
byte[] lenB = new byte[4];
inputStream.read(lenB);
char flag = (char) inputStream.read();
ByteBuffer buff = ByteBuffer.wrap(lenB);
int len = buff.getInt();byte[] resp = new byte[len];
inputStream.read(resp);
System.out.println("响应:"+new String(resp) +",flag="+flag);outputStream.close();
inputStream.close();
socket.close();
分隔符报文

分隔符报文就是将报文按固定字符进行分割,这里使用DelimiterBasedFrameDecoder 解析器。

入参可指定分隔符及最大报文长度。

与之相似的还有LineBasedFrameDecoder按行读取,就是以 '\n’换行符当作分隔符。

自定义报文

基本上LengthFieldBasedFrameDecoder解码器已经满足解决报文粘包问题,如果还有其它比较复杂的报文,可以自定义协议报文格式进行处理,一个基本原则还是要有一个报文长度标识,然后按具体长度进行读取。

相关文章:

netty报文解析之粘包半包问题

粘包问题 Netty 的粘包问题是指在网络传输过程中,由于 TCP 协议本身的特点,导致发送方发送的若干个小数据包被接收方合并成了一个大数据包。这种情况称为粘包。 TCP 协议是面向流的协议,没有数据边界,发送方发送的数据可能会被分…...

EasyCode整合mybatis-plus的配置

文章目录 entitymapper.javamapper.xmlserviceserviceImplcontroller 这篇文章不教你如何安装和使用EasyCode,只是贴出可以使用的配置。 具体EasyCode的使用可以查看其它的文章。 entity ##导入宏定义 $!{define.vm}##保存文件(宏定义) #sa…...

实施预测性维护解决方案的挑战及PreMaint的应对方法

前面我们介绍了企业选择预测性维护解决方案的常见问题和PreMaint的策略,本期我们将带来实施过程中可能会遇到的挑战,以及如何通过PreMaint来应对这些挑战,以实现可靠的预测性维护。 随着工业技术的不断进步,预测性维护作为一种先进…...

1. js中let、var、const定义变量区别与方式

1 声明语法 var upperA A; let upperB B; const upperC C; 只声明不初始化的结果,【 const定义的常量不可以修改,而且必须初始化】 // var 声明变量 var upperA; console.log(打印大写的A:%s, upperA); // 结果:打印大写的A&am…...

【STM32学习】I2C通信协议 | OLED屏

🐱作者:一只大喵咪1201 🐱专栏:《STM32学习》 🔥格言:你只管努力,剩下的交给时间! 今天需要将代码烧录到开发板中,本喵默认大家都会创建工程,以及进行基本的…...

Nvme Spec 第一章节学习

Nvme Express Base Specification 第一章 简介 1.1概述 NVM ExpressTM(NVMeTM)接口允许主机软件与非易失性存储器子系统通信。 此接口针对企业和客户端固态驱动器进行了优化,通常作为寄存器级接口连接到PCI Express接口。 注:在…...

第一章:最新版零基础学习 PYTHON 教程(第九节 - Python 语句中的 – 多行语句)

Python 中的语句: 在Python中,语句是Python解释器可以读取和执行的逻辑命令。它可能是Python 中的赋值语句或表达式。 Python 中的多行语句: 在Python中,语句通常写成一行,每行的最后一个字符是换行符。要将语句扩展到一行或多行,我们可以使用大括号 {}、圆括号 ()、方…...

kafka 3.0 离线安装

1.安装zookeeper 解压apache-zookeeper-3.8.0-bin.tar.gz到指定目录,复制conf目录下zoo_sample.cfg到zoo.cfg,并修改配置。 # The number of milliseconds of each tick tickTime=2000 # The number of ticks that the initial # synchronization phase can take initLimit…...

MySQL数据库入门到精通2--基础篇(函数,约束,多表查询,事务)

3. 函数 函数 是指一段可以直接被另一段程序调用的程序或代码。MySQL中的函数主要分为以下四类: 字符串函数、数值函数、日期函数、流程函数。 3.1 字符串函数 MySQL中内置了很多字符串函数,常用的几个如下: 演示如下: A. con…...

c-数据在内存中的存储-day7

...

3D大模型如何轻量化?试试HOOPS Communicator,轻松读取10G超大模型!

随着计算机技术的不断发展,3D模型在各行各业中的应用越来越广泛。然而,随着模型的复杂性和规模不断增加,处理和浏览超大型3D模型变得越来越具有挑战性。本文将探讨如何轻量化3D大模型,以及如何使用HOOPS Communicator来读取和浏览…...

go并发操作且限制数量

使用管道chan func returnNum() int64 {return time.Now().Unix() } func main() {threadAmount : runtime.GOMAXPROCS(0)if threadAmount < 2 {threadAmount 2}fmt.Println(threadAmount)threadChan : make(chan int, threadAmount)defer close(threadChan)for {for i :…...

AI深度学习-卷积神经网络000

文章目录 前言1.什么是深度学习2.语义分割与实例分割概述3.什么是卷积&#xff1f;4.Unet网络 前言 本栏目&#xff0c;主要为深度学习保姆教程。 主要通过B站视频整理而来&#xff1a; 深度学习保姆级教学 Unet语义分割视觉三维重建算法 1.什么是深度学习 深度学习保姆级教…...

网站有反爬机制就爬不了数据?那是你不会【反】反爬

目录 前言 一、什么是代理IP 二、使用代理IP反反爬 1.获取代理IP 2.设置代理IP 3.验证代理IP 4.设置代理池 5.定时更新代理IP 三、反反爬案例 1.分析目标网站 2.爬取目标网站 四、总结 前言 爬虫技术的不断发展&#xff0c;使得许多网站都采取了反爬机制&#xff…...

2023华为杯研究生数学建模C题分析

完整的分析查看文末名片获取&#xff01; 问题一 在每个评审阶段&#xff0c;作品通常都是随机分发的&#xff0c;每份作品需要多位评委独立评审。为了增加不同评审专家所给成绩之间的可比性&#xff0c;不同专家评审的作品集合之间应有一些交集。但有的交集大了&#xff0c;则…...

第三天:实现网络编程基于tcp/udp协议在Ubuntu与gec6818开发板之间双向通信

互联网地址 每一台设备接入互联网后&#xff0c;都会举报一个唯一的地址编号 IP地址 INTERNET地址 internet地址 &#xff1a;它是协议上的一个逻辑地址 目前来说&#xff0c;我们主要的IP地址有两类 IPV4 IPV6 IPV4 其实就是使用一个32bit整数作为IP IPV6 其实就是使用一…...

【MediaSoup---源码篇】(三)Transport

概述 RTC::Transport是mediasoup中的一个重要概念&#xff0c;它用于在mediasoup与客户端之间传输实时音视频数据。 Transport继承着众多的类&#xff0c;主要用于Transport的整体感知 class Transport : public RTC::Producer::Listener,public RTC::Consumer::Listener,publ…...

爱分析《商业智能最佳实践案例》

近日&#xff0c;国内知名数字化市场研究咨询机构爱分析发布《2023爱分析商业智能最佳实践案例》&#xff0c;此评选活动面向落地商业智能的各行企业和商业智能厂商&#xff0c;以第三方专业视角深入调研&#xff0c;评选出具有参考价值的创新案例。永达汽车集团与数聚股份合作…...

golang:context

context作用 goroutine的退出机制 多个goroutine都是平行的被调度的&#xff0c;多个goroutine如何协调工作涉及通信、同步、通知和退出 通信&#xff1a;goroutine之间的通信同步chan通道 同步&#xff1a;不带缓冲的chan提供了一个天然的同步等待机制。通过WaitGroup也可以…...

探讨代理IP与Socks5代理在跨界电商中的网络安全应用

在数字化时代&#xff0c;跨界电商已经成为了商业世界中的一大趋势。然而&#xff0c;跨越国界的电商活动也伴随着网络安全挑战。本文将讨论如何利用代理IP和Socks5代理技术来提高跨界电商中的网络安全&#xff0c;同时也探讨了与游戏相关的爬虫应用。 1. 代理IP和Socks5代理的…...

XCTF-web-easyupload

试了试php&#xff0c;php7&#xff0c;pht&#xff0c;phtml等&#xff0c;都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接&#xff0c;得到flag...

【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15

缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下&#xff1a; struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...

ssc377d修改flash分区大小

1、flash的分区默认分配16M、 / # df -h Filesystem Size Used Available Use% Mounted on /dev/root 1.9M 1.9M 0 100% / /dev/mtdblock4 3.0M...

LeetCode - 394. 字符串解码

题目 394. 字符串解码 - 力扣&#xff08;LeetCode&#xff09; 思路 使用两个栈&#xff1a;一个存储重复次数&#xff0c;一个存储字符串 遍历输入字符串&#xff1a; 数字处理&#xff1a;遇到数字时&#xff0c;累积计算重复次数左括号处理&#xff1a;保存当前状态&a…...

Nuxt.js 中的路由配置详解

Nuxt.js 通过其内置的路由系统简化了应用的路由配置&#xff0c;使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。 自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现&#xff08;两者等价&#xff09;&#xff0c;用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例&#xff1a; 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)

引言 在人工智能飞速发展的今天&#xff0c;大语言模型&#xff08;Large Language Models, LLMs&#xff09;已成为技术领域的焦点。从智能写作到代码生成&#xff0c;LLM 的应用场景不断扩展&#xff0c;深刻改变了我们的工作和生活方式。然而&#xff0c;理解这些模型的内部…...

CVPR2025重磅突破:AnomalyAny框架实现单样本生成逼真异常数据,破解视觉检测瓶颈!

本文介绍了一种名为AnomalyAny的创新框架&#xff0c;该方法利用Stable Diffusion的强大生成能力&#xff0c;仅需单个正常样本和文本描述&#xff0c;即可生成逼真且多样化的异常样本&#xff0c;有效解决了视觉异常检测中异常样本稀缺的难题&#xff0c;为工业质检、医疗影像…...

【Elasticsearch】Elasticsearch 在大数据生态圈的地位 实践经验

Elasticsearch 在大数据生态圈的地位 & 实践经验 1.Elasticsearch 的优势1.1 Elasticsearch 解决的核心问题1.1.1 传统方案的短板1.1.2 Elasticsearch 的解决方案 1.2 与大数据组件的对比优势1.3 关键优势技术支撑1.4 Elasticsearch 的竞品1.4.1 全文搜索领域1.4.2 日志分析…...

恶补电源:1.电桥

一、元器件的选择 搜索并选择电桥&#xff0c;再multisim中选择FWB&#xff0c;就有各种型号的电桥: 电桥是用来干嘛的呢&#xff1f; 它是一个由四个二极管搭成的“桥梁”形状的电路&#xff0c;用来把交流电&#xff08;AC&#xff09;变成直流电&#xff08;DC&#xff09;。…...