【Linux C | 网络编程】进程池大文件传输的实现详解(三)
上一篇实现了进程池的小文件传输,使用自定义的协议,数据长度+数据本身,类似小火车的形式,可以很好的解决TCP“粘包”的问题。
【Linux C | 网络编程】进程池小文件传输的实现详解(二)
1.使用循环来传输
对于大文件的传输先要获取大文件的长度的信息,这里可以使用fstat()函数。
![]()

服务端发送大文件的流程:

1.获取大文件的长度信息
2.使用一个小火车先发送大文件的,文件名长度+文件名内容
3.发送大文件的内容,先发文件内容的长度信息,然后使用小火车循环发送文件的内容
#include "process_pool.h"#define FILENAME "bigfile.avi"//sendn函数可以发送确定的字节数
//sockfd:通信套接字,buff:要发送的内容,len:要发送的内容字节数
int sendn(int sockfd, const void * buff, int len)
{int left = len;const char* pbuf = buff;int ret = -1;while(left > 0) {ret = send(sockfd, pbuf, left, 0);if(ret < 0) {perror("send");return -1;}left -= ret;pbuf += ret;}return len - left;
}int transferFile(int peerfd)
{//读取本地文件int fd = open(FILENAME, O_RDONLY);ERROR_CHECK(fd, -1, "open");//获取文件的长度struct stat st;memset(&st, 0, sizeof(st));fstat(fd, &st);char buff[100] = {0};int filelength = st.st_size; //获取文件的大小printf("filelength: %d\n", filelength);//进行发送操作//1. 发送文件名train_t t;memset(&t, 0, sizeof(t));t.len = strlen(FILENAME);strcpy(t.buf, FILENAME);sendn(peerfd, &t, 4 + t.len);//2. 再发送文件内容//2.1 发送文件的长度sendn(peerfd, &filelength, sizeof(filelength));int ret = 0;int total = 0;//2.2 再发送文件内容while(total < filelength) {memset(&t, 0, sizeof(t));ret = read(fd, t.buf, 1000); //每次从文件读取1000个字节的内容,放到一个小火车上if(ret > 0) {t.len = ret; //初始化小火车的车头长度//sendn函数确保 4 + t.len 个字节的数据能正常发送ret = sendn(peerfd, &t, 4 + t.len);if(ret < 0) {printf(">> exit while not send.\n");break;//发生了错误,就退出while循环}total += (ret - 4); //已发送内容,不包括车头}}return 0;
}
服务端接受流程:
1.先接受文件名内容
2.接受文件的内容
#include <func.h>int main()
{//创建客户端的套接字int clientfd = socket(AF_INET, SOCK_STREAM, 0);ERROR_CHECK(clientfd, -1, "socket");struct sockaddr_in serveraddr;memset(&serveraddr, 0, sizeof(serveraddr));//指定使用的是IPv4的地址类型 AF_INETserveraddr.sin_family = AF_INET;serveraddr.sin_port = htons(8080);serveraddr.sin_addr.s_addr = inet_addr("127.0.0.1");//连接服务器int ret = connect(clientfd, (struct sockaddr*)&serveraddr, sizeof(serveraddr));ERROR_CHECK(ret, -1, "connect");printf("connect success.\n");//进行文件的接收//1. 先接收文件的名字//1.1 先接收文件名的长度int length = 0;ret = recv(clientfd, &length, sizeof(length), 0);printf("filename length: %d\n", length);//1.2 再接收文件名本身char buff[1000] = {0};ret = recv(clientfd, buff, length, 0);printf("1 recv ret: %d\n", ret);int fd = open(buff, O_CREAT|O_RDWR, 0644);ERROR_CHECK(fd, -1, "open");//2. 再接收文件的内容//2.1 先接收文件内容的长度ret = recv(clientfd, &length, sizeof(length), 0);printf("fileconent length: %d\n", length);int total = 0;int len = 0;//每一个分片的长度//2.2 再接收文件内容本身while(total < length) {recv(clientfd, &len, sizeof(len), 0);if(len != 1000) {printf("slice len: %d\n", len);//printf("total: %d bytes.\n", total);}memset(buff, 0, sizeof(buff));//recv函数无法保证每一次接收都能获取len个字节的长度//因此出现了读取长度异常的情况ret = recv(clientfd, buff, len, 0);// ret <= len//printf("slice %d bytes.\n", ret);if(ret > 0) {total += ret;write(fd, buff, ret);//写入本地文件}}close(fd);close(clientfd);return 0;
}
使用md5算法计算哈希值验证文件的正确性:
# client
$md5sum file2
# 计算md5码需要等待一段时间
8e9d11a16f03372c82c5134278a0bd7d file2
# server
$md5sum file2
8e9d11a16f03372c82c5134278a0bd7d file2
存在问题:
一般情况下上述方法确实可以传输完整的文件,但是存在一个大bug:recv函数无法保证每一次接收都能获取len个字节的长度,因此出现了读取长度异常的情况。
比如:内容只传输了一半,后续的数据就直接被当成长度了 出现了长度的偏差,导致传输出现问题,下一次循环开始时,本来希望读取的是长度信息,但其实读取的是内容,从而导致长度数据出现问题。
原因是:TCP是一种流式协议,它只能负责每个报文可靠有序地发送和接收,但是并不能保证传输到网络缓冲区当中的就是完整的一个小火车。这样就有可能会到导致数据读取问题,下面就举一个例子:假设发送方需要传输两个小火车,其中每个 车厢都是1000个字节,那么自然火车头都是4个字节,里面各自存储了1000 (当然是二进制形式),当 两个小火车发送到socket的时候,由于TCP是流式协议,所以小火车与小火车之间边界就不见了,到了 接收方这边, recv可能会先收到4个字节确定第一个小火车的车厢长度,再收到800字节,此时继续再 recv就会从第一个火车车厢中继续取出4个字节,那这4个字节显然就不是第二个小火车的车厢长度 了。

有以下解决方案:
1.1使用MSG_WAITALL(接收完整的长度数据)
recv函数用于从套接字接收数据。它的第四个参数是一个标志,用来控制接收操作的行为。
- 如果将第四个参数设置为0或者使用
MSG_WAITALL标志,recv函数会一直阻塞,直到接收到指定长度的数据。 - 如果接收到的数据长度小于请求的长度,
recv函数会一直阻塞直到接收完指定长度的数据或者发生错误。
#include <func.h>int main()
{//创建客户端的套接字int clientfd = socket(AF_INET, SOCK_STREAM, 0);ERROR_CHECK(clientfd, -1, "socket");struct sockaddr_in serveraddr;memset(&serveraddr, 0, sizeof(serveraddr));//指定使用的是IPv4的地址类型 AF_INETserveraddr.sin_family = AF_INET;serveraddr.sin_port = htons(8080);serveraddr.sin_addr.s_addr = inet_addr("127.0.0.1");//连接服务器int ret = connect(clientfd, (struct sockaddr*)&serveraddr, sizeof(serveraddr));ERROR_CHECK(ret, -1, "connect");printf("connect success.\n");//进行文件的接收//1. 先接收文件的名字//1.1 先接收文件名的长度int length = 0;ret = recv(clientfd, &length, sizeof(length), 0);printf("filename length: %d\n", length);//1.2 再接收文件名本身char buff[1000] = {0};ret = recv(clientfd, buff, length, 0);printf("1 recv ret: %d\n", ret);int fd = open(buff, O_CREAT|O_RDWR, 0644);ERROR_CHECK(fd, -1, "open");//2. 再接收文件的内容//2.1 先接收文件内容的长度ret = recv(clientfd, &length, sizeof(length), 0);printf("fileconent length: %d\n", length);int total = 0;int len = 0;//每一个分片的长度//2.2 再接收文件内容本身while(total < length) {recv(clientfd, &len, sizeof(len), MSG_WAITALL);if(len != 1000) {printf("slice len: %d\n", len);//printf("total: %d bytes.\n", total);}memset(buff, 0, sizeof(buff));//将recv函数的第四个参数设置为MSG_WAITALL之后,//表示必须要接收len个字节的数据之后,才会返回ret = recv(clientfd, buff, len, MSG_WAITALL);// ret <= len//printf("slice %d bytes.\n", ret);if(ret > 0) {total += ret;write(fd, buff, ret);//写入本地文件}}close(fd);close(clientfd);return 0;
}
1.2每次循环发送和接受指定长度的数据
服务端发来多少客户端就接受多少,服务端封装一个发送指定大小数据的函数,客户端封装一个接收指定大小数据的函数。
客户端代码:
#include <func.h>//接收确定的字节数的数据
//sockfd:通信套接字,buff:接收的内容,len:接收内容的长度
int recvn(int sockfd, void * buff, int len)
{int left = len;char * pbuf = buff;int ret = -1;while(left > 0) {ret = recv(sockfd, pbuf, left, 0);if(ret == 0) {break;} else if(ret < 0) {perror("recv");return -1;}left -= ret;pbuf += ret;}return len - left;
}int main()
{//创建客户端的套接字int clientfd = socket(AF_INET, SOCK_STREAM, 0);ERROR_CHECK(clientfd, -1, "socket");struct sockaddr_in serveraddr;memset(&serveraddr, 0, sizeof(serveraddr));//指定使用的是IPv4的地址类型 AF_INETserveraddr.sin_family = AF_INET;serveraddr.sin_port = htons(8080);serveraddr.sin_addr.s_addr = inet_addr("127.0.0.1");//连接服务器int ret = connect(clientfd, (struct sockaddr*)&serveraddr, sizeof(serveraddr));ERROR_CHECK(ret, -1, "connect");printf("connect success.\n");//进行文件的接收//1. 先接收文件的名字//1.1 先接收文件名的长度int length = 0;ret = recvn(clientfd, &length, sizeof(length));printf("filename length: %d\n", length);//1.2 再接收文件名本身char buff[1000] = {0};ret = recvn(clientfd, buff, length);printf("1 recv ret: %d\n", ret);int fd = open(buff, O_CREAT|O_RDWR, 0644);ERROR_CHECK(fd, -1, "open");//2. 再接收文件的内容//2.1 先接收文件内容的长度ret = recvn(clientfd, &length, sizeof(length));printf("fileconent length: %d\n", length);int total = 0;int len = 0;//每一个分片的长度//2.2 再接收文件内容本身while(total < length) {ret = recvn(clientfd, &len, sizeof(len));if(len != 1000) {printf("slice len: %d\n", len);//printf("total: %d bytes.\n", total);}memset(buff, 0, sizeof(buff));ret = recvn(clientfd, buff, len);if(ret != 1000) {//printf("slice %d bytes.\n", ret);}if(ret > 0) {total += ret;write(fd, buff, ret);//写入本地文件}}close(fd);close(clientfd);return 0;
}
1.3客户端断开连接 --- SIGPIPE信号的处理
现象:客户端断开连接时,导致服务器中的某一个子进程挂掉了,变成了僵尸进程,导致父子进程通信的管道被关闭了。而父进程一直监听该管道,因此epoll_wait不断返回,才有了服务器疯狂打印的情况出现。
通常情况下,如果程序向一个已经关闭写入的管道写数据,操作系统会发送 SIGPIPE 信号给进程,而默认的行为是终止该进程。但是有时候我们希望在这种情况下不让程序退出,而是希望处理其他错误或者采取其他措施。这时候就可以通过 signal(SIGPIPE, SIG_IGN); 来忽略 SIGPIPE 信号,让程序继续执行下去。
当客户端关闭时,服务器先执行第一次send操作,客户端会返回一个RST报文 当服务器的子进程再次发送第二次send操作时,会接收到SIGPIPE信号,导致子进程奔溃,从而导致子进程与父进程通信的管道也会关掉。
解决该问题:只需要让子进程忽略掉SIGPIPE信号即可。

1.4客户端打印文件传输的进度条
#include <func.h>//接收确定的字节数的数据
int recvn(int sockfd, void * buff, int len)
{int left = len;char * pbuf = buff;int ret = -1;while(left > 0) {ret = recv(sockfd, pbuf, left, 0);if(ret == 0) {break;} else if(ret < 0) {perror("recv");return -1;}left -= ret;pbuf += ret;}return len - left;
}int main()
{//创建客户端的套接字int clientfd = socket(AF_INET, SOCK_STREAM, 0);ERROR_CHECK(clientfd, -1, "socket");struct sockaddr_in serveraddr;memset(&serveraddr, 0, sizeof(serveraddr));//指定使用的是IPv4的地址类型 AF_INETserveraddr.sin_family = AF_INET;serveraddr.sin_port = htons(8080);serveraddr.sin_addr.s_addr = inet_addr("127.0.0.1");//serveraddr.sin_addr.s_addr = inet_addr("192.168.30.129");//连接服务器int ret = connect(clientfd, (struct sockaddr*)&serveraddr, sizeof(serveraddr));ERROR_CHECK(ret, -1, "connect");printf("connect success.\n");//进行文件的接收//1. 先接收文件的名字//1.1 先接收文件名的长度int length = 0;ret = recvn(clientfd, &length, sizeof(length));printf("filename length: %d\n", length);//1.2 再接收文件名本身char buff[1000] = {0};ret = recvn(clientfd, buff, length);printf("1 recv ret: %d\n", ret);int fd = open(buff, O_CREAT|O_RDWR, 0644);ERROR_CHECK(fd, -1, "open");//2. 再接收文件的内容//2.1 先接收文件内容的长度ret = recvn(clientfd, &length, sizeof(length));printf("fileconent length: %d\n", length);int segment = length / 100;//百分之一的长度int lastSize = 0;#if 1int curSize = 0;int len = 0;//每一个分片的长度//2.2 再接收文件内容本身while(curSize < length) {ret = recvn(clientfd, &len, sizeof(len));memset(buff, 0, sizeof(buff));ret = recvn(clientfd, buff, len);if(ret > 0) {curSize += ret;write(fd, buff, ret);//写入本地文件if(curSize - lastSize > segment) { //每百分之一打印一次//打印进度条printf("has complete %5.2f%%\r", (double)100 * curSize / length);fflush(stdout);lastSize = curSize;//更新上一次打印百分比时的长度}}}printf("has complete 100.00%%\n");
#endifclose(fd);close(clientfd);return 0;
}
相关文章:
【Linux C | 网络编程】进程池大文件传输的实现详解(三)
上一篇实现了进程池的小文件传输,使用自定义的协议,数据长度数据本身,类似小火车的形式,可以很好的解决TCP“粘包”的问题。 【Linux C | 网络编程】进程池小文件传输的实现详解(二) 当文件的内容大小少于…...
Mac如何通过SSH连接Github
目录 前言 一、实现步骤 1.生成 SSH 密钥对 2.添加 SSH 密钥到 GitHub: 3.配置 SSH 连接 1.更新远程仓库 URL 2.测试 SSH 连接 前言 GitHub 在 2021 年 8 月 13 日停止了对使用密码进行身份验证的支持。因此,你需要使用其他认证方式,如…...
成就巴西休闲游戏如何借助Google谷歌广告投放优势
在探讨巴西休闲游戏如何借助谷歌广告投放优势实现市场扩张的过程中,我们不得不深入分析巴西市场的独特属性、休闲游戏的兴起背景,以及谷歌广告平台在全球范围内的强大影响力。近年来,随着移动游戏市场的快速发展,特别是中轻度休闲…...
利用python检查磁盘空间使用情况
目录 一.前言 二.使用的库介绍 三.代码实现以及解析 3.1导入模块 3.2邮件发送函数 send_email 3.3检查磁盘空间函数 check_and_clean_disk 3.4主程序逻辑 四.致谢 一.前言 在信息技术飞速发展的今天,数据量的激增使得磁盘空间管理成为系统运维中的一项基…...
卷积神经网络(五)---图像增强的方法
前面的部分专注于卷积神经网络的层结构介绍,同时还介绍了到目前为止比较出名的卷积神经网络,接着使用比较复杂的卷积神经网络提高了 MNIST 数据集的准确率。下面将从另外的角度——图像增强的方面入手,提高模型的准确率和泛化能力。 一直以来…...
矩阵常见分解算法及其在SLAM中的应用
文章目录 常见特殊矩阵定义Cholesky分解(正定Hermittian矩阵,分解结果唯一)Cholesky分解应用 SVD分解(将singularvalues排序后分解唯一)SVD 分解的应用(任意矩阵) QR分解(任意矩阵&a…...
【排序】快速排序详解
✨✨欢迎大家来到Celia的博客✨✨ 🎉🎉创作不易,请点赞关注,多多支持哦🎉🎉 所属专栏:排序 个人主页:Celias blog~ 一、快速排序的思想 快速排序的核心思想是: 选定一个…...
贪心算法总结(2)
一、买卖股票的最佳时机 . - 力扣(LeetCode) class Solution { public:int maxProfit(vector<int>& prices) {int miniINT_MAX;int ret0;for(int&price:prices){//遍历的时候,我们随时去更新最小的值,然后让每一位…...
弘景光电:技术实力与创新驱动并进
在光学镜头及摄像模组产品领域,广东弘景光电科技股份有限公司(以下简称“弘景光电”)无疑是一颗耀眼的明星。自成立以来,弘景光电凭借其强大的研发实力、卓越的产品性能、精密的制造工艺以及严格的质量管理体系,在光学…...
2024年7月23日~2024年7月29日周报
目录 一、前言 二、完成情况 2.1 一种具有边缘增强特点的医学图像分割网络 2.2 融合边缘增强注意力机制和 U-Net 网络的医学图像分割 2.3 遇到的困难 三、下周计划 一、前言 上周参加了一些师兄师姐的论文讨论会议,并完成了初稿。 本周继续修改论文࿰…...
M3U8流视频数据爬虫
M3U8流视频数据爬虫 HLS技术介绍 现在大部分视频客户端都采用HTTP Live Streaming(HLS,Apple为了提高流播效率开发的技术),而不是直接播放MP4等视频文件。HLS技术的特点是将流媒体切分为若干【TS片段】(比如几秒一段…...
保护您的数字财富:模块化沙箱在源代码防泄露中的突破
在数字化浪潮中,企业面临着前所未有的数据安全挑战。源代码、商业机密、客户数据……这些宝贵的数字资产一旦泄露,后果不堪设想。SDC沙盒防泄密系统,以其卓越的技术实力和创新的解决方案,为企业提供了一个坚不可摧的安全屏障。 核…...
FFmpeg源码:avio_r8、avio_rl16、avio_rl24、avio_rl32、avio_rl64函数分析
一、引言 AVIOContext是FFmpeg(本文演示用的FFmpeg源码版本为5.0.3)中的字节流上下文结构体,用来管理输入输出数据。打开一个媒体文件的时候,需要先把数据从硬盘读到缓冲区,然后会用到AVIOContext中的如下成员&#x…...
如何使用 API 查看极狐GitLab 镜像仓库中的镜像?
GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab :https://gitlab.cn/install?channelcontent&utm_sourcecsdn 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署…...
软件-vscode-plantUML-IDEA
文章目录 vscode基础命令 实操1. vscode实现springboot项目搭建 (包括spring data jpa和sqlLite连接) PlantUMLIDEA下载及安装Eval Reset插件配置修改IDEA创建项目的默认目录IDEA配置gitIDEA翻译插件translationIDEA断点调试IDEA全局搜索快捷键不能使用代…...
ES6语法详解,面试必会,通俗易懂版
目录 Set的基本使用WeakSet 使用Set 和 WeakSet 区别内存泄漏示例:使用普通 Set 保存 DOM 节点如何避免这个内存泄漏MapWeakMap 的使用 Set的基本使用 在ES6之前,我们存储数据的结构主要有两种:数组、对象。 在ES6中新增了另外两种数据结构&a…...
CTFshow--Web--代码审计
目录 web301 web302 web303 web304 web305 web306 web307 web308 web309 web310 web301 开始一个登录框, 下意识sql尝试一下 发现 1 的时候会到一个 checklogin.php 的路径下, 但啥也没有 好吧, 这是要审计代码的 ,下载好源码, 开始审计 看了一下源码 , 应该就是sql…...
Java语言程序设计——篇十(1)
🌿🌿🌿跟随博主脚步,从这里开始→博主主页🌿🌿🌿 接口介绍 接口概述接口定义接口的实现实战演练 👅接口的继承实战演练实战演练 接口的类型常量实战演练 静态方法默认方法解决默认方…...
Qt对比MFC优势
从Qt小白到现在使用了有四年的时间,之前也搞过MFC,WinForm,基本上都是桌面的框架, 从难易程度看MFC>QT>WinForm; 运行的效率上来看MFC>QT>WinForm; 开发效率上WinForm>QT>MFC; 跨平台Qt首选; 界面的美观难易程度Qt>…...
RuntimeError: No CUDA GPUs are available
RuntimeError: No CUDA GPUs are available 目录 RuntimeError: No CUDA GPUs are available 【常见模块错误】 【解决方案】 解决步骤如下: 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英杰,211科…...
XCTF-web-easyupload
试了试php,php7,pht,phtml等,都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接,得到flag...
【人工智能】神经网络的优化器optimizer(二):Adagrad自适应学习率优化器
一.自适应梯度算法Adagrad概述 Adagrad(Adaptive Gradient Algorithm)是一种自适应学习率的优化算法,由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率,适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...
java 实现excel文件转pdf | 无水印 | 无限制
文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...
ETLCloud可能遇到的问题有哪些?常见坑位解析
数据集成平台ETLCloud,主要用于支持数据的抽取(Extract)、转换(Transform)和加载(Load)过程。提供了一个简洁直观的界面,以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...
【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分
一、项目背景回顾 前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。 本弹重点聚焦于服务端的模块划分与架构设计,提升代码结构的可维护性与扩展性。 二、服务端模块设计目标 高内聚低耦合:各模块职责清晰,便于独立开发…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...
人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...
Go 并发编程基础:通道(Channel)的使用
在 Go 中,Channel 是 Goroutine 之间通信的核心机制。它提供了一个线程安全的通信方式,用于在多个 Goroutine 之间传递数据,从而实现高效的并发编程。 本章将介绍 Channel 的基本概念、用法、缓冲、关闭机制以及 select 的使用。 一、Channel…...
PHP 8.5 即将发布:管道操作符、强力调试
前不久,PHP宣布了即将在 2025 年 11 月 20 日 正式发布的 PHP 8.5!作为 PHP 语言的又一次重要迭代,PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是,借助强大的本地开发环境 ServBay&am…...
tomcat入门
1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效,稳定,易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...
