当前位置: 首页 > news >正文

minio下载文件速度很慢的原因分析与说明

文章目录

  • 1.实战背景
  • 2.问题描述
  • 3.问题分析
  • 4.问题解决

1.实战背景

最近在做一个项目,需要用到minio来搭建文件系统,先简单说一下我在项目中设置的上传文件流程:

  1. 前端将分块文件逐一传给后端,后端再存储到 linux服务器的minio 当中。
  2. 所有分块文件存储完毕,后端从 minio 下载所有的分块文件到本地磁盘中。
  3. 后端进行合并文件处理,将合并后的文件通过上传到minio(SDK-Minio Java Client有自带分块上传方法)

我在当前的项目开发阶段,java后端服务是直接在本地进行运行,而minio服务则是在购买的轻量服务器中运行

2.问题描述

在上传文件流程的过程二中,我发现一个2MB的分块文件下载到本地磁盘需要两到三秒,而一个大文件肯定会有许多分块文件,这就导致了当前端向后端发送合并文件请求,后端需要花费大量的时间来处理,主要就是花费在了从Minio下载分块文件到本地磁盘上。

  • 一方面导致前端请求超时,无法获取到后端的处理后结果。
  • 另一方面长时间的等待后端处理,严重影响了用户的体验。

image-20230211033601239

3.问题分析

1️⃣ 首先我怀疑是使用的服务器本身性能的问题,于是又换了一个新的服务器(6Mbps宽带)用来只运行minio服务,然后发现没卵用,分块文件下载到本地速度还是一样慢。

2️⃣ 然后我做了许多的demo来进行下载测试,在这里我给出比较有代表性的测试案例:

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId><version>2.6.3</version>
</dependency>
<dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.3.0</version>
</dependency>
<dependency><groupId>me.tongfei</groupId><artifactId>progressbar</artifactId><version>0.5.3</version>
</dependency>
<dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.8.1</version>
</dependency>
import io.minio.GetObjectArgs;
import io.minio.MinioClient;
import org.apache.tomcat.util.http.fileupload.IOUtils;import java.io.FileOutputStream;
import java.io.InputStream;/*** @author 狐狸半面添* @create 2023-02-11 3:47*/
public class MinioFileDownLoadTest {private final static MinioClient minioClient;static {minioClient = MinioClient.builder()// 指定连接的ip和端口(轻量服务器).endpoint("http://1.14.94.100:9000")// 指定 访问秘钥(也称用户id) 和 私有秘钥(也称密码).credentials("admin", "12345678").build();}public static void main(String[] args) throws Exception {// 平均用时:14036mstest01();}public static void test01() throws Exception {Long start = System.currentTimeMillis();// 拿到输入流,我存放在minio的该文件为 10.1 MB 大小InputStream inputStream = minioClient.getObject(GetObjectArgs.builder().bucket("waveedu").object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3").build());// 拿到输出流,用于下载到本地,命名为 lucky.mp3FileOutputStream outputStream = new FileOutputStream("D:\\lucky.mp3");// 用于拷贝流IOUtils.copy(inputStream, outputStream);Long end = System.currentTimeMillis();System.out.println("用时:" + (end - start) + "ms");}
}

test01()就是我在项目中使用的下载分块文件的方式。我进行了多次测试执行该方法,可以看出确实很慢,10.1MB的文件也要14秒左右。

于是小可爱的我换了一种下载方式:

    public static void test02() throws Exception {Long start = System.currentTimeMillis();// 使用minio客户端提供的downloadObject方法进行下载minioClient.downloadObject(DownloadObjectArgs.builder()// 指定 bucket 存储桶.bucket("waveedu")// 指定 哪个文件.object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3")// 指定存放位置与名称.filename("D:\\lucky.mp3").build());Long end = System.currentTimeMillis();System.out.println(end - start);}

我发现第一次执行该test02()方法下载的耗时和test01()的耗时一样,但之后再执行test02()时发现都只需要0.2秒!

于是我天真的以为就是不应该使用流拷贝的方式,而是应该使用test02()的方式。但修改项目中的下载方式后,几番折腾下来下载分块代码的时间和原来还是一样,依旧2MB的分块文件下载到本地磁盘需要两到三秒。我真哭醉了😭😭😭。

3️⃣ 于是又几番demo测试和源码分析后,我发现了为什么test02()第一次执行的耗时和test01()一样。

我们先看看 downloadObject 方法的对我们而言的关键源码:

image-20230211043521167

简单点说,实际上就是 downloadObject 方法中也是使用流拷贝方式进行下载,但在下载之前先会去判断 D:\lucky.mp3 是否已经在本地磁盘存在,如果存在并且与minio中 waveedu 桶的文件 林屿森LIN - 小幸运【吉他】 (伴奏).mp3 所占字节大小一致,就认为是相同文件,没必要再从minio下载。因此第一次执行完test02()方法后之后再执行都是会直接判断出 fileSize == stat.size()为true ,就return了,不会再流拷贝。

而我的test01()是没有走这个判断的,不管本地指定位置存不存在,都会进行流拷贝从minio下载文件。

4️⃣ 发现了不是项目所用的下载方法的原因后,我开始思考是不是人品的问题,于是进行反复无脑愚蠢的重启服务器和重启项目,很显然,没得屁用。

5️⃣ 再到最后,我开始考虑是不是由于对轻量服务器是外网访问,而导致传输速度很慢,因此我依旧使用test01()的方法,在我本地linux虚拟机中启动minio服务,来测试下载速度:

import io.minio.GetObjectArgs;
import io.minio.MinioClient;
import org.apache.tomcat.util.http.fileupload.IOUtils;import java.io.FileOutputStream;
import java.io.InputStream;/*** @author 狐狸半面添* @create 2023-02-11 15:10*/
public class NativeLinuxTest {public static void main(String[] args) throws Exception {MinioClient minioClient = MinioClient.builder()// 指定连接的ip和端口(该ip是本地虚拟机的虚拟Ip).endpoint("http://192.168.65.130:9000")// 指定 访问秘钥(也称用户id) 和 私有秘钥(也称密码).credentials("minioadmin", "minioadmin").build();Long start = System.currentTimeMillis();// 拿到输入流,我存放在minio的该文件为 10.1 MB 大小InputStream inputStream = minioClient.getObject(GetObjectArgs.builder().bucket("waveedu").object("林屿森LIN - 小幸运【吉他】 (伴奏).mp3").build());// 拿到输出流,用于下载到本地,命名为 lucky.mp3FileOutputStream outputStream = new FileOutputStream("D:\\lucky.mmp3");// 用于拷贝流IOUtils.copy(inputStream, outputStream);Long end = System.currentTimeMillis();// 平均用时 0.2 到 0.3 秒System.out.println("用时:" + (end - start) + "ms");}
}

可以看到每次调用该拷贝流的方法都是只需要 0.2 到 0.3 秒左右,因此这也就证明了是由于后端项目启动在本地,而minio服务放在了轻量服务器,后端项目从minio下载文件必须外网访问的缘故。

4.问题解决

但这个问题在我们项目部署后肯定不存在的,因为我们的项目,也包括数据库、minio服务、redis服务肯定都是部署在同一局域网中(如果项目不大的话,简单点操作就是将所有服务放在一台服务器上)。这样的好处就是可以极大的加快数据传输速率。

相关文章:

minio下载文件速度很慢的原因分析与说明

文章目录1.实战背景2.问题描述3.问题分析4.问题解决1.实战背景 最近在做一个项目&#xff0c;需要用到minio来搭建文件系统&#xff0c;先简单说一下我在项目中设置的上传文件流程&#xff1a; 前端将分块文件逐一传给后端&#xff0c;后端再存储到 linux服务器的minio 当中。…...

基于comsol软件弯曲单模光纤模拟仿真

在本节中&#xff0c;主要基于实验室实际光纤单模圆柱光纤进行模拟&#xff0c;与comsol案例库文件在分析过程和建模有些差异&#xff1a; 模拟主要通过以下三个步骤进行&#xff1a;模型的几何构建、物理场的添加研究、结构处理分析来进行。 下面是第一步骤&#xff1a;几何…...

如何开启多个独立Chrome浏览器

一、简介 作为测试或者开发人员&#xff0c;有些情况下会用到 Chrome 浏览器&#xff0c;但有时是同一个 Chrome 浏览器无法为我们提供隔离开的不同环境。这样 我们就需要清理 cache 、切换账号等&#xff0c;降低了我们的工作效率。今天的主题是如何开启多个独立的 Chrome 浏…...

erp5开源制造业erp主要业务会计分录处理

erp5开源制造业erp主要业务会计分录处理 采购业务的会计分录 收到发票时 借&#xff1a;材料采购 (1201) 应交税费-应交增值税&#xff08;进项税&#xff09;(21710101) 贷&#xff1a;应付账款 (2121) 付款时 借&#xff1a;应付账款 (2121) 贷&#xff1a;银行存款 (1002) 入…...

技能树基础——17四平方和(拉格朗日定理,嵌套循环)

题目&#xff1a;四平方和定理&#xff0c;又称为拉格朗日定理&#xff1a;每个正整数都可以表示为至多4个正整数的平方和。如果把0包括进去&#xff0c;就正好可以表示为4个数的平方和。比如&#xff1a;5 0^ 2 0^ 2 1^ 2 2^27 1^ 2 1^ 2 1^ 2 2^2 &#xff08;^符号表…...

JPA、EJB、事物管理---相关内容整理

目录 ■前言 ■实现原理&#xff1a;容器管理事务 ■代码实现简单描述&#xff1a; 1.JPA ■定义 ■1.1.配置文件 ■1.2.OSS jar ■1.3.一些OPA的类&#xff08;举例&#xff09; ■1.4. jpa 框架在实体类&#xff08;Entity&#xff09;中添加非数据库字段的属性--…...

C语言学习笔记(一):了解C语言

什么是C语言 C语言是一种高级编程语言&#xff0c;最早由丹尼斯里奇在1972年开发。它是一种通用编程语言&#xff0c;提供了高级编程语言的方便和易用性&#xff0c;同时又有较低级别的编程语言的灵活性和效率。C语言在许多操作系统、编译器和应用程序开发中广泛使用&#xff…...

回头看——《智能家居项目小结》

openAI兴起&#xff0c;于是拿着之前小组合作的项目&#xff08;承认优化较差&#xff09;&#xff0c;交给AI试着帮忙优化下&#xff11;.功能函数&#xff08;TCP_SER_INIT&#xff09;优化源代码&#xff1a;int TCP_SER_INIT(int *tcpsocket, const char *ip, const char *…...

社交登陆OAuth2.0

QQ、微博、github 等网站的用户量非常大&#xff0c;别的网站为了 简化自我网站的登陆与注册逻辑&#xff0c;引入社交登陆功能&#xff1b; 步骤&#xff1a; 1&#xff09;、用户点击 QQ 按钮 2&#xff09;、引导跳转到 QQ 授权页 3&#xff09;、用户主动点击授权&#xff…...

C++005-C++选择与分支2

文章目录C005-C选择与分支2条件语句C实现else if 语句题目描述 根据成绩输出成绩等级ABCDEif嵌套语句题目描述 输出三个数中的最大值题目描述 模拟游戏登录switch语句三元运算符题目描述 输出三个数中的最大值-基于3元运算符题目描述 根据1-7输出星期1-星期日案例练习题目描述 …...

IPFS 简介及概述

文章目录 IPFS 简介IPFS 包含的协议内容及其理解IPFS 和 BitTorrent 区别IPFS 简介 星际文件系统(InterPlanetary File System). IPFS 是一个分布式的网络文件系统, 点到点超媒体协议. 可以让我们的互联网速度更快, 更加安全, 并且更加开放. IPFS协议的目标是取代传统的互联网…...

初学者必读:讲解 VC 下如何正确的创建、管理及发布项目

Visual C 的项目文件组成&#xff0c;以及如何正确的创建及管理项目。 本内容是初学者必须要掌握的。不能正确的管理项目&#xff0c;就不能进一步写有规模的程序。 一、项目下各种常见文件类型的功能 1. 代码文件 扩展名为 .cpp、.c、.h 等。 通常情况下&#xff0c;项目…...

剑指offer(中等)

目录 二维数组中的查找 重建二叉树 矩阵中的路径 剪绳子 剪绳子② 数值的整数次方 表示数值的字符串 树的子结构 栈的压入、弹出序列 从上到下打印二叉树① 从上到下打印二叉树③ 二叉搜索树的后序遍历序列 二叉树中和为某一值的路径 复杂链表的复制 二叉搜索树与…...

微软发布会精华回顾:“台式电脑”抢了风头

Lightbot北京时间2016年10月26日晚10点&#xff0c;微软在纽约发布了名为 Surface Studio 的一体机、名为 Surface Dial 的配件以及外观未变的顶配版 Surface Book。同时&#xff0c;微软宣布了 Windows 10 下一个重要版本——“Creators Update”的数项新功能&#xff0c;包括…...

CF1561C Deep Down Below 题解

CF1561C Deep Down Below 题解题目链接字面描述Deep Down Below题面翻译题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1提示思路TLE算法具体思想TLE特例AC思想代码实现备注题目 链接 https://www.luogu.com.cn/problem/CF1561C 字面描述 Deep Down Below 题面翻译…...

秒杀项目之服务调用分布式session

目录 nginx动静分离 服务调用 创建配置zmall-cart购物车模块 创建配置zmall-order订单模块 服务调用 spring session实战 什么是Spring Session 为什么要使用Spring Session 错误案例展示 配置spring-session 二级域名问题 用户登录 nginx动静分离 第1步&#xff…...

聊聊什么是架构,你理解对了吗?

什么是架构?软件有架构?建筑也有架构?它们有什么相同点和不同点? 下面咱们就介绍一下,容易混淆的几个概念 一、系统与子系统 系统 泛指由一群有关联的个体组成,根据某种规则运作,能完成个别元件不能单独完成的工作的群体。它的意思是 “总体”、“整体”或“联盟” 子系…...

java多线程开发

1.并发和并行 并发&#xff1a;同一时间段内多个任务同时进行。 并行&#xff1a;同一时间点多个任务同时进行。 2.进程线程 进程&#xff08;Process&#xff09;&#xff1a;进程是程序的一次动态执行过程&#xff0c;它经历了从代码加载、执行、到执行完毕的一个完整过程…...

杂记7--opencv的ar码模块学习

背景&#xff1a;项目需要用到marker知识&#xff0c;所以到官网上临时补一些知识。 概要&#xff1a;主要介绍marker一些接口的含义&#xff0c;纯属个人理解&#xff0c;有误则希望大佬不吝赐教 1、 涉及ar码操作学习&#xff0c;其头文件为&#xff1a; #include <op…...

[项目设计]高并发内存池

目录 1、项目介绍 2、高并发内存池整体框架设计 3、thread cache <1>thread cache 哈希桶对齐规则 <2>Thread Cache类设计 4、Central Cache <1>Central Cache类设计 5、page cache <1>Page Cache类设计 6、性能分析 <1>定长内存池实现…...

28岁才转行软件测试,目前32了,我的一些经历跟感受

我是92年的&#xff0c;算是最早的90后&#xff0c;现在跟你介绍的时候还恬不知耻的说我是90后&#xff0c;哈哈&#xff0c;计算机专业普通本科毕业。在一个二线城市&#xff0c;毕业后因为自身能力问题、认知水平问题&#xff0c;再加上运气不好&#xff0c;换过多份工作&…...

Python导入模块的3种方式

很多初学者经常遇到这样的问题&#xff0c;即自定义 Python 模板后&#xff0c;在其它文件中用 import&#xff08;或 from...import&#xff09; 语句引入该文件时&#xff0c;Python 解释器同时如下错误&#xff1a;ModuleNotFoundError: No module named 模块名意思是 Pytho…...

select 与 where、order by、limit 子句执行优先级比较

当 select 和 其他三种语句的一者或者多者同时出现时&#xff0c;他们之间是存在执行先后顺序的。 他们的优先级顺序是&#xff1a;where > select > order by > limit 目录 1、select 与 where 2、select 与 order by 3、order by 与 limit 4、优先级证明 1、s…...

Linux内核并发与竞争-原子操作

一.原子操作的概念首先看一下原子操作&#xff0c;原子操作就是指不能再进一步分割的操作&#xff0c;一般原子操作用于变量或者位操作。假如现在要对无符号整形变量 a 赋值&#xff0c;值为 3&#xff0c;对于 C 语言来讲很简单&#xff0c;直接就是&#xff1a; a3但是 C 语言…...

Java笔记-泛型的使用

参考&#xff1a; Java 泛型&#xff0c;你了解类型擦除吗&#xff1f; 泛型的使用 1、泛型的定义 可以广泛使用的类型&#xff0c;一种较为准确的说法就是为了参数化类型&#xff0c;或者说可以将类型当作参数传递给一个类或者是方法。 2、泛型的使用 2.1泛型类 public c…...

特斯拉无人驾驶解读

来源于Tesla AI Day Tesla无人驾驶算法的核心任务就是如何理解我们所看到的一切呢?也就是说,不使用高端的设备,比如激光雷达,仅仅使用摄像头就能够将任务做得很好。Tesla使用环绕型的8个摄像头获得输入。 第一步是特征提取模块Backbone,无论什么任务都离不开特征…...

生物素-琥珀酰亚胺酯Biotin-NHS;CAS号:35013-72-0;可对溶液中的抗体,蛋白质和任何其他含伯胺的大分子进行简单有效的生物素标记。

结构式&#xff1a; ​ 生物素-琥珀酰亚胺酯Biotin NHS CAS号&#xff1a;35013-72-0 英文名称&#xff1a;Biotin-NHS 中文名称&#xff1a;D-生物素 N-羟基琥珀酰亚胺酯&#xff1b;生物素&#xff0d;琥珀酰亚胺酯 CAS号&#xff1a;35013-72-0 密度&#xff1a;1.50.1 …...

Maven_第五章 核心概念

目录第五章 其他核心概念1、生命周期①作用②三个生命周期③特点2、插件和目标①插件②目标3、仓库第五章 其他核心概念 1、生命周期 ①作用 为了让构建过程自动化完成&#xff0c;Maven 设定了三个生命周期&#xff0c;生命周期中的每一个环节对应构建过程中的一个操作。 …...

【深度学习】人脸识别工程化落地

文章目录前言1、facenet2、使用2.1.其它blog2.2 实践总结前言 老早以前就希望能写一篇关于人脸识别的工程化落地的案例&#xff0c;一年前做疲劳驾驶时使用的dlib插件&#xff0c;它封装好了&#xff0c;人脸检测、对齐、相似度计算三个部分,就是插件比较难装,但同时也少了很多…...

AOP面向切面编程思想。

目录 一、AOP工作流程 1、基本概念 2、AOP工作流程 二、AOP核心配置 1、AOP切入点表达式 2、AOP通知类型 三、AOP通知获取数据 1、获取参数 2、获取返回值 3、获取异常 四、AOP事务管理 1、Spring事务简介 2、Spring事务角色 3、事务属性 一、AOP工作流程 1、…...

python mysql开发网站开发/免费自助建站平台

其实最初听到数据挖掘&#xff0c;觉得很高大上&#xff0c;没有过多的思考&#xff0c;挖来的数据能干嘛呢。 刚看到一篇关于数据分析的文章&#xff0c;大概内容就是获取用户评论&#xff0c;然后对评论进行分析&#xff0c;找出客户不满意的地方&#xff0c;但这种分析还是人…...

百度地图嵌入wordpress/网络营销的功能有哪些?

对于一个项目而言&#xff0c;项目管理过程中最重要的是履约创效&#xff0c;是衡量一个项目实际的管理水平。 所谓履约指的是企业在发展的过程中&#xff0c;实际履行合同的能力&#xff0c;对于基层项目来说&#xff0c;履约能力的高低能够从项目的工期&#xff0c;质量&…...

法律电商如何做网站推广营销/网络推广官网首页

一、GitBook 简介 GitBook 是一个基于 Node.js 的命令行工具&#xff0c;可使用 Github/Git 和 Markdown 来制作精美的电子书、开发文档等。 GitBook支持输出多种文档格式&#xff1a; 静态站点&#xff1a;GitBook默认输出该种格式&#xff0c;生成的静态站点可直接托管搭载G…...

做视频搬运哪个网站最赚钱/2023上海又出现疫情了

本人正在吹着空调&#xff0c;喝着茶水&#xff0c;然后qq头像抖了两下&#xff0c;业务开发同学给我打了个招呼&#xff0c;“忙么&#xff1f;帮个忙可以不&#xff1f;” 这很明显了&#xff0c;要忙了呀&#xff01;来活了。本着爱岗敬业的精神回复“您说”。 然后很含蓄的…...

pageadmin的优势/seo网站优化怎么做

在今天的文章中&#xff0c;我讲一下如何使用 Kibana 可视化地理数据。在我之前有些文章已经介绍过许多这方面的。在这篇文章中&#xff0c;给一些还不是很熟悉的开发者做个简单的介绍。首先我们必须清楚在我们的索引中&#xff0c;必须含有一个叫做 geo_point 类型的字段。比如…...

wordpress小程序百家号/青岛模板建站

中国人常说一句话&#xff1a;责任到人&#xff0c;否则就是无人负责。敏捷团队则提倡自组织团队&#xff0c;团队负责。那么敏捷团队是否就是无人负责&#xff1f;我在Linkedin的Scrum Alliance, Inc.组内提出了这个问题&#xff0c;下面有关此问题的一些回答&#xff1a; 从…...