生物科技公司网站模板/宁波seo哪家好
MySQL中的存储文件和IO机制详细解析
一、引言
MySQL作为广泛使用的关系型数据库管理系统,凭借其高性能和稳定性在各大应用中扮演了关键角色。在实际应用中,数据库需要对大量数据进行存储、检索、更新等操作。这些操作离不开底层的文件存储系统,以及在执行这些操作时如何按页(Page)进行数据读取、缓存和操作的机制。
本文将详细介绍MySQL中的.ibd
和.frm
文件的作用,以及增删改查操作是如何通过IO系统进行的。同时结合底层的数据结构原理,如B+树等,深入探讨数据在磁盘与内存之间的流动过程,理解跨页操作、分页读取对性能的影响。
二、MySQL的存储引擎及文件结构
MySQL最为常用的存储引擎是InnoDB,它采用了事务性存储引擎,并通过表空间(Tablespace)管理表和索引的数据。每张表通常都会对应多个文件,其中包括.ibd
文件和.frm
文件。
-
.ibd
文件:这是InnoDB存储引擎的数据文件,包含了表中的实际数据和索引信息。.ibd
文件是InnoDB表的独立表空间(表空间的文件格式),每个表都有独立的.ibd
文件,存储的是数据页和索引页。 -
.frm
文件:这是MySQL的表结构定义文件,存储了表的元数据,如表的列名、数据类型、主键等。在MySQL 8.0之前,每张表对应一个.frm
文件,它记录了表结构相关的信息。
三、InnoDB的存储结构及IO原理
1. 页(Page)的概念
在InnoDB存储引擎中,数据以页为单位进行存储和读取。InnoDB的默认页大小为16KB,每个表的数据和索引都存储在数据页中。
数据页是InnoDB管理存储数据的基本单位。每当需要对数据库中的数据进行增删改查时,MySQL不会直接访问磁盘上的数据,而是首先将数据页从磁盘加载到内存中的缓冲池(Buffer Pool)中进行操作。
2. 聚簇索引(Clustered Index)
InnoDB中的每张表都必须有一个聚簇索引(主键索引),聚簇索引将数据和主键一起存储在同一页中。这意味着数据的物理顺序和主键的顺序是紧密关联的。
聚簇索引下的数据页组织为B+树结构。树的叶子节点包含了表的行数据,而非叶子节点存储的是指向子节点的指针。当执行查询操作时,MySQL通过B+树从根节点遍历到叶子节点,从而找到目标数据页中的行数据。
3. 辅助索引(Secondary Index)
除了聚簇索引外,InnoDB还允许创建辅助索引。辅助索引也是采用B+树结构,但叶子节点存储的是主键值而不是实际数据。因此,通过辅助索引查询时,MySQL会首先通过辅助索引找到主键值,然后再通过主键去查询聚簇索引中的实际数据。
4. 页的读取与缓存机制
当用户发出查询或更新请求时,InnoDB需要首先确定相关数据页是否已经在内存中。如果数据页在内存中(缓冲池中),则直接进行操作。如果不在,则需要将数据页从磁盘上的.ibd
文件中读取到缓冲池中。
由于磁盘IO速度远慢于内存操作,因此缓冲池的大小和管理策略对性能至关重要。缓冲池内存不够时,InnoDB会通过LRU(最近最少使用)算法将不常用的数据页逐出缓冲池。
5. 页的分裂与合并
在增删数据时,B+树中的数据页可能会发生分裂或合并。例如,当一个页中的数据满时,会触发页的分裂,形成新的页;当数据减少时,页可能会发生合并。这些操作会对数据库的性能产生一定影响,特别是在高频增删操作的场景下。
四、SQL操作中的数据读取与IO
1. SELECT查询操作的过程
当用户发出一个查询请求时,MySQL会解析SQL语句并通过优化器生成执行计划。在执行计划中,MySQL会决定使用聚簇索引还是辅助索引来执行查询。
例如,对于如下SQL查询:
SELECT * FROM t_user WHERE user_type=1 AND is_delete=0;
- MySQL首先通过辅助索引(如果有)或聚簇索引查找到对应的记录。
- 如果查询字段不包含全部数据,MySQL需要通过主键回表,即从聚簇索引中再次查询完整的行数据。
- 在这个过程中,MySQL会将所需的数据页从磁盘加载到内存中。
当查询涉及多个页时(即跨页操作),需要多次从磁盘读取数据,这可能会导致IO操作的增加,从而影响查询的性能。为了优化跨页查询,适当调整InnoDB缓冲池大小以及表的设计,可以有效减少跨页查询带来的性能开销。
2. INSERT、UPDATE、DELETE操作
-
INSERT:当执行插入操作时,MySQL会在B+树的叶子节点插入新的数据。若当前页已满,则会发生页的分裂,生成新的页。
-
UPDATE:更新操作本质上是删除旧数据并插入新数据。MySQL首先会标记旧数据为“已删除”,然后在新的位置插入更新后的数据。
-
DELETE:删除操作会将数据从页中移除,若页中的数据数量过少,可能会触发页的合并操作。
所有这些操作都涉及到磁盘IO。特别是当页发生分裂或合并时,需要对多个页进行写操作,IO开销较大。
五、跨页操作对性能的影响
跨页操作的性能开销主要源于频繁的磁盘IO。跨页操作指的是当查询的数据分布在多个数据页中时,MySQL需要从多个页中提取数据。由于每个页都需要从磁盘读取,磁盘的随机访问速度远低于内存访问速度,因此跨页查询往往会导致性能下降。
通过设计合理的索引、优化查询语句、增加缓冲池大小等措施,可以减少跨页操作的频率,提高查询性能。
六、索引设计与枚举字段的索引适用性
在设计数据库时,是否为某些字段添加索引是一个关键决策。例如,枚举字段(如状态字段)是否适合加索引,取决于该字段的值是否具有足够的区分度。
以一个状态字段为例:
status: 0待提交, 1已提交, 2已完结, 3已终止, 4已删除
这种字段是否适合建立索引主要取决于以下因素:
- 区分度:如果字段的取值有限,且每个值的分布较为均匀,索引的效果可能不明显。
- 查询频率:如果该字段在查询中经常作为过滤条件,那么为其添加索引可以加快查询速度。
对于状态字段,如果该字段的值分布不均(如某个值占据大多数行),则建立索引的效果较差。
七、结论
MySQL通过页、块的管理机制以及多种索引结构(如聚簇索引、辅助索引)在数据存储、查询中提供了高效的性能支持。然而,数据的增删改查操作都离不开底层的IO操作,尤其是磁盘和内存之间的数据传输。因此,理解MySQL底层的页管理机制,以及跨页操作对性能的影响,对于优化数据库性能有着重要意义。
合理设计索引、调整缓冲池大小、优化查询语句等策略可以有效提高数据库的性能,特别是在高并发、大数据量的场景下。
相关文章:

MySQL中的存储文件和IO机制详细解析
MySQL中的存储文件和IO机制详细解析 一、引言 MySQL作为广泛使用的关系型数据库管理系统,凭借其高性能和稳定性在各大应用中扮演了关键角色。在实际应用中,数据库需要对大量数据进行存储、检索、更新等操作。这些操作离不开底层的文件存储系统…...

复习之 java 锁
裁员在家,没有面试机会,整理整理面试知识点吧! 不得不知道的java 锁 Java 中,提供了两种方式来实现同步互斥访问(也就是锁):synchronized 和 Lock 多线程编程中,有可能会出现多个线…...

数据结构与算法 - 图
一、概念 图是有顶点(vertex)和边(edge)组成的数据结构,例如 该图有4个顶点:A、B、C、D以及四条有向边,有向图中,边是单向的。 1. 有向图 VS 无向图 如果是无向图,那么…...

白骑士的HTML教学基础篇 1.1 HTML简介
在现代互联网的世界里,HTML(HyperText Markup Language)是所有网页的基础语言。无论是简约的个人博客还是复杂的商业网站,HTML都扮演着不可或缺的角色。掌握HTML是学习前端开发的第一步,这不仅能够帮助你构建静态网页&…...

c语言基础知识学习
1. C 语言简介 定义:C 语言是一种过程式编程语言,设计用于系统编程和应用程序开发。特点:高效、灵活、接近硬件,支持指针和内存操作。 1. 基本语法 程序结构: C 语言程序由函数组成,main 函数是程序的入口…...

Qt/QML学习-Dial
QML学习 Dial例程视频讲解代码 main.qml import QtQuick 2.15 import QtQuick.Window 2.15 import QtQuick.Controls 2.15Window {width: 640height: 480visible: truetitle: qsTr("Hello World")Dial {anchors.fill: parentid: dial// 设置旋钮的范围from: 0to: …...

达梦数据库系列—48.DMHS实现Mysql到DM8的同步
目录 DMHS实现Mysql到DM8的同步 1、准备介质 2、安装 3、准备源端Mysql和目标端DM8 软件安装 数据库创建 打开归档 开启附加日志 创建辅助表 Mysql客户端驱动 Mysql端安装ODBC 检查依赖包 创建连接用户 创建测试表 4、同步配置 修改服务配置 Mysql到Dm单向同步…...

PostgreSQL的启动过程
PostgreSQL的启动过程 PostgreSQL的启动过程中主要做了以下几件事: 初始化数据目录:如果数据目录是第一次使用,PostgreSQL会进行初始化,创建必要的系统表和目录结构。 读取配置文件:PostgreSQL会读取并解析配置文件&…...

ActiveMQ、RabbitMQ、Kafka、RocketMQ的区别简介
目录 1. 基本概述 2. 性能与吞吐量 3. 消息模型与特性 4. 生态系统与社区支持 5. 复杂性与运维成本 6.在优先级队列、延迟队列、死信队列、重试队列、消费模式、广播模式方面的区别 7.在消息回溯、消息堆积持久化、消息追踪、消息过滤方面的区别 8.在多租户、多协议支持…...

7.1 多态案例
一、案例1:计算器类 1.1 普通方式实现 #include <iostream> #include <string> using namespace std;class Calculator { public:int num1;int num2;int result(string oper){if (oper "")return num1 num2;else if (oper "-"…...

革新测试管理:集远程、协同、自动化于一身的统一测试管理平台
一、研发背景 当下汽车电子测试领域随着不断发展,自动化、智能化的软硬件一体测试解决方案已经成为趋势。能够整合各种测试资源、自动化测试流程,并提供数据分析和可视化报告,从而提高测试效率、降低成本,并确保汽车电子系统的可…...

HAProxy的详解
一、介绍 1.1 定义 HAProxy是一个使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。 HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前…...

网络安全实训第一天(dami靶场搭建,XSS、CSRF、模板、任意文件删除添加、框架、密码爆破漏洞)
1.环境准备:搭建漏洞测试的基础环境 安装完phpstudy之后,开启MySQL和Nginx,将dami文件夹复制到网站的根目录下,最后访问安装phptudy机器的IP地址 第一次登录删除dami根目录下install.lck文件 如果检测环境不正确可以下载php5.3.2…...

4.1 SQL的起源与发展
欢迎来到我的博客,很高兴能够在这里和您见面!欢迎订阅相关专栏: 工💗重💗hao💗:野老杂谈 ⭐️ 全网最全IT互联网公司面试宝典:收集整理全网各大IT互联网公司技术、项目、HR面试真题.…...

android中实现禁掉有线网络
1.首先初始化mINetworkManagementServiceProxy // INetworkManagementService mNwService; Object mINetworkManagementServiceProxy;public void init() {// IBinder b ServiceManager.getService(Context.NETWORKMANAGEMENT_SERVICE);// mNwService INetworkManagementSe…...

docker-compose安装MongoDB 7.0.12
文章目录 一. Mac1.1 创建目录1.2 docker-compose.yaml默认不开启relSet开启relSet(数据同步) 1.3 部署1.4 卸载1.5 replSet配置1.5.1 初始化replSet1.5.2 创建超管用户1.5.3 验证用户1.5.4 查看replSet状态 二. Centos72.1 创建目录2.2 docker-compose.…...

Ubuntu下NFS和SSH服务
本篇文章记录Ubuntu下如何对NFS和SSH服务进行配置和开启。 目录 一、NFS服务 二、SSH服务 1、安装SSH服务 2. 启动和检查SSH服务 3. 配置SSH服务 4. 连接到SSH服务 5. 设置防火墙 6. 测试连接 三、结语 一、NFS服务 NFS(Network File System࿰…...

游戏管理系统
目录 Java程序设计课程设计 游戏管理系统 1系统简介 1.1需求分析 1.2 编程环境与工具 2系统总体设计 2.1 系统的功能模块图。 2.2 各功能模块简介。 3主要业务流程 (1)用户及管理员登录流程图 (2)信息添加流程 &#x…...

坐牢第二十七天(聊天室)
基于UDP的网络聊天室 一.项目需求: 1.如果有用户登录,其他用户可以收到这个人的登录信息 2.如果有人发送信息,其他用户可以收到这个人的群聊信息 3.如果有人下线,其他用户可以收到这个人的下线信息 4.服务器可以发送系统信息…...

C++自学笔记33(数据类型总结与变量)
数据类型 类型位范围char1 个字节-128 到 127 或者 0 到 255unsigned char1 个字节0 到 255signed char1 个字节-128 到 127int4 个字节-2147483648 到 2147483647unsigned int4 个字节0 到 4294967295signed int4 个字节-2147483648 到 2147483647short int2 个字节-32768 到…...

游戏引擎phaser.js3的使用之玩家和静态物理组碰撞
玩家和静态物理组都加载好了,那就应该开始操作玩家动态和静态之间的碰撞了 下面是通过点击图片按钮来操作碰撞的 sky.on(pointerdown, function () { console.log(图片被点击了!); }) 图片点击后让动态的玩家和静态的物理组碰撞,就可以这…...

springboot整合mybatis以及mybatis-plus 开发
一、springboot整合mybatis 1.注解版 1.1 导入坐标 <dependencies><!--mybatis坐标--><dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>2.2.2</…...

大语言模型微调框架Unsloth:简化模型微调流程,提升模型性能
Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍,内存使用量减少了 70%,而且准确性不会降低! 特点 通过手动派生所有计算繁重的数学步骤和手写 GPU 内核,unsloth 可以在不更改任何硬件的情况…...

IPD-华为研发之道分析与理解
关于西方众多优秀的管理模式、理论我们学习过,也借鉴以及实践过,拿到《IPD-华为研发之道》通读研习后,正如书中所述,IPD是一套产品开发的模式、理念与方法,IPD思想,流程和方法是诸多成功企业优秀实践的经验…...

时空序列顶会文章
ICLR 2024 时间序列(Time Series)高分论文 - 知乎 (zhihu.com) ICML2024全部论文 icml.cc/virtual/2024/papers.html...

C语言-使用指针数组作为函数参数,实现对10个字符串进行排序
使用指针数组作为函数参数,实现对10个字符串进行排序 1.输入 lisi hahaha hehehe helloa leihoua lisi nihaoa wangwu ajax bureau2.输出 ajax bureau hahaha hehehe helloa leihoua lisi lisi nihaoa wangwu3.程序: #define _CRT_SECURE_NO_WARNING…...

???ABC366:F - Maximum Composition(dp,无序:贪心排序)
问题陈述 给你 NN 个线性函数 f1,f2,…,fNf1,f2,…,fN ,其中 fi(x)AixBifi(x)AixBi . 求由 KK 组成的序列 p(p1,p2,…,pK)p(p1,p2,…,pK) 中 fp1(fp2(…fpK(1)…))fp1(fp2(…fpK(1)…)) 的最大可能值。介于 11 和 NN (含)之间的个不…...

unity项目打包为webgl后应用于vue项目中(iframe模式)的数据交互
参考文章: 1.Unity打包WebGL: 导入Vue 2.unity文档-WebGL:与浏览器脚本交互 3.unity与vue交互(无第三方插件) 目录 一、前期工作1.新建.jslib文件2.新建.cs脚本3. 新建一个Text对象和button按钮对象4.添加脚本空对象UIEvent5.导出unity为w…...

【数据结构与算法 | 图篇】Bellman-Ford算法(单源最短路径算法)
1. 前言 前文的迪杰斯特拉算法不能求解有负边的图的最短路径的问题。而此文的Bellman-Ford可以处理含负权边的图算法,并且能检测出图中是否存在负环(权重和为负数的环). 2. 基本思想 1. 初始化: 对于所有顶点 v ∈ V \ {s}&am…...

Python | Leetcode Python题解之第336题回文对
题目: 题解: class Solution:def palindromePairs1(self, words: List[str]) -> List[List[int]]:# 核心思想--枚举前缀和后缀# 如果两个字符串k1,k2组成一个回文字符串会出现三种情况# len(k1) len(k2),则需要比较k1 k2[::-1]# len(k1…...