当前位置: 首页 > news >正文

[Linux]文件系统

[Linux]文件系统

文件系统是操作系统的一部分,负责组织、存储和管理存储在外部设备上的文件和目录,也就是操作系统管理外设中的文件的策略。本文讲解的是Ext2文件系统。Linux操作系统使用的就是Ext系列的文件系统。

文章目录

  • [Linux]文件系统
    • 了解磁盘结构
      • 磁盘的物理结构
      • 磁盘存储结构
      • 磁盘逻辑结构
    • EXT2文件系统的存储方案
      • inode的具体应用
      • 补充细节
    • 软硬链接
      • 创建软硬链接
      • 软硬链接的区别
      • 软硬链接的使用场景
    • 文件的三个时间

了解磁盘结构

磁盘的物理结构

磁盘是计算机上的唯一的机械设备,作为外设用于存储大量的数据,磁盘内部的物理结构示意图如下:

image-20230714161627226

  • 磁盘(如上图的银色圆盘)-- 由多个盘片组成,每个盘片的每个面都能够存储数据
  • 磁头 – 每个盘片的每个面都有一个磁头,磁头能够在对应的盘面中读写数据

磁盘存储数据的原理: 计算机中的数据本质就是0和1的区别,因此磁盘只需要利用磁性来代表数据的0和1。

磁盘存储结构

image-20230905144406099

磁盘的每个盘片的盘面被划分成多个部分:

  • 磁道: 磁盘表面被分为许多同心圆,每个同心圆称为一个磁道,每个磁道都有一个编号,最外面的是0磁道。
  • 扇区: 每个磁道被划分成若干个扇区,每个扇区的存储容量为512字节,每个扇区都有一个编号。

磁盘以扇区为单位进行数据的存储,一个磁盘文件会占据一个或多个扇区的位置来存储,要想加载磁盘文件到内存中,需要定位到磁盘文件所在的一个或多个扇区。

image-20230714163115337

定位扇区的方法:

  • 定位数据所在的是哪一个盘面 – 也就是选择哪一个对应的磁头。
  • 定位数据在所在盘面的哪一个的磁道。
  • 定位数据在所在磁道中的哪一个扇区。

磁头(Heads)、柱面(Cylinder)(等价于磁道)、扇区(Sector)对应的编号。即可在磁盘上定位所要访问的扇区。这种磁盘数据定位方式叫做 CHS 。

磁盘逻辑结构

磁盘需要抽象成逻辑结构的原因:

  • OS是软件,磁盘是硬件,磁盘作为外设是可能被改变的,为了防止由于外设的改变而导致物理结构寻址方式的失败,OS采用逻辑地址,将逻辑与物理的转换交给中间软件层驱动程序,实现OS与外设的解耦
  • 磁盘存储的基本单位是512字节,OS为了减少IO次数,提高效率,一次IO操作的基本单位是4KB(可调整大小),OS将一次IO的基本单位看作为块,因此需要一套块级别地址进行访问

image-20230905154453166

磁盘的逻辑结构就类似于拉开的磁带,将一个盘片抽象成被拉开的磁带,一圈磁带就类似于一个磁道。逻辑结构示意图如下:

image-20230905194551006

扇区的大小是512字节,而OS一次IO操作的基本单位是4KB,因此OS将一次IO操作的数据抽象成数据块。逻辑结构示意图如下:

image-20230905194510903

OS将整个磁盘最终抽象成了多个连续的数据块,也就是将物理结构转换成了线性逻辑结构,因此OS能够将磁盘看作是有对应下标的数组结构,每个下标指向的是一个数据块,每一个下标也被称作逻辑块地址,简称LBA。OS将磁盘看作是数组结构后,每次IO操作就是找到数据块的首地址,然后从该地址开始读取对应个数的扇区。

EXT2文件系统的存储方案

OS将磁盘看作是由数组结构组织起来的数据块,由于数据块的数量众多,OS将该数组结构划分成多个分区。逻辑结构示意图如下:

image-20230905194607220

将磁盘进行分区后,OS为了更方便的管理,还将每个分区划分成多个分组。逻辑结构示意图如下:

image-20230905195029269

  • 磁盘众多分区中,一般第一个分区存在一个Boot Block区域,该区域存储着OS的开启相关信息,计算机进行开机操作时,会加载磁盘数据,并使用该区域的数据完成开机操作。

将磁盘划分为若干个分组后,OS将一个分组的管理策略运用到每个分组中,实现对整个磁盘的管理。OS的具体管理策略如下:

image-20230905195437760

  • Super Block: 记录该分区文件系统的重要信息,使得操作系统能够正确地使用和管理文件系统。

    • Linux系统采用Ext系列的文件系统。
    • Super Block在各个分组都可能存在,并且统一更新,是为了防止其损坏后,导致整个文件系统无法使用。
  • Group Descriptor Table: 记录改组的详细属性信息。

  • Block Bitmap: 每个bit表示一个Data Blocks中的数据块是否空闲可用,每个bit对应中的一个Data Blocks中的数据块。

  • inode Bitmap: 每个bit表示一个inode是否空闲可用,每个bit对应inode table中的一个inode。

  • inode Table: 记录该组所有文件的索引节点。

    • inode内部的记录的是对应的一个文件的所有属性,由于文件属性的可预见性,一个inode大小为128字节。
    • 每一个inode都有自己的inode编号,inode编号也数据对应文件的属性编号。
    • inode内部记录了对应文件内容存储的数据块编号。
  • Data blocks: 记录了文件的内容。

    • Data blocks区域内部被划分成了若干个大小为4KB的数据块。
    • 一个的文件的内容会根据大小使用若干个数据块。

分组中的以上每个区域都可能会使用若干个数据块。

inode的具体应用

  • Linux操作系统是通过文件的inode编号来区分文件的,inode节点中不记录文件名。

  • 目录作为文件也有自己的inode节点。

  • 目录文件中记录的是该目录下的文件的inode编号和文件名的映射关系。

  • Linux操作系统查询文件的过程:

    1. 在文件的对应目录下,找到对应文件的inode编号。
    2. 在对应目录所在的分区下找到对应inode编号所在的分组,结合inode table,找到文件的inode节点。
    3. 通过inode节点找到对应的数据块。
  • Linux操作系统删除文件的过程:

    1. 在文件的对应目录下,找到对应文件的inode编号。
    2. 在对应目录所在的分区下找到对应inode编号所在的分组,结合inode table,找到文件的inode节点。
    3. 将inode节点中记录的数据块对应在Block Bitmap中的位图置为0。
    4. 将inode节点对应在inode Bitmap中位图置为0。
  • Linux操作系统添加文件的过程:

    1. 在要创建文件所在的目录所在的分组中查询inode bitmap,找到未被使用inode。
    2. 将文件的属性写入新创建的inode。
    3. 将文件名和inode编号的映射关系追加到所处目录的文件数据块中。
  • Linux操作系统修改文件的过程:

    1. 在文件的对应目录下,找到对应文件的inode编号。
    2. 在对应目录所在的分区下找到对应inode编号所在的分组,结合inode table,找到文件的inode节点。如果是空文件会根据写入数据的大小分配相应的数据块,并将数据块对应位图置为1,将数据块信息写入inode。
    3. 将修改后的数据刷新写入到对应的数据块中。
  • Linux使用ls指令时带-i选项就可以查看到文件对应的inode编号:

image-20230906185210904

补充细节

文件的恢复

如果文件被误删后,首先要避免文件操作,以防被删除的文件数据被覆盖,然后通过日志记录等技术,找到被删除的文件对应的inode编号将inode编号对应位图置为1,对应数据块置为1,从而完成文件的恢复。

inode编号寻找对应分组的策略

在一个分区中,每个分组所使用的inode编号是有范围的,通过inode编号所在范围能够快速确定inode所在的分组。

分区和分组的完成

在安装操作系统时,会根据用户指定的各分区大小进行分区的设置,然后对会对每个分区进行格式化,格式化就是操作系统向分区写入文件系统管理信息的。

inode记录对应数据块的策略

inode节点中采用数组记录对应数据块,以至于inode节点的大小得以确定,但是如果数组中的一个数据只能对应一个数据块那么,一个inode节点能指向的数据块是有限的,因此inode节点采用三级索引的策略来映射对应的数据块,将该数组划分成三个部分,每个部分采用不同的索引方式。

  • 直接索引: 数组记录的数据块编号对应的数据块中就是文件内容。

image-20230906194729795

  • 二级索引: 数组记录的编号对应的数据块中记录的是其他数据块的编号,这些被记录在数据块中的数据块编号对应的数据块中存储的是文件内容。

image-20230906200755543

  • 三级索引: 数组记录的编号对应的数据块中记录的是其他数据块的编号,这些被记录在数据块中的数据块编号对应的数据块中存储的也是其他数据块的编号并且这些编号指向存储文件内容的数据块。

image-20230906200729829

inode映射的存在的问题

EXT2存储方案存在一个分组,数据块用完、inode没用完或者inode用完、数据块没用完的问题并且如果出现这种情况是无法解决的。

软硬链接

创建软硬链接

  • 创建软链接: 在Linux系统下ln -s 被链接的文件名 软链接名字指令能够创建软连接。

image-20230906204649180

  • 创建硬链接: 在Linux系统下ln 被链接的文件名 硬链接名字指令能够创建硬连接。

image-20230906204755632

软硬链接的区别

  • 软链接:

    • 软链接有自己的inode编号,是一个独立的文件
    • 软链接中存储的是链接文件的路径信息

    image-20230906205521110

  • 硬链接:

    • 硬链接和链接的文件共用同一个inode编号,硬链接和链接文件使用同一个inode
    • 硬链接创建的本质是在目录下添加一组inode编号和文件名的映射,并且在对应的inode中的引用计数进行+1操作
    • 当inode中引用计数为0代表该文件没有文件名和其inode编号映射,将删除该文件

image-20230906205541812

软硬链接的使用场景

  • 软链接适用于某一文件所在路径比较繁琐,可以不用进入路径或打出路径就可以访问文件,功能类似于Windows系统中的快捷方式。

image-20230906210227330

  • 硬链接使得Linux系统能够使用相对路径进行操作。

image-20230907101923784

实际上每个目录中的.就是一个硬链接,链接是当前目录,.硬链接实现了以相对路径访问当前目录文件的功能。

image-20230907102632778

在目录下创建一个新目录后,Linux系统会为新目录创建一个..硬链接,链接的就是上级目录,..硬链接实现了以相对路径访问上级目录文件的功能。

可以看出一个目录的硬链接数(目录中的..) = 目录下的目录数量 + 2(目录本身和目录中的.):

image-20230907103328715

注意: 用户不能给目录创建硬链接,避免出现路径环路问题,系统自己维护目录硬链接。

文件的三个时间

  • Access 最后访问时间
  • Modify 文件内容最后修改时间
  • Change 属性最后修改时间

stat 文件名查看文件信息,其中就有文件的这三个时间:

image-20230907104607935

访问文件时 ,Access时间就会进行更新:

image-20230907104658713

注意: 在最新的Linux版本中,为了节省IO操作造成的时间浪费,如果只是单纯的查看数据不一定会立刻修改Access时间。

修改文件内容时 ,Modify和Change时间都会进行更新:

image-20230907105102128

修改文件属性时 ,Change时间会进行更新:

image-20230907105256043

相关文章:

[Linux]文件系统

[Linux]文件系统 文件系统是操作系统的一部分,负责组织、存储和管理存储在外部设备上的文件和目录,也就是操作系统管理外设中的文件的策略。本文讲解的是Ext2文件系统。Linux操作系统使用的就是Ext系列的文件系统。 文章目录 [Linux]文件系统了解磁盘结构…...

常见面试题记录

记录下java的常见面试题 文章目录 记录如下 记录如下 记录如下 hashmap原理lock原理synchronized锁优化过程线程状态以及创建方式线程池(执行过程,参数,淘汰策略)jvm(gc优化和OOM)volatile(可见…...

Android 系统源码目录frameworks/base/packages和packages/apps下的APP区别

概要 在 Android Open Source Project (AOSP) 源代码中,frameworks/base/packages 和 packages/apps 目录都包含 Android 系统中的应用程序,但它们在性质和用途上有一些区别: 1,frameworks/base/packages frameworks/base 目录…...

2023年数维杯数学建模A题河流-地下水系统水体污染研求解全过程文档及程序

2023年数维杯数学建模 A题 河流-地下水系统水体污染研 原题再现: 河流对地下水有着直接地影响,当河流补给地下水时,河流一旦被污染,容易导致地下水以及紧依河流分布的傍河水源地将受到不同程度的污染,这将严重影响工…...

Java测试(10)--- selenium

1.定位一组元素 (1)如何打开本地的HTML页面 拼成一个URL :file: /// 文件的绝对路径 import os os.path.abspath(文件的绝对路径) (2)先定位出同一类元素(tag name,name&…...

【文末送书】Matlab科学计算

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和技术。关…...

ElementUI浅尝辄止30:PageHeader 页头

如果页面的路径比较简单&#xff0c;推荐使用页头组件而非面包屑组件。 1.如何使用&#xff1f; <el-page-header back"goBack" content"详情页面"> </el-page-header><script>export default {methods: {goBack() {console.log(go bac…...

[Qt]基础数据类型和信号槽

文章目录 1. Qt基本结构1.1 Qt本有项目1.1.1 项目文件&#xff08;.pro&#xff09;1.1.2 main.cpp1.1.3 mainwindow.ui1.1.4 mainwindow.h1.1.5 mainwindow.cpp 1.2 Qt中的窗口类1.2.1基础窗口类1.2.2 窗口的显示 1.3 内存回收 2. Qt中的基础数据类型2.1 基础类型2.2 log输出2…...

UIStackView入门使用两个问题

项目中横向一排元素&#xff0c;竖向一排元素&#xff0c;可以使用UIStackView。UIStackView的原理不做介绍&#xff0c;这里主要讲两个初次使用容易出现的两个问题。 首先创建一个stackview -(UIStackView*)titleStackView{if(_titleStackView nil){_titleStackView [UISta…...

【Sentinel】Sentinel与gateway的限流算法

文章目录 1、Sentinel与Hystrix的区别2、限流算法3、限流算法对比4、Sentinel限流与Gateway限流 1、Sentinel与Hystrix的区别 线程隔离有两种方式实现&#xff1a; 线程池隔离&#xff08;Hystrix默认采用&#xff09;信号量隔离&#xff08;Sentinel默认采用&#xff09; 服…...

python实现对excel表中的某列数据进行排序

如下需要对webCms中的B列数据进行升序排序&#xff0c;且不能影响到其他列、工作表中的数据和格式。 import pandas as pd import openpyxl from openpyxl.utils.dataframe import dataframe_to_rows# 读取 Excel 文件 file_path 1.xlsx sheet_name webCms# 读取 Excel 文件并…...

CMS指纹识别

一.什么是指纹识别 常见cms系统 通过关键特征&#xff0c;识别出目标的CMS系统&#xff0c;服务器&#xff0c;开发语言&#xff0c;操作系统&#xff0c;CDN&#xff0c;WAF的类别版本等等 1.识别对象 1.CMS信息&#xff1a;比如Discuz,织梦&#xff0c;帝国CMS&#xff0…...

STL- 常用算法

概述: 算法主要是由头文件<algorithm> <functional> <numeric>组成。 <algorithm>是所有STL头文件中最大的一个&#xff0c;范围涉及到比较、 交换、查找、遍历操作、复制、修改等等 <numeric>体积很小&#xff0c;只包括几个在序列上面进行简…...

苹果铃声怎么设置?3招教你设置个性化铃声!

苹果手机因其颜值、性能与生态吸引了一大批粉丝用户。在拿到新手机后&#xff0c;大家第一时间就是给手机设置好听的铃声。那么&#xff0c;苹果铃声怎么设置呢&#xff1f;手机铃声能设置成自己喜欢的歌曲吗&#xff1f;当然可以了&#xff01;本文将给大家介绍3种轻松设置苹果…...

LRTimelapse 6 for Mac(延时摄影视频制作软件)

LRTimelapse 是一款适用于macOS 系统的延时摄影视频制作软件&#xff0c;可以帮助用户创建高质量的延时摄影视频。该软件提供了直观的界面和丰富的功能&#xff0c;支持多种时间轴摄影工具和文件格式&#xff0c;并具有高度的可定制性和扩展性。 LRTimelapse 的主要特点如下&am…...

数据结构和算法(4):栈与队列

栈 ADT 及实现 栈&#xff08;stack&#xff09;是存放数据对象的一种特殊容器&#xff0c;其中的数据元素按线性的逻辑次序排列&#xff0c;故也可定义首、末元素。 尽管栈结构也支持对象的插入和删除操作&#xff0c;但其操作的范围仅限于栈的某一特定端。 也就是说&#xf…...

pdf怎么转换成dwg格式?简单转换方法分享

当我们需要在CAD中编辑PDF文件中的向量图形时&#xff0c;将PDF转换成DWG格式是一个非常好的选择。因为PDF是一种非常流行的文档格式&#xff0c;很多时候我们会接收到PDF文件&#xff0c;但是PDF文件中的向量图形无法直接在CAD中编辑。而将PDF转换成DWG格式后&#xff0c;就可…...

uniapp使用H5实现预览pdf文件

下载后把压缩包解压到自己的项目的static文件夹下的pdf文件下&#xff0c;如图 新建一个文件名为filePreview.vue <template><view><web-view :src"allUrl"></web-view></view> </template><script>export default {dat…...

Studio 3T for MongoDB的介绍及语法简单介绍

用法介绍 Studio 3T是一款用于MongoDB数据库管理和开发的图形化工具&#xff0c;它提供了许多功能来简化MongoDB的操作和开发过程。以下是一些常见的Studio 3T用法&#xff1a; 连接到MongoDB服务器&#xff1a; 打开Studio 3T并创建一个新连接配置。输入MongoDB服务器的主机名…...

MySQL数据库——存储引擎(1)-MySQL体系结构、存储引擎简介

目录 MySQL体系结构 连接层 服务层 引擎层 存储层 存储引擎简介 概念 语句 演示 下面开始学习进阶篇的第一个内容——存储引擎 分为四点学习&#xff1a; MySQL体系结构存储引擎简介存储引擎特点存储引擎选择 MySQL体系结构 连接层 最上层是一些客户端和链接服务&am…...

211. 添加与搜索单词 - 数据结构设计

211. 添加与搜索单词 - 数据结构设计 class WordDictionary { public:struct Node{Node *node[26];bool is_end;Node(){is_endfalse;for(int i0;i< 26;i){node[i]NULL;}}};Node *root;WordDictionary() {root new Node();}void addWord(string word) {auto p root;for(aut…...

【深度学习】You Only Segment Once: Towards Real-Time Panoptic Segmentation,YOSO全景分割

论文&#xff1a;https://arxiv.org/abs/2303.14651 代码&#xff1a;https://github.com/hujiecpp/YOSO 文章目录 Abstract1. Introduction2. Related Work3. Method3.1. Task Formulation3.2. Feature Pyramid Aggregator3.3. Separable Dynamic Decoder 4. Experiments4.1. …...

ping与Traceroute是如何工作的

ping 是基于 ICMP 协议工作的。ICMP 全称 Internet Control Message Protocol&#xff0c;就是互联网控制报文协议。 ICMP 报文是封装在 IP 包里面的。因为传输指令的时候&#xff0c;肯定需要源地址和目标地址。它本身非常简单。 ICMP 报文有很多的类型&#xff0c;不同的类型…...

CentOS Python环境搭建

安装依赖 yum install -y libffi-devel wget gcc make zlib-devel openssl openssl-devel ncurses-devel openldap-devel gettext bzip2-devel xz-devel下载安装包 wget "https://www.python.org/ftp/python/3.9.10/Python-3.9.10.tar.xz" 编译安装 # 3.1、解压安装包…...

亚马逊云科技与伊克罗德推出AI绘画解决方案——imAgine

在过去的数月中&#xff0c;亚马逊云科技已经推出了多篇介绍如何在亚马逊云科技上部署Stable Diffusion&#xff0c;或是如何结合Amazon SageMaker与Stable Diffusion进行模型训练和推理任务的内容。 为了帮助客户快速、安全地在亚马逊云科技上构建、部署和管理应用程序&#x…...

机器学习课后习题 --- 逻辑回归

&#xff08;一&#xff09;单选题 1.一监狱人脸识别准入系统用来识别待进入人员的身份&#xff0c;此系统一共包括识别4种不同的人员&#xff1a;狱警&#xff0c;小偷&#xff0c;送餐员&#xff0c;其他。下面哪种学习方法最适合此种应用需求&#xff1a; A:二分类问题 …...

软件设计师学习笔记9-进程调度

目录 1. PV操作 1.1进程的同步与互斥 1.1.1互斥 1.1.2同步 1.2 PV操作 1.2.1信号量 1.2.2 PV操作的概念 2.信号量与PV操作 2.1 PV操作与互斥模型 2.2 PV操作与同步模型 2.3 互斥与同步模型结合 3.前趋图与PV操作 1. PV操作 1.1进程的同步与互斥 1.1.1互斥 互斥&…...

09:STM32-------USART串口通信+串口数据包

目录 一:串口协议 1:通信接口 2:串口通信 3:硬件电路 4:电平标准 5:串口参数及其时序 二:USART介绍 1:简历 2:USART框图 3:USART的基本结构 4:数据帧 5: 波特率发生器 6:数据模式 三:案例 A:串口发送--单发送 1:连接图 2:函数介绍 3:代码 B:串口发送接收 1…...

“安全即服务”为网络安全推开一道门

8月30日&#xff0c;三六零&#xff08;下称“360”&#xff09;集团发布了2023年半年报&#xff0c;其中安全业务第二季度收入6.54亿元&#xff0c;同比增长98.76%&#xff0c;环比增长157.16%&#xff0c;安全第二增长曲线已完全成型&#xff01;特别值得一提的是&#xff0c…...

vue3的生命周期

1.vue3生命周期官方流程图 2.vue3中的选项式生命周期 vue3中的选项式生命周期钩子基本与vue2中的大体相同&#xff0c;它们都是定义在 vue实例的对象参数中的函数&#xff0c;它们在vue中实例的生命周期的不同阶段被调用。生命周期函数钩子会在我们的实例挂载&#xff0c;更新…...

宝塔面板wordpress多站点/互联网营销师考试

在Ubuntu上实现局域网共享文件夹 如果你的系统是Ubuntu 14.04、14.10或12.04&#xff0c;有两个方法可以使你通过局域网在搭载Windows或其他Linux的电脑上共享本地文件。 对局域网中的每个用户提供无密码共享 仅限特定访问&#xff0c;提供文件夹密码保护 这篇文章包括两种方法…...

宁夏电力建设工程公司外部网站/青岛seo排名收费

[ 中关村在线 原创 ] 有很多的朋友们在问我&#xff1a;“交换机和路由器到底有什么区别”&#xff0c;其实这个不是什么很难理解的事情&#xff0c;这两个设备的区别主要在功能上区别大了些&#xff0c;那么我们最好先了解一下什么是交换机和什么是路由器的最基本的常识。现在…...

公司品牌策划设计/企业网站seo案例

Linux如何查看系统及硬件信息一、查看系统信息1.查看当前操作系统发行版信息&#xff1a;# cat /etc/issueWelcome to SUSE Linux Enterprise Server 11 (x86_64) - Kernel \r (\l).2、查看当前操作系统内核信息&#xff1a;# uname -aLinux Africa 2.6.27.19-5-default #1 SMP…...

柳州正规网站制作/seo常规优化

错误信息&#xff1a; Failed to load resource: net::ERR_INCOMPLETE_CHUNKED_ENCODING 环境现象 chrome chrome浏览器下&#xff0c;之前访问的界面是什么样子&#xff0c;访问出错的这个网址后&#xff0c;界面依然还是什么样子&#xff0c;只是不响应鼠标和键盘事件了&…...

网站设计 工作/完美日记网络营销策划书

原文出处&#xff1a;https://segmentfault.com/a/1190000010371988 看了一下这篇文章&#xff0c;自己也手敲了一遍 //1、 立即执行函数 作用&#xff1a;将var变量的作用域限制于函数内&#xff0c;这样可以避免命名冲突。注意&#xff1a;避免报错 在开头加分号;(function…...

wordpress申请软件著作/商城推广

需求场景 Bitmap 对于一些特定类型的计算非常有效。 假设现在我们希望记录自己网站上的用户的上线频率&#xff0c;比如说&#xff0c;计算用户A上线了多少天&#xff0c;用户B上 线了多少天&#xff0c;诸如此类&#xff0c;以此作为数据&#xff0c;从而决定让哪些用户参加b…...