Linux操作系统学习(进程地址空间)
文章目录
- 进程地址空间
- 奇怪的现象
- 什么是进程地址空间???
- 虚拟地址是如何与物理内存联系的?
- 页表是什么呢?
- 为什么要有页表和地址空间,让进程直接访问内存不行吗?
- 现象解释
进程地址空间
在我们学习其他 编程语言时对于内存分布的概念是这样的
在Linux环境下可以验证一下。如下图所示:
奇怪的现象
我们知道fork创建一个子进程,子进程会继承父进程的代码和数据并以父进程为模板来创建自己,那么子进程的码中的变量地址也是一样的吗?
下面来验证一下:
int main()
{if(fork() == 0){int count = 5;while(count){cout << "child-> " << " count: " << count << " getval: " << getval << " &getval: " << &getval << endl;count--;sleep(2);if(count == 3){cout << "********** getval = 50 **********" << endl; getval = 50;} }}else if(fork() > 0){while(1){cout << "parent-> " << " getval : " << getval << " &getval:" << &getval << endl;sleep(2);} }return 0;
}
fork创建的子进程中,在不改变父进程的代码时他们共享的是同一份代码(继承),当子进程发生改变时,会发生写实拷贝,才会将父进程的内容复制一份给子进程
子进程和父进程因为写实拷贝值不一样,但是为什么地址还是一样的呢???
先说结论:
- 变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
- 但地址值是一样的,说明,该地址绝对不是物理地址!
- 在Linux地址下,这种地址叫做 虚拟地址
- 我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理 OS必须负责将 虚拟地址 转化成 物理地址 。
什么是进程地址空间???
进程地址空间其实是操作系统给进程画的一个大饼,让每一个进程都认为自己是独占操作系统中的所有资源(独占4GB)
我们知道每个进程都会有一个task_struct(PCB)用来描述这个进程,多个进程的PCB又会组织成数据结构(队列、链表),再由OS管理这个数据结构就可以间接管理到进程。
而在每个进程创建时都会创建一个进程地址空间struct mm_struct{},同时在PCB中创建一个mm_struct的指针,也就可以对每个进程的地址空间管理了。
struct mm_struct:就是操作系统给每个进程创建一个结构体,用来记录每个进程中各个区域的开始位置起始位置等等。
如下图所示:
虚拟地址是如何与物理内存联系的?
这里又引入一个新的概念 “页表”
页表是什么呢?
页表就是记录虚拟地址对应的物理地址的一张映射表,由一些映射算法映射到物理地址上(类似哈希表)
页表还会存储各个区域划分的属性(读/写权限等等)
为什么要有页表和地址空间,让进程直接访问内存不行吗?
进程直接访问内存不是不可以,而是会有很多隐患,弊远远大于利,这里简单分为三个问题来解释:
1. 假如内存中加载了进程A、B、C,进程B的代码有越界BUG,而编译器不检查越界,就会导致进程B的的代码可以访问到进程A或进程C并修改
例如一些恶意进程,在我们手机中,微信是进程A,支付宝是进程B,还有个恶意进程C;由于中间没有任何干涉C进程直接访问内存,恶意读取进程A、B的数据如支付密码、登陆密码、账户余额等等,严重威胁信息安全
在进程添加页表、进程地址空间,由操作系统管理;而页表中的进程地址与物理地址的映射转换是由操作系统完成的,也就可以由操作系统检查页表映射位置是否匹配,权限是否匹配等问题
例如:
当进程地址中越界了,操作系统发现页表中没有对应到映射的物理地址,就会挂掉它
字符量区是只读属性的,当进程访问到常量区发生修改时,操作系统发现页表对应的物理地址是只读属性,就会挂掉该进程
2. 假如task_struct直接向内存申请了10000个字节空间,但是他没有立刻全部使用只是使用了小部分,当别人的进程申请空间时,发现空间不够了
站在操作系统的角度,如果空间申请后马上给到进程就意味着你闲置的空间,本来可以给别的进程使用,但是现在你不用也不许给别人用,空间浪费了。
2.而操作系统管理页表和进程地址空间就可以改善这个问题:
当进程申请空间时有可能是这样的:
申请空间较小,操作系统直接给它;
申请空间较大,操作系统不立马给,只是先记在页表并给进程回话 “你的内存申请我通过了”,等到进程读或写时操作系统才会去在页表中建立映射关系
例如当内存满了的时候:
进程是不知道他满了的,他申请内存时先记在了页表,操作系统只是答应它但没有马上给他;
等到进程去访问地址时,操作系统会执行一些相关的内存管理算法,把内存的整块的数据移至磁盘,把移走的数据内存地址放在页表与进程空间地址建立映射(或者在磁盘给他分一块空间)
进程申请空间,操作系统同意,但是不一定马上给他或者给他的是磁盘空间,当进程访问地址时才会去在页表中建立映射关系。这些进程都是不知道的,他只负责访问自己的虚拟地址标号,申请时记录在页表的虚拟地址部分 ,剩下的都由操作系统管理。
(类似于酒店房间预定)
- CPU怎么知道代码的第一句在哪?(指main第一句)
有了进程地址空间和页表,可以规定把进程的代码中第一句放在页表指定位置(mian的第一句)
那么每个进程都把他们代码第一句放在同一个进程地址空间(虚拟地址是连续的,只需要记第一个位置即可),CPU只去读取每个进程页表的0X1234即可找到每个进程的代码第一句的位置,剩下的工作交给操作系统和页表
(前面介绍的PCB上下文数据,PCB运行队列的出口位置,把top的PCB对应的进程的代码和数据加载到CPU中执行)
同时也可以得出:每个进程的数据和代码可以加载到内存的任意位置,大大减少了管理内存的负担
总结 :
- 没有操作系统就算有页表和进程地址空间也做不到上面的改善,因为只有被管理者,没有管理者
- 而只有操作系统没有页表和进程地址空间也无法管理这些进程与内存之间的关系,因为只有管理者,没有被管理者
- 通过添加一层软件层(OS),完成有效的对进程操作内存进行风险管理,保护物理内存以及各个进程的数据安全
- 将内存申请和内存使用的概念在时间上划分清楚,通过虚拟地址空间来屏蔽底层申请内存的过程,完成进程读写内存和OS进行内存管理的操作,达到软件层面的分离
- 站在CPU和应用层,统一了每个进程的“4GB空间”,使每个空间区域的相对位置确定
- 同时做了空间连续化处理,方便使用。
现象解释
回到最开始的代码就可以解释了为什么改变值后地址还是一样的:
当fork创建完后,子进程继承父进程的代码,此时他们共享的是同一份,等于页表中存放的地址相同
而当子进程发生改变,此时会发生缺页中断和写实拷贝:
先暂停子进程,再把父进程在内存中的代码数据复制一份给子进程,之后子进程立马修改对应的数据,页表及时子进程对应的更新物理地址部分,修改完成后再继续运行。
这时子进程和父进程才各自读取各自的数据
所以当不发生改变时共享一份资源,发生改变时在复制一份给子进程,减少了资源浪费
所以进程不仅是代码和数据,更重要的是操作系统管理 —— 由数据描述的进程而组织成的数据结构(PCB进程数据块组成的进程数据结构 )
struct task_struct{mm_struct* address、页表等等};都是在描述一个进程,把每个进程的task_struct组成队列,再由操作系统管理,也就等于管理进程
再次证明管理的本质是:“先描述,在组织”
相关文章:

Linux操作系统学习(进程地址空间)
文章目录进程地址空间奇怪的现象什么是进程地址空间???虚拟地址是如何与物理内存联系的?页表是什么呢?为什么要有页表和地址空间,让进程直接访问内存不行吗?现象解释进程地址空间 在我们学习其…...
【排序】快速排序实现
目录 一、快速排序是什么? 二、左右指针法 1.实现原理 2.代码如下: 三、挖坑法 1.实现原理 2.代码如下: 四、前后指针法 1.实现原理 2.代码如下: 五、三数取中 1.实现思想 2.代码如下: 3.使用方法 总结…...

YOLOv5/v7 Flask Web 车牌识别 | YOLOv7 + EasyOCR 实现车牌识别
YOLOv7 Flask Web 车牌识别图片效果展示 本篇博文只包含源码以及使用方式,目前不同提供详细开发教程。 YOLOv7 Flask Web 车牌识别视频效果展示 YOLOv7 + EasyOCR 实现车牌识别 什么是Flask? 简介 Flask是一个轻量级的可定制框架,使用Python语言编写,较其他同类型框架更…...

【Opencv实战】几十年前的Vlog火了:黑白老照片如何上色?这黑科技操作一定要知道,复原度超高,竟美的出奇~(图像修复神级代码)
导语 哈喽大家好呀!我是每天疯狂赶代码的木木子吖~情人节快乐呀! 所有文章完整的素材源码都在👇👇 粉丝白嫖源码福利,请移步至CSDN社区或文末公众hao即可免费。 我们都知道,有很多经典的老照片…...

React源码分析(一)Fiber
前言 本次React源码参考版本为17.0.3。 React架构前世今生 查阅文档了解到, React16.x是个分水岭。 React15及之前 在16之前,React架构大致可以分为两层: Reconciler: 主要职责是对比查找更新前后的变化的组件;R…...

小樽 C++指针—— (壹) 指针变量
(壹) 指针变量 一、指针的概念与定义 二、给指针变量p赋值 三、指针变量的的、-运算 四、无类型指针 五、多重指针 C (壹) 指针变量 小明想把从李华家借来的书——《CCF中学生计算机程序设计》还给李华,但李华不在家,于是把书放到书架第3层的最右边…...

java 代码块 万字详解
概述 : 特点 : 格式 : 情景 : 细节 : 演示 : 英文 : //v,新版编辑器无手动添加目录的功能,PC端阅读建议通过侧边栏进行目录跳转;移动端建议用PC端阅读。😂一、概述 :代码块,也称为初始化块,属于类中的成员&…...

杂项-图片隐写
图片隐写的常见隐写方法: 三基色:RGB(Red Green Blue) 图片文件隐写 1.Firework 使用winhex打开文件时会看到文件头部中包含firework的标识,通过firework可以找到隐藏图片。 使用场景:查看隐写的图片文件…...

【高性价比】初学者入门吉他值得推荐购买的民谣单板吉他品牌—VEAZEN费森吉他
“在未知的世界里,我们是一群不疲不倦的行者,执念于真善美,热衷于事物的极致。我们抽丝剥茧,不断地打败自己,超越自己,我们无所畏惧终将成为巨人。”这是VEAZEN吉他官网首页上很明显的一段话,也…...

2023年浙江交安安全员考试题库及答案
百分百题库提供交安安全员考试试题、交安安全员考试真题、交安安全员证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 50.根据《建设工程安全生产管理条例》第65条规定,施工单位有下列()行…...
【新】华为OD机试 - 跳格子(Python)
跳格子 题目 地上共有 N 个格子,你需要跳完地上所有的格子, 但是格子间是有强依赖关系的,跳完前一个格子后, 后续的格子才会被开启,格子间的依赖关系由多组 steps 数组给出, steps[0] 表示前一个格子, steps[1] 表示 steps[0] 可以开启的格子: 比如 [0,1] 表示从跳完第…...
乡村能做社区团购吗?怎么做?我走访调查后发现机会很大
乡村能做社区团购吗?怎么做?我走访调查后发现机会很大#深度触网 #社区团购 #乡村振兴##乡村旅游##县域经济##市场经济##农文旅产业振兴研究院#乡村旅游能带动农产品加工业、服务业、商贸业等相关联产业的发展 乡村能做社区团购吗?怎么做&…...

态路小课堂丨下一代数据中心100G接口第二篇——SFP-DD封装
100G光模块根据封装模式可分为QSFP28、CXP、CFP、CFP2、FCP4、DSFP和SFP-DD等。态路小课堂之前已经大量介绍了相关内容(。 态路小课堂丨下一代数据中心100G接口——DSFP态路小课堂丨100G解决方案-425G NRZ光模块态路小课堂丨什么是100G QSFP28单波光模块?…...
状态栏和导航栏高度获取
/*** 获取导航栏高度*/public static int getNavigationBarHeight(Context context){int navigationBarHeight 0;int resourceId context.getResources().getIdentifier("navigation_bar_height", "dimen", "android")if (resourceId > 0) {…...
插曲:第一桶金 1w 的来由
因为前天跟同事聊天,发现有个比较严重的认知,就是关于赚钱思维。 同事反馈说工作十来年,却没有接过私活,这里话分两头,有可能私 活钱少,但他给我的理由是:私活太麻烦,有时候不敢接&a…...
中国甲基异丁基甲醇行业头部企业市场占有率及排名调研报告
内容摘要 本文调研和分析全球甲基异丁基甲醇发展现状及未来趋势,核心内容如下: (1)全球市场总体规模,分别按销量和按收入进行了统计分析,历史数据2018-2022年,预测数据2023至2029年。 …...

streamlit自定义组件教程和组件开发环境配置
About create your own component: you can follow this tutorial streamlit tutorial 重要!以下步骤都是在教程的基础上更改的。这个教程做的很棒。 Component development environment configuration: 根据文章 https://streamlit-com…...

Windows CMD常用命令
目录 【打开CMD命令】 【网络测试命令】 ipconfig------查看本机网卡信息 ping------测试网络是否通畅 tracert------追踪路由,也可以用来查看网络连通性 telnet------查看目的主机ip的端口号是否开放 tcping------查看目的主机ip的端口号是否开放 【关于路…...

ChIP-seq 分析:数据比对(3)
读取 reads(二者含义相同,下文不做区分)1. ChIPseq reads 比对 在评估读取质量和我们应用的任何读取过滤之后,我们将希望将我们的读取与基因组对齐,以便识别任何基因组位置显示比对读取高于背景的富集。 由于 ChIPseq…...
并非从0开始的c++之旅 day2
并非从0开始的c之旅 day2一、变量1、 变量名的本质二、程序的内存分区模型1、内存分区运行之前运行之后三、栈区注意事项四、堆区1、堆区使用2、堆区注意事项五、全局变量静态变量1、静态变量2、全局变量六、常量1、全局const常量2、局部const常量七、字符串常量一、变量 既能…...

MongoDB学习和应用(高效的非关系型数据库)
一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
数据链路层的主要功能是什么
数据链路层(OSI模型第2层)的核心功能是在相邻网络节点(如交换机、主机)间提供可靠的数据帧传输服务,主要职责包括: 🔑 核心功能详解: 帧封装与解封装 封装: 将网络层下发…...
VTK如何让部分单位不可见
最近遇到一个需求,需要让一个vtkDataSet中的部分单元不可见,查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行,是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示,主要是最后一个参数,透明度…...
leetcodeSQL解题:3564. 季节性销售分析
leetcodeSQL解题:3564. 季节性销售分析 题目: 表:sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战
“🤖手搓TuyaAI语音指令 😍秒变表情包大师,让萌系Otto机器人🔥玩出智能新花样!开整!” 🤖 Otto机器人 → 直接点明主体 手搓TuyaAI语音 → 强调 自主编程/自定义 语音控制(TuyaAI…...
HTML前端开发:JavaScript 常用事件详解
作为前端开发的核心,JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例: 1. onclick - 点击事件 当元素被单击时触发(左键点击) button.onclick function() {alert("按钮被点击了!&…...
【JavaSE】绘图与事件入门学习笔记
-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角,以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向,距离坐标原点x个像素;第二个是y坐标,表示当前位置为垂直方向,距离坐标原点y个像素。 坐标体系-像素 …...
爬虫基础学习day2
# 爬虫设计领域 工商:企查查、天眼查短视频:抖音、快手、西瓜 ---> 飞瓜电商:京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空:抓取所有航空公司价格 ---> 去哪儿自媒体:采集自媒体数据进…...

项目部署到Linux上时遇到的错误(Redis,MySQL,无法正确连接,地址占用问题)
Redis无法正确连接 在运行jar包时出现了这样的错误 查询得知问题核心在于Redis连接失败,具体原因是客户端发送了密码认证请求,但Redis服务器未设置密码 1.为Redis设置密码(匹配客户端配置) 步骤: 1).修…...