编译与链接------《程序员的自我修养》
本篇整理于《程序员的自我修养》一书中编译与链接相关知识,整理的目的是为了更加深入的了解编译于链接的更多底层知识,面对程序运行时种种性能瓶颈我们束手无策。我们看到的是这些问题的现象,但是却很难看清本质,所有这些问题的本质就是软件运行背后的机理及支撑软件运行的各种平台和工具,如果能够深入了解这些机制,那么解决这些问题就能够游刃有余,收放自如了。
- 1.首言:
- 2.程序的翻译环境和执行环境
- 3.翻译环境中被隐藏的部分
- 3.1编译本身也分为几个阶段:
- ①预编译
- ②编译
- ③汇编
- ④链接
- ④.Ⅰ重定位
- ④.Ⅱ 符号引用---链接
- ④.Ⅲ 理解总结:
- 4.运行环境
- 5.总结:
1.首言:
对于平常的应用程序开发,我们很少需要关注编译和链接过程,因为通常的开发环境
都是流行的集成开发环境(IDE), 比如Visual Studio、Delphi 等。这样的IDE一般都将编
译和链接的过程.“一步完成,通常将这种编译和链接合并到一起的过程称为构建(Build)。
即使使用命令行来编译-一个源代码文件,简单的一句“gcchello.c"命令就包含了非常复
杂的过程。
IDE和编译器提供的默认配置、编译和链接参数对于大部分的应用程序开发而言已经
足够使用了。但是在这样的开发过程中,我们往往会被这些复杂的集成工具所提供的强大
功能所迷惑,很多系统软件的运行机制与机理被掩盖,其程序的很多莫名其妙的错误让我
们无所适从,面对程序运行时种种性能瓶颈我们束手无策。我们看到的是这些问题的现象,
但是却很难看清本质,所有这些问题的本质就是软件运行背后的机理及支撑软件运行的各
种平台和工具,如果能够深入了解这些机制,那么解决这些问题就能够游刃有余,收放自
如了。
2.程序的翻译环境和执行环境
在ANSI(标准) C的任何一种实现中,存在两个不同的环境。
- 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
- 第2种是执行环境,它用于实际执行代码。
3.翻译环境中被隐藏的部分
我们通常说源文件编译链接生成可执行程序:
- 1.组成一个程序的每个源文件通过编译过程分别转换成目标代码也叫目标文件(object code)。
- 2.每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 3.链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人 的程序库,将其需要的函数也链接到程序中。
3.1编译本身也分为几个阶段:
而这生成可执行程序就包括了这四个步骤:预编译,编译,汇编,链接。
①预编译
预编译阶段做了什么?
首先产生一个test.i文件
首先是源代码文件hello.c和相关的头文件,如stdio.h等被预编译器cpp预编译成一-个i
文件。对于C++程序来说,它的源代码文件的扩展名可能是.cpp或.cxx,头文件的扩展名可
能是.hpp,而预编译后的文件扩展名是.i。第一步 预编译的过程相当于如下命令(-E表示只
进行预编译):
$gcc -E hello.c -o hello. i
预编译过程主要处理那些源代码文件中的以“#”开始的预编译指令。
- 将所有的“#define"删除,并且展开所有的宏定义。
- 处理所有条件预编译指令,比如“#if”、 “#ifdef"、 “#elif" “#else"、 “#endif"。
- 处理“#include"预编译指令,将被包含的文件插入到该预编译指令的位置。注意,这
个过程是递归进行的,也就是说被包含的文件可能还包含其他文件。 - 删除所有的注释“//” 和“/ /”。
- 添加行号和文件名标识,比如#2“hello.c"2,以便于编译时编译器产生调试用的行号
- 信息及用于编译时产生编译错误或警告时能够显示行号。 保留所有的#pragma编译器指令,因为编译器须要使用它们。
②编译
编译阶段做什么?
生成一个test.s文件
-------把C语言代码翻译成汇编代码
会进行:
语法分析
词法分析——————更详细的请看《程序员的自我修养》一书
语义分析
重要:【符号汇总】–符号就是全局变量,函数
会将这些符号记录下来。
编译过程就是把预处理完的文件进行–系列词法分析、语法分析、语义分析及优化后生
产相应的汇编代码文件,这个过程往往是我们所说的整个程序构建的核心部分,也是最复杂的部分
③汇编
汇编阶段做什么?
生成一个test.o文件—目标文件
1.把汇编代码翻译成二进制指令存放到目标文件
2.形成符号表—会将符号给个地址,形成符号表
汇编器是将汇编代码转变成机器可以执行的指令,每一个汇编语句几乎都对应-条机器
指令。所以汇编器的汇编过程相对于编译器来讲比较简单,它没有复杂的语法,也没有语义,
也不需要做指令优化,只是根据汇编指令和机器指令的对照表一-翻译就可以了 ,“汇编”
这个名字也来源于此。上面 的汇编过程我们可以调用汇编器as来完成:
$as he11o.s -0 he1l1o.o
④链接
链接通常是-一个让人比较费解的过程,为什么汇编器不直接输出可执行文件而是输出一
个目标文件呢?链接过程到底包含了什么内容?为什么要链接?
我们先看下 这个问题,我们创建3个.c文件
经过编译器这个个步骤以后,每个源代码终于被编译成了目标代码。但是test.o这个目标代码中有-一个问
题是:a和b的地址还没有确定。如果我们要把目标代码使用汇编器编译成真正能
够在机器_上执行的指令,那么a和b的地址应该从哪儿得到呢?如果a和b
定义在跟上面的源代码同一个编译单元里面,那么编译器可以为a和b分配空间,
确定它们的地址:那如果是定义在其他的程序模块呢?
这个看似简单的问题引出了我们一一个很大的话题:目标代码中有变量定义在其他模块,
该怎么办?事实上,定义其他模块的全局变量和函数在最终运行时的绝对地址都要在最终链
接的时候才能确定。所以现代的编译器可以将一个源代码文件编译成一个未链接的目标文
件,然后由链接器最终将这些目标文件链接起来形成可执行文件。让我们带着这个问题,走
进链接的世界。
④.Ⅰ重定位
由于在编译目标文件test.0的时候,编译器并不知道变量a,b的目标地址,所以编译器在没
法确定地址的情况下,将这条mov指令的目标地址置为0,等待链接器在将目标文件test.0与a.o和b.o
链接起来的时候再将其修正。我们假设test.o和a.o,b.o链接后,变量的地址确定下来为0x 1000,
0x1001,那么链接器将会把这个指令的目标地址部分修改成0x1000和0x1001这个地址修正的过程也被叫做
重定位(Relocation)
重定位所做的就是给程序中每个这样的绝对地址引用的位置“打补丁”,使它们指向正确的地址。
④.Ⅱ 符号引用—链接
函数访问须知道目标函数的地址,变量访问也须知道目标变量的地址,所以
这两种方式都可以归结为一种方式, 那就是模块间符号的引用。模块间依靠符号来通信类似
于拼图版,定义符号的模块多出一块区域,引用该符号的模块刚好少了那一块区域, 两者一
拼接刚好完美组合(见图2-7)。这个模块的拼接过程就:链接(Linking)。
简单来讲就是 在编译过程中每个模块会进行符号汇总,然后汇编过程会给每个符号定位个地址,这个地址要看该模块是否分配了,如果没有分配那就为空地址。
最后链接的目的就是将不同模块的符号的地址重定位,将符号的地址统一,使程序可以执行。
④.Ⅲ 理解总结:
编译和链接过程也并非想象中的那么复杂,它还是一个比较容易理解的概念。
比如我们在程序模块main.c中使用另外一个模块Add.c中的函数add()。我们在main.c模块中
每–处调用add的时候都必须确切知道add这个函数的地址,但是由于每个模块都是单独编
译的,在编译器编译main.c的时候它并不知道add函数的地址,所以它暂时把这些调用add
的指令的目标地址搁置,等待最后链接的时候由链接器去将这些指令的目标地址修正。如果
没有链接器,须要我们手工把每个调用add的指令进行修i正,则填入正确的add函数地址。
当Add.c模块被重新编译,add 函数的地址有可能改变时,那么我们在main.c中所有使用到
add的地址的指令将要全部重新调整。这些繁琐的工作将成为程序员的噩梦。
使用链接器,你可以直接引用其他模块的函数和全局变量而无须知道它们的地址,因为链接器在链接的时
候,会根据你所引用的符号add, 自动去相应的Add.c模块查找add的地址,然后将main.c
模块中所有引用到add的指令重新修n正,让它们的目标地址为真正的add函数的地址。这就
是静态链接的最基本的过程和作用。
总结:
4.运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。 - 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回
地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程
一直保留他们的值。 - 终止程序。正常终止main函数;也有可能是意外终止。
5.总结:
在本篇中, 我们首先回顾了从程序源代码到最终可执行文件的4个步骤:预编译、编
译、汇编、链接,分析了它们的作用及相互之间的联系,IDE集成开发工具和编译器默认的
命令通常将这些步骤合并成一一步,使得我们通常很少关注这些步骤。
我们还总结了上面这4个步骤中的主要部分,即编译步骤。介绍了编译器将C程序源代码转变成汇编代码的若干个步骤:词法分析、语法分析、语义分析、目标代码生成。
最后我们介绍了:重定位、符号、目标文件等概念
相关文章:
编译与链接------《程序员的自我修养》
本篇整理于《程序员的自我修养》一书中编译与链接相关知识,整理的目的是为了更加深入的了解编译于链接的更多底层知识,面对程序运行时种种性能瓶颈我们束手无策。我们看到的是这些问题的现象,但是却很难看清本质,所有这些问题的本质就是软件运…...
5分钟搞懂 强缓存与协商缓存
Ⅰ、http缓存 HTTP 缓存策略 分为 > 「强制缓存」 和 「协商缓存」 为什么需要 HTTP 缓存 呢 ? 👇 直接使用缓存速度 >> 远比重新请求快 缓存对象有那些呢 ?👇 「图片」 「JS文件」 「CSS文件」 等等 文章目录Ⅰ、http缓存Ⅱ…...
Ts笔记第一天
文章目录安装 ts运行环境 nodeTS类型数字 、字符串 和布尔类型字面量any 和unknown类型断言void和neverobjectArraytuple 元组enum 枚举安装 ts运行环境 node node-v看版本号 2. 安装ts -g全局安装 npm i -g typescript // 这里全局安装 -s安装无法使用tsc 创建一个01.ts文…...
Android 12 Activity启动流程
Android 12 Activity启动过程 参考文献: startActivity启动过程分析 Activity启动流程(Android 12) 概述 Activity启动发起后,是通过Binder最终交由system进程中的AMS来完成。 一、启动流程 frameworks/base/core/java/android/app/Activity.java f…...
VCS®/VCSi™User Guide
VCS是一种高性能、高容量的Verilog模拟器,它将先进的高级抽象验证技术集成到一个开放的本地平台中。VCS是一个编译代码模拟器。它使您能够分析、编译和模拟Verilog、SystemVerilog、OpenVera和SystemC设计描述。它还为您提供了一组模拟和调试功能,以验证…...
MongoDB简介及SpringBoot整合
一、概述MongoDB中的记录是一个文档,它是一个数据结构组成 字段和值对。MongoDB文档类似于JSON。对象。字段的值可能包括其他文档、数组、 和文档数组:数据库(Database):和关系型数据库一样,每个数据库中有…...
读书思考:步步惊心的《技术陷阱》
《技术陷阱》这本书450页,43万字之巨,信息量密密麻麻,采集的资料极其丰富,复习了一遍大停滞、大分流、大平衡、大逆转时代,并展望未来。看完了有很多想法,随手写了下来,希望不是蹭热点。&#x…...
求你了,不要再在对外接口中使用枚举类型了!
最近,我们的线上环境出现了一个问题,线上代码在执行过程中抛出了一个IllegalArgumentException,分析堆栈后,发现最根本的的异常是以下内容: java.lang.IllegalArgumentException: No enum constant com.a.b.f.m.a.c.A…...
Java开发学习(四十六)----MyBatisPlus新增语句之id生成策略控制及其简化配置
在前面有一篇博客:Java开发学习(四十一)----MyBatisPlus标准数据层(增删查改分页)开发,我们在新增的时候留了一个问题,就是新增成功后,主键ID是一个很长串的内容。 我们更想要的是按照数据库表字段进行自增…...
章鱼哥听歌
uboot环境变量 以下所有的命令,都在串口工具进行执行 ubifsmount- mount UBIFS volume ubifsumount- unmount UBIFS volume ums - Use the UMS [USB Mass Storage] usb - USB sub-system usbboot - boot from USB device version - print monit…...
软件测试电商项目实战(写进简历没问题)
前言 说实话,在找项目的过程中,我下载过(甚至付费下载过)N多个项目、联系过很多项目的作者,但是绝大部分项目,在我看来,并不适合你拿来练习,它们或多或少都存在着“问题”ÿ…...
算法导论—分治法思想、动态规划思想、贪心思想
算法导论—分治法思想、动态规划思想、贪心思想分治法的思想:动态规划:贪心算法:贪心算法求解问题的条件:设计贪心算法的步骤:分治法的思想: 将原问题分解为几个规模较小但类似于原问题的子问题࿰…...
Spring-Data-Jpa实现继承实体类
写在前面:从2018年底开始学习SpringBoot,也用SpringBoot写过一些项目。现在对学习Springboot的一些知识总结记录一下。如果你也在学习SpringBoot,可以关注我,一起学习,一起进步。 相关文章: 【Springboot系…...
多线程环境下的伪共享
今天和大家聊一聊伪共享 1.什么是伪共享? 缓存一致性协议在计算机中针对的最小单元:缓存行,每个缓存行的大小是64字节,一串连续的64字节数据都会存储到缓存行中。 假设数据A和数据B在同一缓存行中,CPU1修改了数据A&am…...
【Taylor and Francis】1/2区云计算、物联网、机器学习类,SCIEEI双检,审稿友好
机器学习类 【期刊简介】IF:6.5-7.0,JCR1/2区,中科院3区 【检索情况】SCIE&EI双检 【参考周期】2-3个月左右录用 【征稿领域】面向制造业云计算物联网应用的机器学习方法 【截稿日期】10篇版面 毕业必看-快刊 计算机科学类…...
CleanMyMac X4.12新版本下载及功能介绍
CleanMyMac X2023最新版终于迎来了又4.12,重新设计了 UI 元素,华丽的现代化风格显露无余。如今的CleanMyMac,早已不是单纯的系统清理工具。在逐渐融入系统优化、软件管理、文件管理等功能后,逐渐趋近于macOS的系统管家,…...
大数据技术架构(组件)26——Spark:Shuffle
2.1.6、Shuffle2.1.6.0 Shuffle Read And WriteMR框架中涉及到一个重要的流程就是shuffle,由于shuffle涉及到磁盘IO和网络IO,所以shuffle的性能直接影响着整个作业的性能。Spark其本质也是一种MR框架,所以也有自己的shuffle实现。但是和MR中的shuffle流程…...
关于Zebec生态的改进提案,即将上线的 Nautilus 链
概括 在最初作为 Solana 原生应用程序推出一年后,Zebec 团队已经能够通过在 BNB和NEAR区块链上成功部署来扩大其产品的范围。 凭借继续向尽可能多的公司/协议/基金提供薪资工具和基础设施的雄心勃勃的计划,我们决定采用最终将使 Zebec生态系统及其核心…...
Python数据可视化(三)(pyecharts)
分享一些python-pyecharts作图小技巧,用于展示汇报。 一、特点 任何元素皆可配置pyecharts只支持python原生的数据类型,包括int,float,str,bool,dict,list动态展示,炫酷的效果,给人视觉冲击力 # 安装 pip install pyecharts fr…...
【Redis面试指南】
Redis面试指南 Redis是一个开源的、基于内存的、高性能的键值对存储系统,它可以用于存储非常大量的数据,并且可以在短时间内获取数据。Redis的性能被广泛用于Web应用程序的缓存层,以提高应用程序的性能和可用性。Redis的面试是一个比较复杂的…...
大数据技术之Hadoop(生产调优手册)
第1章 HDFS—核心参数 1.1 NameNode内存生产配置 1)NameNode内存计算 每个文件块大概占用150byte,一台服务器128G内存为例,能存储多少文件块呢? 128 * 1024 * 1024 * 1024 / 150Byte ≈ 9.1亿 G MB KB Byte 2)Hadoop…...
「Vue源码学习」常见的 Vue 源码面试题,看完可以说 “精通Vue” 了吗?
Vue源码面试题一、行时(Runtime) 编译器(Compiler) vs. 只包含运行时(Runtime-only)webpackRollupBrowserify二、Vue 的初始化过程(面试关问:new Vue(options) 发生了什么࿱…...
FreeModbus RTU 移植指南
FreeModbus 简介 FreeModbus 是一个免费的软件协议栈,实现了 Modbus 从机功能: 纯 C 语言支持 Modbus RTU/ASCII支持 Modbus TCP 本文介绍 Modbus RTU 移植。 移植环境: 裸机Keil MDK 编译器Cortex-M3 内核芯片(LPC1778/88&…...
《唐诗三百首》数据源网络下载
2023年的 元宵之夜,这场以“长安”为主题的音乐会火了!在抖音,超过2300万人次观看了直播,在线同赏唐诗与交响乐的融合。许多网友惊呼,上学时那些害怕背诵的诗句,原来还可以有这么美的表达这场近80分钟的音乐…...
(深度学习快速入门)第五章第一节2:GAN经典案例之MNIST手写数字生成
获取pdf:密码7281 文章目录一:数据集介绍二:GAN简介(1)简介(2)损失函数三:代码编写(1)参数及数据预处理(2)生成器与判别器模型&#x…...
雁过留痕,竟是病毒的痕迹?
凌恩生物全新升级宏病毒组分析流程;聚焦DNA,RNA病毒组研究热点;高灵敏度检测vOTUs;多软件整合,精准鉴定病毒序列;直击地化循环关键环节,助力宏病毒组科研成功!期刊:Micro…...
Linux基本功系列之sort命令实战
文章目录前言一. sort命令介绍二. 语法格式及常用选项三. 参考案例3.1 按照文本默认排序3.2 忽略相同的行3.3 按数字大小进行排序3.4 检查文件是否已经按照顺序排序3.5 将第3列按照数字大小进行排序3.6 将排序结果输出到文件四. 探讨 -k的高级用法总结前言 大家好,…...
【笔记】移动端自动化:adb调试工具+appium+UIAutomatorViewer
学习源: https://www.bilibili.com/video/BV11p4y197HQ https://blog.csdn.net/weixin_47498728/category_11818905.html 一、移动端测试环境搭建 学习目标 1.能够搭建java 环境 2.能够搭建android 环境 (一)整体思路 我们的目标是Andr…...
面试复习题--性能检测原理
1、布局性能检测 Systrace,内存优化工具中也用到了 Systrace,这里关注 Systrace 中的 Frames 页面,正常情况下圆点为绿色,当出现黄色或者红色的圆点时,表现出现了丢帧。 Layout Inspector,是 AndroidStudio 自带工具…...
@LoadBalanced 和 @RefreshScope 同时使用,负载均衡失效分析
背景 最近引入了 Nacos Config 配置管理能力,说起来用法很简单,还是踩了三个坑。 Nacos Config 的 nacos 的帐号密码加密配置后,怎么解密而且在 NacosConfigBootstrapConfiguration 真正注入 Nacos Config 注入之前,而且不能触发…...
旅游门户网站系统/给公司建网站需要多少钱
最近正在学习Java基础知识,终于完成了第一个小demo,记录下来,算是一个小总结与整理,也希望可以帮助到别人。先看看我写了哪些类:Player:玩家类;ComputerPlayer:机器人玩家类,主要用来实现机器人…...
中国企业集成网网址电子商务/网站seo优化方案项目策划书
有时,程序中需要判断一个字符是否是字母。可以使用正则表达式或者PHP内置函数判断。本篇只讲解判断一个字符而非字符串,所以以下示例中的输入参数都是一个字符。以下函数只判断一个字符是否字母,如果输入的是字符串可能会有异常结果ÿ…...
wordpress怎么安装上服务器/百度一下百度一下你知道
笔者使用代码及相关文件下载链接: 【源代码文件】pytorch-grad-cam源代码阅读和调试 源代码链接: jacobgil/pytorch-grad-cam pytorch-grad-cam源代码阅读和调试(上) pytorch-grad-cam源代码阅读和调试(中) pytorch-grad-cam源代码阅读和调试(下) 代码改进自定义一个类Guide…...
做品牌文化的网站/南宁seo优化公司排名
https://www.luogu.org/problem/show?pid1197 感觉并查集要维护删除好像很棘手; 开两个并查集也无法解决问题; 尴尬; 本着zyy大神的不是考试懒得想的理念发了一下题解; 发现只要倒着来就好了; 就是离线做&#…...
怎么介绍自己做的电影网站/seo网站推广
360手机N4S配置怎么样?360手机N4S值得购买吗?360手机N4S有几个版本?各版本有什么区别?下面脚本之家的小编就带来了360手机N4S各版本区别对比评测,一起来看看吧。外观设计360手机N4S是360手机N4的升级版,但是…...
阿里云 iis 默认网站/西安seo托管
昨晚本想偶尔看一集《圣斗士冥王篇》,结果一不小心12集统统看完了。谁知道最后也不算结束,仿佛是又出现“神斗士”了。“真正的战斗才刚刚开始!”,还是这句片子中的鬼话。急得本人四处打探,还请高人指点,小…...