当前位置: 首页 > news >正文

C缺陷与陷阱 — 7 可移植性缺陷

目录

1 应对C语言标准变更

2 标识符的名称限制

3 整数的大小

4 字符是有符号整数还是无符号整数

5 移位运算符

6 内存位置0

7 除法运算时发生的截断


1 应对C语言标准变更

使用新特性可以使代码更容易编写且减少错误,但可能会导致代码在旧编译器上无法编译。square函数是一个简单的数学函数,用于计算一个数的平方。在新风格中,函数原型明确指定了参数类型,如下所示:

double square(double x) {return x * x;
}

如果这样写,这个函数在很多编译器上都不能通过编译。如果我们,ANSI标准为了保持和以前的用法兼容,按照旧风格来重写这个函数,这就增强了它的可移植性。但在旧风格中,函数原型不包含参数类型(这里只举例说明,旧标准现在基本不再使用),如下所示:

double square(x) double x;  // 函数参数声明
{return x * x;  // 计算x的平方并返回结果
}

这种可移植性为了与旧用法保持一致,我们必须在调用了square函数的程序中作如下声明:

double square() 

但是函数square的声明中并没有对参数类型做出说明,因此在编译main函数时,编译器无法得知函数square的参数类型应该是double还是其他类型。如下面的示例,函数调用将会报错。

double square();
main()
{printf("g\n",square(3));
}

为避免这类问题,可在声明中带入参数类型,3会被自动转换为double类型:

double square(double):
main()
{printf("g\n",square(3));
}

另一种改写的方式是,在这个程序中显式地给函数square传入一个double类型的参数:

double square(double x); // 显式指定参数类型
main() {printf("%g\n", square(3.0)); // 显式传入double类型的参数
}

2 标识符的名称限制

在C语言的不同实现中,对标识符的处理方式存在差异。一些实现会接受标识符中的所有字符,而另一些实现可能会截断过长的标识符。连接器对外部名称也有特定的限制,例如可能只允许使用大写字母。ANSI C标准规定,C语言实现至少能够区分外部名称的前6个字符,且不区分大小写。

因此,为了确保程序的可移植性,选择外部标识符的名称时需要谨慎。例如,不应使用容易混淆的名称,如print_fields和print_float,或者State和STATE。例如下面的示例代码:

// 定义一个函数 Malloc
char Malloc(unsigned n) {char *p;char *malloc(unsigned); // 声明 malloc 函数的原型p = malloc(n); // 调用 malloc 函数尝试分配 n 字节的内存if (p == NULL) // 如果 malloc 分配失败,返回 NULLpanic("out of memory"); return p; // 如果分配成功,返回分配的内存的指针
}

这个程序的意图是在需要分配内存的地方调用Malloc函数,而不是直接调用malloc。如果malloc失败,panic函数会被调用,终止程序并打印错误消息。这样,客户程序就不需要在每次调用malloc时都进行检查。

然而,如果编译环境是不区分大小写的C语言实现,那么函数malloc和Malloc可能会被视为相同,导致调用Malloc时实际上是在递归调用自己。在这种情况下,程序在第一次尝试分配内存时对Malloc函数的调用将引起一系列递归调用,而这些递归调用没有返回点,最终导致程序崩溃。

3 整数的大小

C语言提供了三种不同长度的整数类型:short、int 和 long,以及字符类型。这些类型的长度有以下特点:

  • 长度是非递减的,即 short ≤ int ≤ long。
  • 普通整数(int 类型)足够大,可以容纳任何数组下标。
  • 字符长度由硬件决定,现代大多数机器的字符长度是8位,但有些实现中字符长度可能是16位。

ANSI标准规定 long 至少32位,short 和 int 至少16位。这些规定意味着我们不能依赖于具体的位数,但可以保证一定的最小长度。

在编程实践中,这意味着我们不能依赖于具体的精度,而应该根据需要选择合适的类型。例如,如果需要存储可能达到千万数量级的数值,最好声明为 long 类型。

4 字符是有符号整数还是无符号整数

在C语言中,char 类型可以是无符号的或有符号的,这取决于编译器的实现。大多数现代编译器将字符实现为8位整数。

  • 字符的符号性:当需要将字符值转换为较大的整数时,字符是有符号还是无符号的变得重要。如果字符是有符号的,转换为 int 时符号位会扩展;如果是无符号的,则高位会填充0。
  • 字符的取值范围:如果字符被视为有符号,其取值范围是 -128 到 127;如果被视为无符号,则取值范围是 0 到 255。

为了确保字符被视为无符号整数,程序员可以声明 unsigned char。这样,无论在什么编译器上,字符在转换为整数时多余的位都会被填充为0。

与此相关的一个常见错误认识是:如果c是一个字符变量,使用(unsigned) c就可得到与c等价的无符号整数。这是会失败的,因为在将字符c转换为无符号整数时,c将首先被转换为int型整数,而此时可能得到非预期的结果。正确的方式是使用语句(unsigned char) c,因为一个unsigned char类型的字符在转换为无符号整数时无需首先转换为int型整数,而是直接进行转换。

#include <stdio.h>int main() {char signedChar = -1; // 有符号字符unsigned char unsignedChar = 255; // 无符号字符// 打印字符的整数值printf("Signed char as int: %d\n", signedChar);printf("Unsigned char as int: %u\n", unsignedChar);// 正确转换有符号字符为无符号整数printf("Correctly converted signed char as unsigned int: %u\n", (unsigned char)signedChar);return 0;
}

5 移位运算符

使用移位运算符的程序员经常对这样两个问题感到困惑:

(1)向右移位时的填充问题

  • 对于无符号数,空出的位由0填充。
  • 对于有符号数,C语言实现可能用0或符号位的副本填充。

如果程序员关心向右移位时空出的位,可以将变量声明为无符号类型,这样空出的位都会被设置为0。

(2)移位计数的取值范围:

  • 移位计数必须大于等于0,且小于被移位对象的位数。
  • 这个限制确保了移位操作可以在硬件上高效实现。

例如,对于32位的整数,n << 31 和 n << 0 是合法的,而 n << 32 和 n << -1 是不合法的。

(3)移位和除法不完全等同

即使在某些C语言实现中,有符号整数的右移会用符号位填充新位,这也不等同于除以2的幂。例如,(-1) >> 1 的结果通常不为0,但 1 / 2 在大多数C实现中结果为0。

在C语言中,对于有符号整数,-1 >> 1 的操作结果取决于整数的位数和计算机的架构。对于一个32位的整数:

-1 在二进制中通常表示为一个32位的全1的模式,即 11111111 11111111 11111111 11111111。当你将 -1 向右移动1位时,根据补码规则,最左边会填充1(符号位扩展),结果仍然是 -1。因此,在大多数现代计算机上,-1 >> 1 的结果是 -1。

如果已知 low + high 为非负,那么:mid = (low + high) >> 1; 与 mid = (low + high) / 2; 完全等效,但前者的执行速度要快得多。

6 内存位置0

空指针不指向任何对象,使用它除了赋值或比较外都是非法的。例如,使用空指针进行strcmp操作会导致未定义行为,不同编译器结果可能不同。

  • 某些编译器对内存地址0有硬件级的读保护,使用空指针会导致程序立即终止。
  • 有些编译器允许读但不允许写内存地址0,空指针看似指向字符串,但内容可能是无意义的“垃圾信息”。
  • 还有些编译器允许读写内存地址0,错误使用空指针可能导致覆盖操作系统内容,造成严重问题。

在所有C程序中,错误使用空指针都是未定义的,但可能在某些编译器上“看似”能工作,直到换到另一台机器上才会出现问题。

检查这类问题的一个方法是将程序移到不允许读取内存地址0的机器上运行。以下是一个示例程序,用于检测C语言实现如何处理内存地址0:

#include <stdio.h>int main() {char *p = NULL;printf("Location 0 contains %d\n", *p);return 0;
}

在禁止读取内存地址0的机器上,这个程序会失败。在其他机器上,它将打印出内存位置0中存储的字符内容。

7 除法运算时发生的截断

假定我们让q = a /b,r = a % b,商为q,余数为r,在整数除法和余数运算中,我们希望满足以下三条性质:

  1. 定义余数的关系a == qb+r
  2. 符号变化:改变a的正负号应改变q的符号,但不改变q的绝对值。
  3. 余数范围:当b>0时,希望保证0≤ r <b。这对于使用余数作为哈希表索引等场景很重要。

然而,这三条性质不可能同时满足。考虑一个简单的例子:3/2,商为1,余数也为1。此时,第1条性质满足。(-3)/2的值应该是多少呢?如果要满足第2条性质,答案应该是-1,但如果是这样,余数就必定是-1,这样第3条性质就无法满足。如果我们首先满足第3条性质,即余数是1,这种情况下根据第1条性质则商是-2,那么第2条性质又无法满足了。

因此,C语言或者其他语言在实现整数除法截断运算时,必须放弃上述三条原则中的至少一条。大多数程序设计语言选择了放弃第3条,而改为要求余数与被除数的正负号相同。这样,性质1和性质2就可以得到满足。

然而,C语言的定义只保证了性质1,以及当a>=0且b>0时,保证 |r|<b以及r>=0.后面部分的保证与性质2或者性质3比较起来,限制性要弱得多。

C语言的定义虽然有时候会带来不需要的灵活性,但大多数时候,这个定义对让整数除法运算满足其需要来说还是够用了的。

相关文章:

C缺陷与陷阱 — 7 可移植性缺陷

目录 1 应对C语言标准变更 2 标识符的名称限制 3 整数的大小 4 字符是有符号整数还是无符号整数 5 移位运算符 6 内存位置0 7 除法运算时发生的截断 1 应对C语言标准变更 使用新特性可以使代码更容易编写且减少错误&#xff0c;但可能会导致代码在旧编译器上无法编译。…...

应急响应:玄机_Linux后门应急

https://xj.edisec.net/challenges/95 11关做出拿到万能密码&#xff0c;ATMB6666&#xff0c;后面都在root权限下操作 1、主机后门用户名称&#xff1a;提交格式如&#xff1a;flag{backdoor} cat /etc/passwd&#xff0c;发现后门用户 flag{backdoor} 2、主机排查项中可以…...

C++:捕获 shared_from_this()和捕获this的区别

两种方法的主要区别在于对象的生命周期管理以及捕获方式的不同。以下是对两种方法的详细对比&#xff1a; 第一种&#xff1a;捕获 shared_from_this() 的方法 event.subscribe([self shared_from_this()]() {std::cout << "Event triggered, object is alive.&qu…...

网络协议之TCP

一、定义 TCP&#xff08;Transmission Control Protocol&#xff0c;传输控制协议&#xff09;是一种面向连接的、可靠的、基于字节流的传输层通信协议&#xff0c;由IETF的RFC 793定义。TCP旨在适应支持多网络应用的分层协议层次结构。在因特网协议族&#xff08;Internet p…...

《澳鹏AI全景报告2024》分析最新的数据挑战

华盛顿州柯克兰市&#xff0c;2024 年 10 月 22 日 —— Appen Limited&#xff08;澳大利亚证券交易所代码&#xff1a;APX&#xff09;&#xff0c;一家为人工智能生命周期提供高质量数据的领先供应商&#xff0c;发布了其《2024 年人工智能现状报告》。该报告对美国多个行业…...

【Java每日面试题】—— String、StringBuilder和StringBuffer的区别?

1、String 不可变性:String对象创建后不可变,内容不能被修改,对字符串修改会产生一个新的字符串对象。 线程:线程安全 适用:字符串内容不发生变化或少量字符串操作 String str = "Hello"; str = str + " World"; 2、StringBuffer 不可变性:对…...

【设计模式】【创建型模式(Creational Patterns)】之单例模式

单例模式是一种常用的创建型设计模式&#xff0c;其目的是确保一个类只有一个实例&#xff0c;并提供一个全局访问点。 单例模式的原理 单例模式的核心在于控制类的实例化过程&#xff0c;通常通过以下方式实现&#xff1a; 私有化构造函数&#xff0c;防止外部直接实例化。…...

form表单的使用

模板 <template><el-form :model"formData" ref"form1Ref" :rules"rules"><el-form-item label"手机号" prop"tel"><el-input v-model"formData.tel" /></el-form-item><el-f…...

PDF内容提取,MinerU使用

准备环境 # python 3.10 python3 -m pip install huggingface_hub python3 -m pip install modelscope python3 -m pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com下载需要的模型 import json import osimport requests from huggingface_hub…...

SpringCloud篇(服务网关 - GateWay)

目录 一、简介 二、为什么需要网关 二、gateway快速入门 1. 创建gateway服务&#xff0c;引入依赖 2. 编写启动类 3. 编写基础配置和路由规则 4. 重启测试 5. 网关路由的流程图 6. 总结 三、断言工厂 四、过滤器工厂 1. 路由过滤器的种类 2. 请求头过滤器 3. 默认…...

自动化测试之unittest框架详解

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 unittest 1、什么是Unittest框架&#xff1f; python自带一种单元测试框架 2、为什么使用UnitTest框架&#xff1f; >批量执行用例 >提供丰富的断…...

Vue3 provide 和 inject的使用

在 Vue 中&#xff0c;provide 和 inject 是 Composition API 的一对功能&#xff0c;用于父子组件之间的依赖注入。它们的作用是让父组件可以向其所有子组件提供数据或方法&#xff0c;而不需要通过逐层传递 props。 1. provide provide 用于父组件中&#xff0c;提供数据或…...

掌握Git分布式版本控制工具:从基础到实践

一、引言 在软件开发过程中&#xff0c;版本控制是不可或缺的一环。Git作为一种分布式版本控制工具&#xff0c;以其高效、灵活的特点&#xff0c;受到了广大开发者的青睐。本文将详细介绍Git的基本概念、工作流程、常用命令&#xff0c;以及在IntelliJ IDEA中的操作方法。 二、…...

AndroidStudio与开发板调试时连接失败或APP闪退的解决方案,涉及SELINUX及获取Root权限

现象 用AndroidStudio打开工程代码,点击运行后,报错: 解决方案 具体原因是尝试运行 su(通常用于获取超级用户权限)时失败了,提示 “Permission denied” 通过 CONFIG_SECURITY_SELINUX 变量控制 SElinux 开启或关闭 在vim /rk3568_android_sdk/device/rockchip/rk…...

VMWARE虚拟交换机的负载平衡算法

一、基于源虚拟端口的路由 虚拟交换机可根据 vSphere 标准交换机或 vSphere Distributed Switch 上的虚拟机端口 ID 选择上行链路。 基于源虚拟端口的路由是 vSphere 标准交换机和 vSphere Distributed Switch 上的默认负载平衡方法。 ESXi主机上运行的每个虚拟机在虚拟交换…...

安卓InputDispatching Timeout ANR 流程

1 ANR的检测逻辑有两个参与者: 观测者A和被观测者B&#xff0c;当然&#xff0c;这两者是不在同一个线程中的。2 A在调用B中的逻辑时&#xff0c;同时在A中保存一个标记F&#xff0c;然后做个延时操作C&#xff0c;延时时间设为T&#xff0c;这一步称为: 埋雷 。3 B中的逻辑如果…...

【Nginx从入门到精通】03 、安装部署-让虚拟机可以联网

文章目录 总结一、配置联网【Minimal 精简版】1.1、查看网络配置1.2、配置ip地址 : 修改配置文件 <font colororange>ifcfg-ens33Stage 1&#xff1a;输入指令Stage 2&#xff1a;修改参数Stage 3&#xff1a;重启网络Stage 4&#xff1a;测试上网 二、配置联网【Everyth…...

java 增强型for循环 详解

Java 增强型 for 循环&#xff08;Enhanced for Loop&#xff09;详解 增强型 for 循环&#xff08;也称为 “for-each” 循环&#xff09;是 Java 从 JDK 5 开始引入的一种便捷循环语法&#xff0c;旨在简化对数组或集合类的迭代操作。 1. 基本语法 语法格式 for (类型 变量…...

浪潮云启操作系统(InLinux) bcache宕机问题分析

前言 本文以一次真实的内核宕机问题为切入点&#xff0c;结合实际操作案例&#xff0c;详细展示了如何利用工具 crash对内核转储&#xff08;kdump&#xff09;进行深入分析和调试的方法。通过对崩溃日志的解读、函数调用栈的梳理、关键地址的定位以及代码逻辑的排查&#xff…...

038集——quadtree(CAD—C#二次开发入门)

效果如下&#xff1a; using Autodesk.AutoCAD.ApplicationServices; using Autodesk.AutoCAD.DatabaseServices; using Autodesk.AutoCAD.EditorInput; using Autodesk.AutoCAD.Geometry; using System; using System.Collections.Generic; using System.Linq; using System.T…...

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…...

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

DeepSeek 技术赋能无人农场协同作业:用 AI 重构农田管理 “神经网”

目录 一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析 三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍 四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度 五、实际案例大…...

回溯算法学习

一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...

C++:多态机制详解

目录 一. 多态的概念 1.静态多态&#xff08;编译时多态&#xff09; 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1&#xff09;.协变 2&#xff09;.析构函数的重写 5.override 和 final关键字 1&#…...

Visual Studio Code 扩展

Visual Studio Code 扩展 change-case 大小写转换EmmyLua for VSCode 调试插件Bookmarks 书签 change-case 大小写转换 https://marketplace.visualstudio.com/items?itemNamewmaurer.change-case 选中单词后&#xff0c;命令 changeCase.commands 可预览转换效果 EmmyLua…...

JDK 17 序列化是怎么回事

如何序列化&#xff1f;其实很简单&#xff0c;就是根据每个类型&#xff0c;用工厂类调用。逐个完成。 没什么漂亮的代码&#xff0c;只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...

海云安高敏捷信创白盒SCAP入选《中国网络安全细分领域产品名录》

近日&#xff0c;嘶吼安全产业研究院发布《中国网络安全细分领域产品名录》&#xff0c;海云安高敏捷信创白盒&#xff08;SCAP&#xff09;成功入选软件供应链安全领域产品名录。 在数字化转型加速的今天&#xff0c;网络安全已成为企业生存与发展的核心基石&#xff0c;为了解…...

JS红宝书笔记 - 3.3 变量

要定义变量&#xff0c;可以使用var操作符&#xff0c;后跟变量名 ES实现变量初始化&#xff0c;因此可以同时定义变量并设置它的值 使用var操作符定义的变量会成为包含它的函数的局部变量。 在函数内定义变量时省略var操作符&#xff0c;可以创建一个全局变量 如果需要定义…...

LangChain + LangSmith + DeepSeek 入门实战:构建代码生成助手

本文基于 Jupyter Notebook 实践代码&#xff0c;结合 LangChain、LangSmith 和 DeepSeek 大模型&#xff0c;手把手演示如何构建一个代码生成助手&#xff0c;并实现全流程追踪与优化。 一、环境准备与配置 1. 安装依赖 pip install langchain langchain_openai2. 设置环境变…...