数据库管理-第226期 内存至超线程(20240805)
数据库管理226期 2024-08-05
- 数据库管理-第226期 内存至超线程(20240805)
- 1 CPU内缓存结构
- 2 缓存与内存
- 3 单核单线程
- 4 超线程
- 5 超线程的利弊
- 总结
数据库管理-第226期 内存至超线程(20240805)
作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database(Oracle与MySQL)
PostgreSQL ACE Partner
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、年度墨力之星,ITPUB认证专家、专家百人团成员,OCM讲师,PolarDB开源社区技术顾问,HaloDB外聘技术顾问,OceanBase观察团成员,青学会MOP技术社区(青年数据库学习互助会)技术顾问
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭
8月第一篇技术文章,离上一篇又隔了好几天,上周末在公众号写了篇骂人的,最终发现,还是写技术文章舒服一点。
上周吕海波老师写了一篇《详解超线程:一点也不逻辑的逻辑CPU》(https://mp.weixin.qq.com/s/-oZossf4tatoAehIo_Ldug),我想班门弄斧一下,深入一点点。
1 CPU内缓存结构
以我笔记本上的AMD Ryzen 9 6900HX(8核心16线程)为例,通过CPU-Z我们可以看到CPU内部是存在3级缓存结构的,称为L1、L2、L3缓存:
- L1缓存:L1缓存被分为数据缓存(8x32KB,256KB)和指令缓存(8x32KB,256KB),总计0.5MB,这一部分是每个物理核心独享的。L1缓存是最快且容量最小的存储级别,是CPU首先寻找数据的位置。当所需数据存在于L1缓存时,即缓存命中,CPU 便会从L1缓存中直接读取数据进入核心操作或操作完成后写入数据。
- L2缓存:L1缓存被分为(8x512KB),总计4MB,这一部分是每个物理核心独享的。当缓存未命中,即所需数据不在L1缓存中时,CPU 转而检查L2缓存。L2缓存容量更大,但速度稍慢。
- L3 缓存:L3缓存为16路总计16MB,这一部分是所有物理核心共享的。如果L2缓存也未命中,CPU会接着检查L3缓存。L3缓存是所有缓存级别中容量最大但响应速度最慢的。
2 缓存与内存
即便有了上一节中对CPU内部三级缓存的概述,但是仍然对其没有直观的感受。
首先我们要知道一点,CPU物理核心都是需要对数据进行操作的,为了提升CPU物理核心的使用效率,CPU物理核心就需要更快的获得数据,那么我们来看看为啥即便是有了大容量的内存,还需要在CPU内部构建多级缓存,这里看看AIDA64的内存与缓存的测试结果:
这里可以看到内存无论是延迟还是带宽与CPU内部缓存都是有着巨大的差距的,就更别说即便是PCIe4.0 NVMe SSD与内存之间的差异了。这样的设计就是让常用的数据和指令尽可能缓存在贴近CPU物理核心的地方,以提升CPU物理核心处理数据的效率。这里可以画一张从磁盘到CPU的数据传输路径:
虽然从磁盘到缓存的带宽和延迟有着巨大的差异,但是容量确实反着来的,全量数据才磁盘,内存中有部分数据,缓存则是很小一部分数据。这么设计的缘由其实是将数据以不同容量“预读”在不同带宽、延迟的内存/缓存之中,当高速小容量的缓存需要交换数据时可以更好的从低速大容量的缓存/内存中“预载”的数据中更快的交互数据。越是与磁盘数据交互多的场景,这种设计效果越好,这也是数据库要尽可能充分利用内存资源的重要原因之一。
3 单核单线程
这里就要看一下CPU物理核心在单核单线程下的工作原理了,这里要重申一点,一个物理核心在同一个时间点只能处理一件事情。那么物理核心处理一次请求的流程大致如下:
这里就可以看到请求1来的时候会讲对应数据缓存,CPU物理核心去读取,操作完成后返回给缓存并反馈给请求发起方,待缓存清理后请求2才能执行对应的操作。那么在缓存进行数据交互的时候CPU物理核心就会处于空闲状态,即便缓存速度很快,也会浪费大量CPU资源(这里可以看看CPU频率和时间的比值)。
4 超线程
那么超线程技术实现了些什么?其实就是将缓存交换的时间给节省出来,简单来说就是在CPU物理核心在做数据操作的时候,有另一路缓存在提前缓存数据:
这样CPU就会减少甚至消除等待缓存交换数据的过程,从而提升CPU物理核心的利用效率,从另一个角度提升了CPU物理核心处理并发的能力。从一些资料查看,可以带来至少30%以上的性能提升。并且这是通过CPU物理层面实现的。
5 超线程的利弊
超线程的优势肯定是提高CPU物理核心利用效率,从而从整体层面提高CPU处理并发的效率,但是要实现这一功能,CPU需要增加一些简单的物理线路来实现,会增加晶体管数量、核心面积以及发热量。
另一方面如果是以前面图片为例,请求1和请求2可能分属两个不同的进程,可能会增加同一进程响应延迟,但是对于碎片化较多的操作请求(比如数据库),那么超线程技术还是可以带来很客观的性能提升。但是在比如游戏的场景中,往往更看重核心频率且都是线性处理,那么超线程可能会带来一些反作用(这也看游戏的多核心优化做的如何)。
总结
本期简单介绍了一下内存、缓存以及超线程之间的关系与原理。
老规矩,知道写了些啥。
相关文章:

数据库管理-第226期 内存至超线程(20240805)
数据库管理226期 2024-08-05 数据库管理-第226期 内存至超线程(20240805)1 CPU内缓存结构2 缓存与内存3 单核单线程4 超线程5 超线程的利弊总结 数据库管理-第226期 内存至超线程(20240805) 作者:胖头鱼的鱼缸…...

Django学习-数据迁移与数据导入导出
文章目录 一、数据迁移二、数据导入导出1. 数据导出2. 数据导入 一、数据迁移 数据迁移是将项目里定义的模型生成相应的数据表。主要的迁移指令如下: # 第一次生成自定义模型与django admin自带模型迁移文件,后续只生成新增模型迁移文件。后面加App名…...

【Nuxt】编程式导航和动态路由
编程式导航 navigateTo: 更多用法:navigateTo <template><div class"app-container"><button click"goToCategory">Category</button><NuxtPage/></div> </template> <script setup&…...

14. 计算机网络HTTPS协议(二)
1. 前言 上一章节中我们主要就 HTTPS 协议的前置知识进行介绍,下面会继续介绍 HTTPS 的通信过程以及抛出一些常见问题的探讨。因为候选人准备面试的时间和精力是比较有限的,我们在学习的过程要抓住重点,如果感觉对于细节缺乏了解,可以通过维基百科和查阅 StackOverflow 等…...

【算法设计题】实现以字符串形式输入的简单表达式求值,第2题(C/C++)
目录 第2题 实现以字符串形式输入的简单表达式求值 得分点(必背) 题解 1. 初始化和变量定义 2. 获取第一个数字并存入队列 3. 遍历表达式字符串,处理运算符和数字 4. 初始化 count 并处理加减法运算 代码详解 🌈 嗨…...

Kylin系列-入门
Kylin系列-入门 Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力,以支持超大规模数据。以下是对Kylin系列的入门介绍: 一、基本概念 1. 定义 Apache Kylin是由eBa…...

力扣-46.全排列
刷力扣热题–第二十六天:46.全排列 新手第二十六天 奋战敲代码,持之以恒,见证成长 1.题目简介 2.题目解答 这道题目想了会,思路比较好想,但一直没调试成功,所以就参考了力扣官网的代码,积累一下回溯算法的实现和基本实现思路,即先试探后回溯,结果在下面…...

博物馆展厅AI交互数字人,解锁创新的文化交互体验
在智能化时代,博物馆展厅融入AI交互数字人,可以为游客给予实时交互的旅游服务,AI交互数字人可以承担智能引导、讲解、接待、客服与导游等多重角色,为游客塑造崭新的旅游体验。 AI交互数字人相比传统的录屏解说相比,AI…...

DS18B20数字温度传感器操作解析
文章目录 引言特点工作原理引脚说明配置寄存器温度寄存器时序初始化时序写时序读时序 引言 DS18B20 是一种广泛使用的数字温度传感器,具有高精度和易用性。是Dallas Semiconductor公司(现为Maxim Integrated公司)生产的单总线数字温度传感器…...

你的财富正在被一个叫做通货膨胀的怪兽给吞噬掉,你却浑然不觉。
据统计,2024年全球总体通货膨胀率预计达到5.8%,这意味着:你的财富正在被一个叫做通货膨胀的怪兽给吞噬掉,你却浑然不觉。 数据来源:国际货币基金组织 如何跑赢通货膨胀? 家庭财富的积累速度,要…...

医疗设备漏费控制管理系统的必然性及未来发展性
医疗设备控费的必然性 医疗改革的要求 随着医疗改革的不断深入,原有的医药模式已经发生了改变。药品和耗材零差价的执行,使得医院需要寻找新的开源节流、降耗增效的方法。医疗设备控费系统的出现,正是为了满足这种管理需求。 控制成本和优…...

软件设计师笔记-网络基础知识
计算机网络的发展 计算机网络(计算机技术通信技术)的发展是一个逐步演进的过程,从简单的具有通信功能的单机系统,到复杂的以局域网及因特网为支撑环境的分布式计算机系统,这一历程经历了多个关键阶段: #me…...

MMC和eMMC的区别
MMC 和 eMMC 的区别 1. MMC MMC(MultiMediaCard)是一种接口协议,定义了符合这一接口的内存器,称为 MMC 储存体或 MMC 卡。它是一种非易失性存储器件,广泛应用于消费类电子产品中。 1.1 外观及引脚定义 MMC卡共有七个…...

亚马逊爬虫(Amazonbot)IP地址,真实采集数据
一、数据来源: 1、这批亚马逊爬虫(Amazonbot)IP来源于尚贤达猎头公司网站采集数据; 2、数据采集时间段:2023年10月-2024年7月; 3、判断标准:主要根据用户代理是否包含“Amazonbot”和IP核…...

Spring Boot(八十四):集成Thumbnailator来生成缩略图
1 Thumbnailator简介 Thumbnailator是一个用于Java的缩略图生成库。通过Thumbnailator提供的流畅接口(fluent interface)的方式可以完成复杂的缩略图处理任务,无需访问Image I/O API并通过Graphics2D对象手动操作BufferedImages。 2 代码示例 2.1 引入依赖 <dependency&g…...

MySQL基础操作全攻略:增删改查实用指南(上)
本节目标: NOT NULL - 指示某列不能存储 NULL 值。 UNIQUE - 保证某列的每行必须有唯一的值。 DEFAULT - 规定没有给列赋值时的默认值。 PRIMARY KEY - NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标 识&am…...

SAP MM学习笔记 - 豆知识02 - MR21 修改物料原价,MM02 修改基本数量单位/评价Class,MMAM 修改物料类型/评价Class
上一章讲了一些豆知识。比如 - MM50 批量扩张品目 - XK05/06 Block/消除供应商 - MM06/MM16 品目消除 - SE11/SE16/SE16/SE16N/SE16H/DB02 等查看常用的操作Table和数据的T-code SAP MM学习笔记- 豆知识01 - MM50 批量扩张,XK05/XK06 Block/消除供应商…...

谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存
文章目录 一,谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存1,在Elasticsearch的配置类中增加通用设置2,索引数据3,验证 一,谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存 1,在…...

flutter开发环境搭建与android studio 安装配置
flutter开发环境搭建与android studio 安装配置 安装 android studio 下载安装 Android Studio 开发工具 Android Studio官网安装的时看到配置路径就换成自己其他盘的路径即可,其他的一路下一步就ok安装完毕,运行打开缺少 android sdk 按照提示下载即可…...

postgresql 字符串 替换
postgresql 字符串 替换 在PostgreSQL中,可以使用replace()函数来替换字符串中的某个部分。该函数的语法如下: REPLACE(string text, from text, to text) 其中: string 是要进行替换操作的原始字符串。 from 是原始字符串中需要被替换掉的…...

如何强化学习神经网络
强化学习(Reinforcement Learning, RL)神经网络是一种通过奖励和惩罚机制来学习策略的方法,适用于各种复杂的决策问题。以下是强化学习神经网络的一些主要步骤和方法: 1. 了解基本概念 环境(Environment)…...

Hadoop未授权访问漏洞
Hadoop未授权访问漏洞 Hadoop是一个由Apache基金会所开发的分布式系统基础架构,由于服务器直接在开放了Hadoop机器HDFS的50070web端口及部分默认服务端口,黑客可以通过命令行操作多个目录下的数据,如进行删除,下载,目…...

Python中json模块的编码和解码
在Python中,可以用json模块处理JSON的编码和解码问题。json的全程是 javascript object notation, 翻译一下就是javascritpt 对象表示法。json是一种轻量级的数据交换格式,容易阅读和编写,支持的数据类型有:字符串、数字、数组和对…...

【Linux】文件变身大作战:Linux下的文件重命名艺术
欢迎来到 CILMY23 的博客 🏆本篇主题为:文件变身大作战:Linux下的文件重命名艺术 🏆个人主页:CILMY23-CSDN博客 🏆系列专栏:Python | C | C语言 | 数据结构与算法 | 贪心算法 | Linux | 算法…...

字节的存储和字符的存储
字节的存储 内存中的存储 基本数据类型: 在Java中,byte 类型占用 1 个字节(8 位)。它的取值范围是从 -128 到 127。存储在内存中的 byte 数据可以直接操作,例如通过数组或变量访问。 数据结构: byte 数组…...

Markdown插入Base64格式的图片,无需图床,稳定保存
Markdown插入Base64格式的图片,无需图床,稳定保存 我是一个Markdown的爱好者,转存图片是MD经常出问题的地方,因为MD不像其他富文本编辑器,将图片内嵌到文件中,而是用链接的形式引用,或网络链接…...

weblogic 连接gaussdb测试数据源是否联通
文章目录 1. gaussdb创建远程连接用户和数据库2. weblogic构建GaussDB源数据库3. 测试结果查询注意 weblogic中jar包已经放入lib目录中gaussdb已经创建可以连接登录的用户和数据库1. gaussdb创建远程连接用户和数据库 新建用户和数据库连接客户端Gauss=# create user lily pas…...

如何成为全域运营商?掌握这2种申请方式就够了!
随着全域概念的兴起,全域运营商的职业前景和收益空间逐渐显现,并迅速成为了热门创业赛道中的一份子,连带着如何成为全域运营商等入局方式相关话题也成为了众多创业者热议的焦点。 不过,从市场现状来看,作为涵盖公域和私…...

@ConfigurationProperties加在方法上
ConfigurationProperties注解通常用于将外部配置文件(如application.properties或application.yml)中的属性映射到Java类中。它通常加在类上,但也可以加在方法上。加在方法上时,通常与Bean注解一起使用,以便将配置属性…...

使用CUBEMX配置的USB大容量存储设备主机库获取LUN数量的不严谨代码纠正
最近在使用usb主机库驱动U盘直接进行扇区读写。 发现MSC库中获取LUN相关代码有问题 代码如下 其中 status USBH_MSC_BOT_REQ_GetMaxLUN(phost, (uint8_t *)(void *)&MSC_Handle->max_lun); MSC_Handle->max_lun (MSC_Handle->max_lun > MAX_SUPPORTED_L…...