第11章 优化多线程应用程序
对软件来说,为持续增长的CPU核数做好准备,对应用程序在未来的成功至关重要。
11.1 性能扩展和开销
通过可伸缩定律将计算单元(线程)之间的通信描述为影响性能的另一个门控因素。通用可伸缩定律描述性能劣化由多个因素导致:
1. 随着计算单元增加,它们开始竞争资源,导致在同步这些访问上增加额外的耗时。
2. 多个工作单元共享资源,需要在多个工作工作单元之间保持共享资源的状态一致。
11.2 并行效率指标
评估应用程序的并行效率时推荐使用有效CPU利用率,该指标基于有效时间。因为高CPU和IPC可能是由于自旋导致的。
11.2.1 有效CPU利用率
有效CPU利用率表示应用程序有效利用可用CPU的情况,显式了系统上所有逻辑CPU和平均CPU利用率。CPU利用率只统计了有效时间,没有包含并行运行系统引入的开销和自旋。
11.2.2 线程数量
配置低于可用线程运行应用程序,则没有充分利用它的资源。运行过多的线程又会导致上下文切换次数频繁。
为了避免线程创建和销毁的开销,工程师通常会分配一个具备多个线程的线程池,用于等待管理程序分配并发执行任务,这对执行短周期任务尤其有效。
11.2.3 等待时间
等待时间是指软件线程被同步阻塞或者发起同步锁的API导致的等待,等待时间是线程粒度的。
操作系统的调度器可基于同步或者抢占停止线程的执行,这样等待时间可以被进一步拆分为同步等待时间和抢占等待时间。大量的同步等待时间可能提示应用程序有高度竞争的同步对象。大量的抢占等待时间可能是线程超额认购的问题,此时开发者应该考虑减少线程的数量或者增大每个工作线程的任务粒度。
11.2.4 自旋时间
自旋时间也属于等待时间,经常在同步API导致CPU轮询时发生。实际上,内核的同步原语实现更倾向于在锁上自旋一段时间,而不是立即进行线程上下文切换,尽管更多的自旋时间反映了有效工作时间的浪费。
使用Intel VTune Profiler、Linux perf、Coz、eBPF和GAPP进行分析
11.7 检查缓存一致性
通过窥探缓存来监视所有内存事务并相互协作来保持内存一致性,能缓解缓存一致性,代价是一个处理器的修改会使另一个处理器的缓存中相应的缓存行失效,这会导致内存类型的CPU空转。浪费带宽。
一致性问题分为:真共享和伪共享。
11.7.2 真共享
unsigned int sum
// parallel
{for (int i = 0; i < N; i++)sum += a[i];
}
真共享意味着很难检测到数据竞争。幸运地是,Clang的Thread sanitizer和helgrind工具可以。
使用C++原子变量有助于解决真共享发生时的数据竞争问题 。但是,它高效地序列化原子变量访问,可能会影响性能。另一个方法解决真共享问题的方法是使用本地线程存储。
11.7.3 伪共享
当两个不同的处理器恰好修改位于同一缓存行的不同变量时,称为伪共享。
struct S {int a;int b;
};S s;{for(int i = 0; i < N; i++)s.a += A[i];for(int i = 0; i < N; i++)s.b += B[i];
}
针对伪共享问题,用户首先运行微架构探索分析,检测应用程序是否发生了伪共享问题,如果出现高竞争访问指标,则是。接下来选择“分析动态内存对象”选项来运行内存访问分析,帮助找到导致竞争问题的数据结构访问。通常,这类内存访问都具有高时延。
使用perf c2c工具检测具有高缓存一致性损耗的内存访问。
通过内存对象对齐/填充可能会消除伪共享。
从性能角度来看,状态转换成本可能是最需要考虑的事情。在CPU读/写操作周期间,所有缓存状态中唯一不涉及高损耗跨缓存子系统通信和数据传输是修改M和独有E状态。
11.8 总结
1. 应用软件为多核做好准备;
2. 线程通信可能会产生负加速效果。优化多线程应用程序的性能还涉及检测和缓存争用和一致性问题。
相关文章:
第11章 优化多线程应用程序
对软件来说,为持续增长的CPU核数做好准备,对应用程序在未来的成功至关重要。 11.1 性能扩展和开销 通过可伸缩定律将计算单元(线程)之间的通信描述为影响性能的另一个门控因素。通用可伸缩定律描述性能劣化由多个因素导致&#…...
分布式下的session共享问题
首页我们确定在分布式的情况下session是不能共享的。 1.不同的服务,session不能共享,也就是微服务的情况下 2.同一服务在分布式情况,session同样不能共享,也会是分布式情况 分布式下session共享问题解决方案(域名相同) 1.session复…...
webrtc的Sdp中的Plan-b和UnifiedPlan
在一些类似于视频会议场景下,媒体会话参与者需要接收或者发送多个流,例如一个源端,同时发送多个左右音轨的音频,或者多个摄像头的视频流;在2013年,提出了2个不同的SDP IETF草案Plan B和Unified Plan&#x…...
LLM-Rec:基于提示大语言模型的个性化推荐
1. 基本信息 论文题目:LLM-Rec: Personalized Recommendation via Prompting Large Language Models 作者:Hanjia Lyu, Song Jiang, Hanqing Zeng, Yinglong Xia, Jiebo Luo 机构:University of Rochester, University of California Los Angeles, Meta AI, University of Ro…...
microsoft -en - us 无法卸载
因为office2013 有漏洞,要进行升级,弄了个office2016,提示无法安装, microsoft visio -en - us 即点即用的存在。点击各种卸载,都无法生效。 再去搜了下软件使用评论,里面提到geek 可以卸载,下…...
day43参与通信的服务器
1.题目描述 这里有一幅服务器分布图,服务器的位置标识在 m * n 的整数矩阵网格 grid 中,1 表示单元格上有服务器,0 表示没有。 如果两台服务器位于同一行或者同一列,我们就认为它们之间可以进行通信。 请你统计并返回能够与至少…...
K8S如何部署ZooKeeper以及如何进行ZooKeeper的平滑替换
前言 在之前的章节中,我们已经成功地将Dubbo项目迁移到了云环境。在这个过程中,我们选择了单机ZooKeeper作为注册中心。接下来,我们将探讨如何将单机ZooKeeper部署到云端,以及在上云过程中可能遇到的问题及解决方案。 ZooKeeper…...
Leetcode刷题之1658. 将 x 减到 0 的最小操作数
题目: 算法分析: 可以看出,这道题本意是从计算两侧和为x 的数字, 要求数量最少, 那我们可以反向思考, 假如整个数组的和为sum, 那么我们就可以求中间部分和为sum-x的数字(当然必须连续), 当中间部分的数字同时达到和为sum-x以及长度最长两个要求时, 两侧数字也就达到了和为x以…...
海外网红营销中的创新技术与趋势:AI、AR和VR的应用探索
随着全球数字化时代的不断发展,互联网已经成为连接人们的桥梁,而社交媒体则在其中扮演着举足轻重的角色。在这个全球性的社交媒体网络中,海外网红以其独特的个人魅力和内容创作能力迅速崭露头角。而为了在竞争激烈的市场中脱颖而出࿰…...
Vant 4.6.4发布,增加了一些新功能,并修复了一些bug
导读Vant 4.6.4发布,增加了一些新功能,并修复了一些bug等。 新功能 feat(area-data): 更新芜湖的县区数据,由 nivin-studio 在 #12122 中贡献feat(Locale): 添加塞尔维亚语到国际化,由 RogerZXY 在 #12145 中贡献feat(ImagePreview): 添加 c…...
Linux权限维持—Strace监控Alias别名Cron定时任务
Linux权限维持—Strace监控&Alias别名&Cron定时任务 1. 前言2. 隐藏手法2.1. 时间伪造2.1.1. 修改时间 2.2. 隐藏文件2.3. chattr命令2.3.1. 命令参考2.3.2. 属性添加2.3.3. 属性解除 2.4. 历史命令2.4.1. 隐藏命令 2.5. 清除登录日志2.5.1. 清除登录成功日志2.5.2. 清…...
微服务中间件--统一网关Gateway
统一网关Gateway 8.统一网关Gatewaya.搭建网关服务b.路由断言工厂c.路由过滤器GatewayFilterd.全局过滤器GlobalFiltere.过滤器的执行顺序f.网关的cors跨域配置 8.统一网关Gateway 网关功能: 身份认证和权限校验服务路由、负载均衡请求限流 网关的技术实现 在Spr…...
Fabric.js 元素选中状态的事件与样式
本文简介 带尬猴! 你是否在使用 Fabric.js 时希望能在选中元素后自定义元素样式或选框(控制角和辅助线)的样式? 如果是的话,可以放心往下读。 本文将手把脚和你一起过一遍 Fabric.js 在对象元素选中后常用的样式设置…...
数据通信——传输层(UDP)
引言 我们上网观看比赛的时候,一旦网络信号出现问题,那可就太难受了,这意味着卡顿的时间内,你会错过这段时间内的内容。这种特性要归功于UDP(User Datagram Protocol)用户数据报协议。 无连接性 一般的&am…...
Python(八十六)字符串的编码与解码
❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…...
Android OkHttp 源码浅析二
OkHttp 配置参数: get:JvmName("dispatcher") val dispatcher: Dispatcher builder.dispatcherget:JvmName("connectionPool") val connectionPool: ConnectionPool builder.connectionPool/*** Returns an immutable list of interceptors that observe…...
Python(八十四)字符串的切片操作
❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…...
【QT】绘制旋转等待
很高兴在雪易的CSDN遇见你 ,给你糖糖 欢迎大家加入雪易社区-CSDN社区云 前言 程序中经常会遇到耗时的操作,需要提供等待的窗口,防止用户多次点击造成卡顿等问题。本文分享旋转等待技术,希望对各位小伙伴有所帮助!结果如下:...
Electron学习3 使用serialport操作串口
Electron学习3 使用serialport操作串口 一、准备工作二、 SerialPort 介绍1. 核心软件包(1) serialport(2) serialport/stream(3) serialport/bindings-cpp(4) serialport/binding-mock(5) serialport/bindings-interface 2. 解析器包3. 命令行工具 三、创建一个demo程序1. 创建…...
激活函数总结(十七):激活函数补充(PELU、Phish)
激活函数总结(十七):激活函数补充 1 引言2 激活函数2.1 Parametric Exponential Linear Unit(PELU)激活函数2.2 Phish激活函数 3. 总结 1 引言 在前面的文章中已经介绍了介绍了一系列激活函数 (Sigmoid、Tanh、ReLU、…...
[bug日志]springboot多模块启动,在yml配置启动端口8081,但还是启动了8080
【问题描述】 配置的启动端口是8081,实际启动端口是8080 【解决方法】 1.检查application.yml的配置是否有错误(配置项中,显示白色就错,橙色无措) 2.检查pom.xml的打包方式配置项配置,主pom.xml中的配置项一般为:&l…...
【每日易题】七夕限定——单身狗问题以及进阶问题位运算法的深入探讨
君兮_的个人主页 勤时当勉励 岁月不待人 C/C 游戏开发 Hello,米娜桑们,这里是君兮_,在写这篇博客的前一天是七夕,也是中国传统的“情人节”,不知道各位脱单了吗?碰巧最近刷题时遇到了经典的单身狗问题想带大家深入探…...
消息队列前世今生 字节跳动 Kafka #创作活动
消息队列前世今生 1.1 案例一: 系统崩溃 首先大家跟着我想象一下下面的这个的场景, 看到新出的游戏机,太贵了买不起,这个时候你突然想到,今天抖音直播搞活动,打开抖音搜索,找到直播间以后&am…...
『SEQ日志』在 .NET中快速集成轻量级的分布式日志平台
📣读完这篇文章里你能收获到 如何在Docker中部署 SEQ:介绍了如何创建和运行 SEQ 容器,给出了详细的执行操作如何使用 NLog 接入 .NET Core 应用程序的日志:详细介绍了 NLog 和 NLog.Seq 来配置和记录日志的步骤日志记录示例&…...
Django会话技术
文章目录 Cookie实践运行结果 CSRF防止CSRF Session实践 Cookie 理论上,一个用户的所有请求燥作都应该属于同一个会话,而另一个用户的所有请求操作则应该属于另一个会话,二者不能混淆,而web应用程序是使用HTTP协议传输数据的。HTT…...
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
本文是LLM系列的文章,针对《Tree of Thoughts: Deliberate Problem Solving with Large Language Models》的翻译。 思维树:用大模型进行深思熟虑的问题解决 摘要1 引言2 背景3 思维树:用LM进行深思熟虑的问题解决4 实验5 相关工作6 讨论 摘…...
C语言刷题(13)
第一题 第二题 第三题 第四题 第五题 第六题 第七题 注意 1.nsqrt(n),sqrt本身不会将n开根 2.初始化已经令sumn了,故相加的个数为m-1次...
RK3568 uart串口
一.简介 串口全称叫做串行接口,通常也叫做 COM 接口,串行接口指的是数据一个一个的顺序传 输,通信线路简单。使用两条线即可实现双向通信,一条用于发送,一条用于接收。串口通信 距离远,但是速度相对会低&a…...
企业数字化转型中,VR数字展厅能有哪些体验?
在数字化转型的浪潮下,企业纷纷开始注重数字展厅的开展,VR虚拟展厅结合VR全景技术,可以创造出许多有趣的玩法和体验,无论是虚拟参观、互动体验还是VR云会议对接,都为企业客户带来了全新的感知方式。 同传统展厅相比&am…...
台州路桥网站建设/手游推广渠道
CNN卷积神经网络之ZFNet与OverFeat前言一、ZFNet1)网络结构2)反卷积可视化1.反最大池化(Max Unpooling)2.ReLu激活3.反卷积可视化得出的结论二、OverFeat1)网络结构2)创新方法1.全卷积2.多尺度预测3.Offset pooling前言 这两个网…...
做网站挂靠服务器/百度推广平台首页
文章目录1. let1. 具有块级作用域2. 不存在变量提升3. 暂时性死区4. 经典面试题5. 小结2. const1. 具有块级作用域2. 声明常量时必须赋值3. 常量赋值后,值不能修改4. 小结5. let、const、var的区别3. 解构赋值1. 数组解构2. 对象解构3. 对象的连续解构赋值4. 小结4.…...
网站ip pv/免费下载百度并安装
医嘱的查对与执行作为护理工作的基础和重点,要求护士熟悉掌握,我们一起看一下:一、医嘱查对制度(1)处理长期医嘱或临时医嘱时要记录处理时间,执行者签全名, 若有疑问必须问清楚后方可执行。各班医嘱均由当班护士两名进行查对。(2)…...
公司网站建设 wordpress/百度投稿平台
有一种工作是经常要接触视频的,目前很多的视频平台对视频的要求还是很高的,有一个上传视频大小的限制,超过这个大小的视频无法正常进行发布,过大的视频需要压缩变小,下面介绍具体的压缩方法,,那…...
wordpress点击后出现浮窗/百度app打开
文章目录一、基本概念:①字母表:②字母表上的运算:③符号串:④符号串上的运算:二、文法的定义:①文法的形式化定义:②产生式的简写:③符号约定:三、语言的定义࿱…...
南京专业网站设计公司价格/宣传推广策略
循环是为了执行重复的动作forwhileuntil1、for循环语法:for 变量 in 变量列表do循环体;done# cat for1.sh #!/bin/bashfor i in seq 5doecho $idonein后面接列表 for i in 1 2 3 4 5 seq 10for i in {1..10}插曲 ---------------------------------------seq 10 …...