Rust源码分析——Rc 和 Weak 源码详解
Rc 和 Weak 源码详解
一个值需要被多个所有者拥有
- rust中所有权机制在图这种数据结构中,一个节点可能被多个其它节点所指向。那么如何表示图这种数据结构?
- 在多线程中,多个线程可能会持有同一个数据?如何解决这个问题。
Rc
rust 通过使用引用计数智能指针 Rc 和 Arc 来解决上面的问题。当我们对一个被 Rc 所标识的数据进行 clone() 的时候,并不会复制其内部数据,只是增加引用计数,而当一个 Rc 被 drop 的时候,只会减少其引用计数,直到引用计数为0,此时才会真正清除对应的内存。
但是使用引用计数方案有一个问题,那就是如何解决循环引用问题?如果不了解引用计数方式管理内存的,可以看这篇文章。rust 为了解决这个问题,提供了弱引用(Weak)。它不拥有数据的所有权,只产生弱引用计数。
我们来看一下 Rc 这个结构
#[cfg_attr(not(test), rustc_diagnostic_item = "Rc")]
#[stable(feature = "rust1", since = "1.0.0")]
#[rustc_insignificant_dtor]
pub struct Rc<T: ?Sized> {ptr: NonNull<RcBox<T>>,phantom: PhantomData<RcBox<T>>,
}#[stable(feature = "rust1", since = "1.0.0")]
impl<T: ?Sized> !Send for Rc<T> {}// Note that this negative impl isn't strictly necessary for correctness,
// as `Rc` transitively contains a `Cell`, which is itself `!Sync`.
// However, given how important `Rc`'s `!Sync`-ness is,
// having an explicit negative impl is nice for documentation purposes
// and results in nicer error messages.
#[stable(feature = "rust1", since = "1.0.0")]
impl<T: ?Sized> !Sync for Rc<T> {}
首先,Rc 是一个结构体,可以看到它不满足 Send 和 Sync 这两个 trait,这意味着 Rc 是不能跨线程的,它只适用于单线程下的引用计数。这是 rust 专门为单线程场景设计的高性能引用计数器;而多线程下需要 Arc (atomic reference counting)来实现多线程的引用计数。
另外一点就是 Rc 接受的泛型参数可以是大小未知(unsized)类型。Rc 结构体中有两个字段 ptr 和 phantom 。ptr 的类型是NonNull<RcBox<T>>
pub struct NonNull<T: ?Sized> {pointer: *const T,
}
也就是说 ptr 实际上是一个指向 RcBox<T>
的非空指针。OK,我们接着来看一下 RcBox 类型
struct RcBox<T: ?Sized> {strong: Cell<usize>,weak: Cell<usize>,value: T,
}
下面,让我来详细解释这个结构体的各个字段:
-
strong: Cell<usize>
:这个字段是一个 Cell 类型的包装,用于存储强引用计数(strong reference count)。Cell 是 rust标准库提供的一种允许在不可变情况下修改其内部值的类型。强引用计数用于跟踪有多少个 Rc 实例仍然拥有对数据的引用。每当创建一个新的 Rc 引用时,强引用计数会递增;当 Rc 引用离开作用域或被丢弃时,强引用计数递减。 -
weak: Cell<usize>
:这个字段是一个 Cell 类型的包装,用于存储弱引用计数(weak reference count)。弱引用计数用于跟踪有多少个 Weak 引用(Rc 的弱引用)仍然存在,但它不会阻止数据的销毁。与强引用不同,当只有弱引用剩余时,数据可以被销毁。每当创建一个新的 Weak 引用时,弱引用计数会递增;当Weak 引用离开作用域或被丢弃时,弱引用计数递减。 -
value: T
:这是 Rc 包装的实际值的字段。Rc 用于共享这个值,因此它包含在 RcBox 中。
既然强引用,弱引用以及值都包含在 RcBox 中了,那么 phantom: PhantomData<RcBox<T>>
的作用是什么?
PhantomData 是一个泛型类型,通常用于标记类型参数在运行时不实际占用内存。在这里,它用于确保 RcBox<T>
存在,尽管它在运行时不占用内存。这是为了帮助Rust编译器进行正确的类型检查和生命周期分析。
pub struct PhantomData<T: ?Sized>;
正如我们所见,PhantomData 是一个单元结构体,它的大小是零字节,不占用内存空间。
我们进一步来看一下 Rc 的构造方法,看看它到底是如何做到让一个值可以有多个所有者?按照之前的一个值只有一个所有者的模型,当所有者生命周期结束的时候,值就会被回收;而 Rc 是在强引用计数到 0 的时候,释放内存。
pub fn new(value: T) -> Rc<T> {// There is an implicit weak pointer owned by all the strong// pointers, which ensures that the weak destructor never frees// the allocation while the strong destructor is running, even// if the weak pointer is stored inside the strong one.unsafe {Self::from_inner(Box::leak(Box::new(RcBox { strong: Cell::new(1), weak: Cell::new(1), value })).into(),)}
}
首先,我们注意到 new 的实现代码是 unsafe 的,这是因为 Box::leak
方法将 Box 中的数据泄漏(leak)出来,而这个操作将绕过 Rust 的所有权和生命周期检查,这样 RcBox 结构体数据将被泄漏到堆上,使其在函数结束后继续存在,而不是按正常方式被释放,通过这种手段,让 RcBox 拥有了足够长的生命周期,以便在多个 Rc 实例之间正确地共享数据。
这段代码的注释中还告诉了我们:所有强引用指针(Rc 实例)之间都存在一个隐式的弱引用指针。这个隐式的弱引用用于确保在强引用的析构函数运行期间,弱引用不会释放数据,即使在强引用指针中存储了一个弱引用。后面当我们介绍 Weak 析构函数的时候,会看到它需要先读取 RcBox 中的数据。这样就防止弱引用析构执行的时候会访问到悬垂指针。
接着,我们来看一下析构函数的代码。
fn drop(&mut self) {unsafe {self.inner().dec_strong(); // 强引用计数减 1if self.inner().strong() == 0 {// destroy the contained objectptr::drop_in_place(Self::get_mut_unchecked(self));// remove the implicit "strong weak" pointer now that we've// destroyed the contents.self.inner().dec_weak(); // 弱引用计数减 1if self.inner().weak() == 0 {Global.deallocate(self.ptr.cast(), Layout::for_value(self.ptr.as_ref()));}}}
}
- 如果强引用计数为零,表示没有任何强引用指向数据了,这意味着数据可以安全地被销毁。
- 如果弱引用计数降至零,表示没有任何弱引用指向数据,将弱引用相关的资源清理掉。
既然 RcBox 中也存储了弱引用计数,那么 Rc 肯定提供了从一个 Rc 获取到 弱引用的方法。实际上就是 downgrade 方法
pub fn downgrade(this: &Self) -> Weak<T> {this.inner().inc_weak();// Make sure we do not create a dangling Weakdebug_assert!(!is_dangling(this.ptr.as_ptr()));Weak { ptr: this.ptr }
}
这个函数非常简单,让弱引用计数加1,然后保证不是悬垂指针之后,用这个指针作为参数构造了一个 Weak 返回。这样就实现了从 Rc 中获取 Weak。
Weak
我们顺便来看一下弱引用,Weak 用于创建弱引用,通常与 Rc 智能指针一起使用。
pub struct Weak<T: ?Sized> {// This is a `NonNull` to allow optimizing the size of this type in enums,// but it is not necessarily a valid pointer.// `Weak::new` sets this to `usize::MAX` so that it doesn’t need// to allocate space on the heap. That's not a value a real pointer// will ever have because RcBox has alignment at least 2.// This is only possible when `T: Sized`; unsized `T` never dangle.ptr: NonNull<RcBox<T>>,
}
Weak 也存储了一个指向 RcBox 的指针。看起来这是比 Rc 少了一个标记字段,实际上它们的构造函数完全不同。
pub const fn new() -> Weak<T> {Weak { ptr: unsafe { NonNull::new_unchecked(ptr::invalid_mut::<RcBox<T>>(usize::MAX)) } }
}
ptr::invalid_mut
函数来创建一个无效的指针,其值被设置为 usize::MAX
。这个无效指针用于表示一个 Weak 弱引用指针,它不引用任何真实的数据,但是用于表示一个空的 Weak 实例,然后将其包装在 NonNull 中,并返回作为 Weak 实例的一部分。这个无效的 Weak 实例通常用于初始化,之后可以使用 upgrade 方法来尝试获取一个真实的强引用。
实际上,在 Weak 结构体的注释中已经解释了 new 方法为什么会是这样。设置为 usize::MAX 的目的是为了避免在创建 Weak 时需要分配堆内存。由于 Weak 通常用于检查数据的存在性而不需要实际引用数据。
我们再来看一下析构函数,
fn drop(&mut self) {let inner = if let Some(inner) = self.inner() { inner } else { return };inner.dec_weak(); // 弱引用计数减1// the weak count starts at 1, and will only go to zero if all// the strong pointers have disappeared.if inner.weak() == 0 {unsafe {Global.deallocate(self.ptr.cast(), Layout::for_value_raw(self.ptr.as_ptr()));}}
}
let inner = if let Some(inner) = self.inner() { inner } else { return };
:这一行代码的目的是获取 Weak 引用内部的 RcBox 数据结构,以便后续操作。self.inner() 方法用于获取内部数据,如果存在则返回 Some(inner),否则返回 None。如果不存在内部数据,说明这个 Weak 已经被销毁,所以函数提前返回(return)。
如果弱引用计数降至零,说明没有任何弱引用指向数据,这意味着数据可以被释放。此时使用 Global.deallocate 来释放和 Weak 相关的内存。
前面说过可以通过 Rc 获取到一个弱引用,那么同样,当我们需要通过 Weak 来获取数据的时候,就会产生一个 Rc。这个时候就需要使用 Weak 提供的 upgrade 方法。
pub fn upgrade(&self) -> Option<Rc<T>> {let inner = self.inner()?;if inner.strong() == 0 {None} else {unsafe {inner.inc_strong();Some(Rc::from_inner(self.ptr))}}
}
首先,尝试获取 RcBox 中的数据,如果是 None,则直接返回,否则获取到 RcBox 中的数据,进行强引用计数判断,如果强引用计数为 0,那么意味着数据被释放,返回 None,否则将强引用计数加 1,然后返回一个 Rc 实例。
参考资料
Rust 官方文档: https://doc.rust-lang.org/std/rc/struct.Rc.html
相关文章:
Rust源码分析——Rc 和 Weak 源码详解
Rc 和 Weak 源码详解 一个值需要被多个所有者拥有 rust中所有权机制在图这种数据结构中,一个节点可能被多个其它节点所指向。那么如何表示图这种数据结构?在多线程中,多个线程可能会持有同一个数据?如何解决这个问题。 Rc rus…...
【网络编程】深入理解TCP协议二(连接管理机制、WAIT_TIME、滑动窗口、流量控制、拥塞控制)
TCP协议 1.连接管理机制2.再谈WAIT_TIME状态2.1理解WAIT_TIME状态2.2解决TIME_WAIT状态引起的bind失败的方法2.3监听套接字listen第二个参数介绍 3.滑动窗口3.1介绍3.2丢包情况分析 4.流量控制5.拥塞控制5.1介绍5.2慢启动 6.捎带应答、延时应答 1.连接管理机制 正常情况下&…...
社区团购商城小程序v18.1开源独立版+前端
新增后台清理缓存功能 修复定位权限 修复无法删除手机端管理员 11月新登录接口修复! 修复商家付款到零钱, 修复会员登陆不显示头像, 修复无法修改会员开添加绑定...
MATLAB入门-字符串操作
MATLAB入门-字符串操作 注:本篇文章是学习笔记,课程链接是:link MATLAB中的字符串特性: 无论是字符还是字符串,都要使用单引号来‘’表示;在MATLAB中,字符都是在矩阵中存储的,无论…...
Kong Learning
一、Kong Kong是由Mashape公司开源的可扩展的Api GateWay项目。它运行在调用Api之前,以插件的扩展方式为Api提供了管理。比如,鉴权、限流、监控、健康检查等,Kong是基于lua语言、nginx以及openResty开发的,所有拥有动态路由、负载…...
Python怎样写桌面程序
要编写Python桌面应用程序,可以使用以下几种方法: 1.使用Tkinter模块:Tkinter是Python自带的GUI工具包之一,可以使用它来创建基本的GUI界面。例如,可以创建一个简单的窗口,添加按钮、文本框等控件…...
蓝桥杯2023年第十四届省赛真题-平方差--题解
蓝桥杯2023年第十四届省赛真题-平方差 时间限制: 3s 内存限制: 320MB 提交: 2379 解决: 469 题目描述 给定 L, R,问 L ≤ x ≤ R 中有多少个数 x 满足存在整数 y,z 使得 x y2 − z2。 输入格式 输入一行包含两个整数 L, R,用一个空格分隔。 输出格…...
iText实战--根据绝对位置添加内容
3.1 direct content 概念简介 pdf内容的4个层级 层级1:在text和graphics底下,PdfWriter.getDirectContentUnder() 层级2:graphics层,Chunk, Images背景,PdfPCell的边界等 层级3:text层,Chun…...
使用navicat for mongodb连接mongodb
使用navicat for mongodb连接mongodb 安装navicat for mongodb连接mongodb 安装navicat for mongodb 上文mongodb7.0安装全过程详解我们说过,在安装的时候并没有勾选install mongodb compass 我们使用navicat去进行可视化的数据库管理 navicat for mongodb下载地址…...
Qt ffmpeg音视频转换工具
Qt ffmpeg音视频转换工具,QProcess方式调用ffmpeg,对音视频文件进行格式转换,支持常见的音视频格式,主要在于QProcess的输出处理以及转换的文件名和后缀的处理,可以进一步加上音视频剪切合并和音视频文件属性查询修改的…...
机器学习笔记 - 视频分析和人类活动识别技术路线简述
一、理解人类活动识别 首先了解什么是人类活动识别,简而言之,是对某人正在执行的活动/动作进行分类或预测的任务称为活动识别。 我们可能会有一个问题:这与普通的分类任务有什么不同?这里的问题是,在人类活动识别中,您实际上需要一系列数据点来预测正确执行的动作。 看看…...
Redis从入门到精通(三:常用指令)
前边我们介绍了redis存储的四种基本数据类型,并纵向介绍了这四种数据类型的各种指令操作,现在我们这个章节从横向来总结一下关于key的常用指令和数据库常用指令 key常用指令 删除指定key del key 获取key是否存在 exists key 获取key的类型 type …...
代码随想录day39 || 动态规划 || 不同路径
62.不同路径 ● 力扣题目链接 ● 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 ● 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 ● 问总共有…...
电商平台API接口采集电商平台淘宝天猫京东拼多多数据获取产品详情信息,销量,价格,sku案例
淘宝SKU详情接口是指,获取指定商品的SKU(Stock Keeping Unit,即库存量单位)的详细信息。SKU是指提供不同的商品参数组合的一个机制,通过不同的SKU来标识商品的不同组合形式,如颜色、尺寸等。SKU详情接口可以…...
The ‘<‘ operator is reserved for future use. 错误解决
The < operator is reserved for future use. 错误解决 在 PowerShell 终端执行 python learnstock.py < ldata.txt 发生错误, The < operator is reserved for future use.解决方法, cmd /c python learnstock.py < ldata.txt完结&#x…...
vulnhub靶机Thoth-Tech
下载地址:https://download.vulnhub.com/thothtech/Thoth-Tech.ova 主机发现 arp-scan -l 目标:192.168.21.148 端口扫描 nmap --min-rate 10000 -p- 192.168.21.148 服务扫描 nmap -sV -sT -O -p21,22,80 192.168.21.148 漏洞扫描 nmap --scriptvu…...
不可思议,无密码登录所有网站!
hello,我是小索奇 居然可以免密码登录你的网站?听起来是不是很恐怖 确实如此,Cookie可以用于保持用户在网站上的登录状态,从而实现 免密码登录,学会了不要做坏事哈 这里仅做免密码登录的实操,就不介绍Cooki…...
深度学习编译器关键组件
1 高层中间代码 为了克服传统编译器中采用的IR限制DL模型中复杂计算的表达的局限性,现有的DL编译器利用高层IR(称为图IR)进行高效的代码优化设计。 1.1 图表示 基于DAG的IR:基于DAG的IR是编译器构建计算图的最传统方法之一&…...
【C++】string类模拟实现下篇(附完整源码)
目录 1. resize2. 流插入<<和流提取>>重载2.1 流插入<<重载2.2 流提取 << 3. 常见关系运算符重载4. 赋值重载4.1浅拷贝的默认赋值重载4.2 深拷贝赋值重载实现4.3 赋值重载现代写法 5. 写时拷贝(了解)6.源码6.1 string.h6.2 test.cpp 1. res…...
Android高级开发-APK极致优化
九道工序 1. SVG(Scalable Vector Graphics)可缩放矢量图 使用矢量图代替位图可以减小 APK 的尺寸,因为可以针对不同屏幕密度调整同一文件的大小,而不会降低图像质量。 矢量图首次加载时可能消耗更多的 CPU 资源。之后,二者的内存使用率和…...
Rocketmq--消息驱动
1 MQ简介 1.1 什么是MQ MQ(Message Queue)是一种跨进程的通信机制,用于传递消息。通俗点说,就是一个先进先出的数据结构。 1.2 MQ的应用场景 1.2.1 异步解耦 最常见的一个场景是用户注册后,需要发送注册邮件和短信通…...
华为云云耀云服务器L实例评测|centos系统搭建git私服
搭建git私服 前言一、华为云云耀云服务器L实例租用二、华为云云耀云服务器L实例安装git三、华为云云耀云服务器L实例git配置1.创建文件用于存放公钥2.设置文件权限3.配置本地公钥 四、华为云云耀云服务器L实例部署git仓库四、git仓库到本地总结 前言 之前一直想搭建一个属于自…...
苹果CMS主题 MXonePro二开优化修复开源版影视网站源码
MXPro模板主题(又名:mxonepro)是一款基于苹果cms程序的一款全新的简洁好看UI的影视站模板类似于西瓜视频,不过同对比MxoneV10魔改模板来说功能没有那么多,也没有那么大气,但是比较且可视化功能较多简洁且有周更记录样式等多功能后台设置&…...
【新版】系统架构设计师 - 软件架构设计<轻量级架构>
个人总结,仅供参考,欢迎加好友一起讨论 文章目录 架构 - 软件架构设计<轻量级架构>考点摘要轻量级架构表示层业务逻辑层持久层数据库 SSH与SSMORMHibernate与Mybatis 架构 - 软件架构设计<轻量级架构> 考点…...
系统架构设计专业技能 ·结构化需求分析 - 数据流图
现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in reality. 点击进入系列文章目录 系统架构设计高级技能 结构化需求分析 - 数据流图 一、数据流图的基本概念二、需…...
linux内核分析:线程和进程创建,内存管理
lec18-19:进程与线程创建 lec20-21虚拟内存管理 内核代码,全局变量这些只有一份,但是内核栈有多份,这可能就是linux线程模型1对1模式的由来。通过栈来做的 x86 CPU支持分段和分页(平坦内存模式)两种 分段,选择子那里就有特权标记了...
SpringMvc根据返回值类型不同处理响应
目录 一、介绍 二、返回值为void (1)控制层方法 三、返回值为String (1)控制层 四、返回值为ModelAndView (1)控制层方法 (2)jsp页面 一、介绍 我们可以通过控制器方法的返回…...
jq命令安装与使用
目录 一、简介二、下载及安装1.Linux 安装2.Windows 安装3.测试安装结果 三、jq用法1.基本语法2.常见用法1)格式化 JSON2)获取属性3)属性不存在情况处理4)数组遍历、截取、展开5)管道、逗号、加号6)数据构造…...
网络面试题汇总
简述 TCP 连接的过程(淘系) 参考答案: TCP 协议通过三次握手建立可靠的点对点连接,具体过程是: 首先服务器进入监听状态,然后即可处理连接 第一次握手:建立连接时,客户端发送 syn 包…...
Java————初始集合框架
一 、 集合框架 Java 集合框架Java Collection Framework ,又被称为容器container , 是定义在 java.util 包下的一组接口interfaces 和其实现类classes 。 其主要表现为将多个元素element 置于一个单元中, 用于对这些元素进行快速、便捷的存…...
电子商务网站建设感想/专业seo推广
在C语言中,结构是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构、联合等)的数据单元。在结构中,编译器为结…...
容桂销售型网站建设/百度推广客户端手机版下载
1.管理工具---服务里面停止Mysql服务。 2.控制面板---卸载Mysql,删除C:\Program Files\MySQL目录. 3.这是最关键一步,只做前面两步,密码还是修改不了,因为MySQL 还有文件,也就是在C:\Documents and Settings\All Users…...
asp.net做网站后台/公司宣传软文
Boris FX Continuum Complete 2020又简称BCC插件2020,是为Adobe软件和OFX而开发的视频特效插件,该插件能够为用户提供了丰富的特效,类型多样,拥有图像恢复,拉伸文本,处理标题和3D对象,色调调节&…...
中国菲律宾男篮直播/东莞seo外包公司
Linux内核模块编程入门看到昨天有好几个问linux内核编程问题的帖子,不少是卡在了入门问题上,就整理一下入门的初步流程。针对2.6内核的Linux系统,需要你的机器上已经安装了kernel-devel这个包,也就是编译模块所必须的东西…...
初学网站开发需要书籍/百度网站收录
汇率换算V1.0 案例描述: 设计一个汇率换算器程序,其功能是将外币换算成人民币,或者相反 案例分析: 分析问题:分析问题的计算部分; 确定问题:将问题划分为输入、处理及输出部分; 设计…...
前端开发线上培训/网站seo在线优化
2019独角兽企业重金招聘Python工程师标准>>> 1、连接MYSQL数据库代码 <?php $connecmysql_connect("localhost","root","root") or die("不能连接数据库服务器: ".mysql_error()); mysql_select_db("l…...