ThreadLocal深度解析
简介
在并发编程中,导致并发bug的问题都会归结于对共享变量的操作不当。多个线程同时读写同一共享变量存在并发问题,我们可以利用写时复制、不变性来突破对原数据的写操作,没有写就没有并发问题,而本篇文章所介绍的技术是突破共享变量,没有共享变量也不会有并发问题。
Java中避免线程共享的一大利器就是ThreadLocal,我们本篇文章重点讲述它的底层原理、常见的一些用途、创建和使用等。
首先介绍一下它是什么:
ThreadLocal
是 Java 的一个类,位于java.lang
包下。它为每一个线程提供了一个独立的变量副本,使得每个线程可以独立地改变自己的副本,而不会影响其他线程所对应的副本。
它的主要作用就是避免线程间共享,除此之外还能避免无必要的同步以及降低变量使用的复杂度:
- 线程隔离:在多线程环境下,
ThreadLocal
可以为每一个线程提供一个独立的变量实例。因此,每个线程都可以独立地操作该变量,而不需要考虑并发问题。这种特性使得ThreadLocal
成为一个非常方便的保存线程状态或线程局部变量的工具。 - 避免无必要的同步:由于每个线程都有其自己的变量副本,所以它们可以无需任何同步措施就可以访问这些变量,从而提高了程序的执行效率。
- 降低复杂度:在某些场景下,如果需要通过参数传递线程局部变量,可能会使得方法签名和调用变得复杂。使用
ThreadLocal
可以避免这种复杂性,因为它允许我们在任何地方获取到线程相关的数据。
工作原理
我们在学习ThreadLocal的时候,如果不了解其底层实现的话,通常会进入一个误区:ThreadLocal类里面维护了一个Map,这个Map的key为线程引用,值为自己设置的值。其实Java真正的实现是ThreadLocal仅是一个工具类,提供线程对数据的访问,实际真正拥有这个数据的角色是线程自身(这也解释了简介中提到的每个线程都有针对某一变量的副本
),如下图所示:
相信大家会有这样一个疑问:为什么Java没有按照我们预想的那样实现呢?其主要原因就是:不容易造成内存泄漏。假设Java按照我们预想的方案实现,我们分析下会造成什么样的问题:ThreadLocal 持有的 Map 会持有 Thread 对象的引用,这就意味着,只要 ThreadLocal 对象存在,那么 Map 中的 Thread 对象就永远不会被回收。ThreadLocal 的生命周期往往都比线程要长,所以这种设计方案很容易导致内存泄露。而 Java 的实现中 Thread 持有 ThreadLocalMap,而且 ThreadLocalMap 里对 ThreadLocal 的引用还是弱引用(WeakReference),所以只要 Thread 对象可以被回收,那么 ThreadLocalMap 就能被回收。Java 的这种实现方案虽然看上去复杂一些,但是更加安全。
另外这里面的关于Entry[]大小的问题有个讨论点:为什么ThreadLocalMap中的Entry[]大小一定是2的幂次方呢?
其主要原因如下:
- 优化索引计算:当 table 大小为 2 的次幂时,计算索引位置可以通过简单的位操作实现,而不需要执行昂贵的除法操作。例如,如果 table 大小为 16,那么为了得到一个 key 对应的索引位置,只需要计算
key的hashCode & (table.length - 1)
。这种位操作比标准的模运算(%)速度快得多。 - 均匀分布:2 的次幂大小确保了哈希值在 table 中均匀分布,减少了哈希冲突的可能性。这是因为当我们使用
hashCode & (table.length - 1)
这种方式时,hash值的低位将被有效地使用来计算索引,这在大多数情况下可以确保数据在 table 中均匀分布。 - 容易扩容:当 table 需要扩容时(例如,当存储的元素太多,达到了负载因子的限制),新的大小可以简单地翻倍,仍然保持为 2 的次幂。
- 历史与一致性:Java 中的其他哈希结构,如
HashMap
,也使用了类似的策略,因此保持这种做法在某种程度上也是为了一致性。
总的来说,选择 2 的次幂作为 table 大小是一个优化决策,旨在提高性能、减少哈希冲突并简化内部操作。
常见用途
- 数据库连接:使用
ThreadLocal
保存每个线程独立的数据库连接,确保在同一线程中共享同一个数据库连接,而不是频繁地创建和销毁。 - 日期格式化:
SimpleDateFormat
不是线程安全的,但我们可以用ThreadLocal
来为每个线程创建独立的SimpleDateFormat
实例,避免并发问题。 - Web 会话管理:在 Web 应用中,可以使用
ThreadLocal
来保存当前请求的用户会话或其他会话相关的信息。 - 框架中的上下文信息:许多框架使用
ThreadLocal
来保存线程级别的上下文数据,例如 Spring 中的事务管理。
创建和使用
下面使用ThreadLocal演示一下为每一个线程分配一个线程ID的代码,不同线程拥有不同的线程ID。
package com.markus.concurrent;import java.util.concurrent.atomic.AtomicLong;/*** @author: markus* @date: 2023/8/20 4:16 PM* @Description:* @Blog: https://markuszhang.com* It's my honor to share what I've learned with you!*/
public class ThreadLocalDemo {static class ThreadID {static final AtomicLong nextId = new AtomicLong(0);static final ThreadLocal<Long> tl = ThreadLocal.withInitial(nextId::incrementAndGet);public static Long get() {return tl.get();}}static class GetThreadId implements Runnable {@Overridepublic void run() {for (int i = 0; i < 3; i++) {System.out.println("Thread [" + Thread.currentThread().getName() + "],its id is " + ThreadID.get());}}}public static void main(String[] args) {Thread t1 = new Thread(new GetThreadId(), "t1");Thread t2 = new Thread(new GetThreadId(), "t2");t1.start();t2.start();}
}
控制台打印:
优势、缺点与陷阱
在多线程编程中,ThreadLocal
是一个不可或缺的工具。其主要优势在于为每个线程提供了私有的、独立的变量副本,从而消除了多线程并发访问的问题。这种独立性确保了每个线程都可以无需同步就能访问其局部变量,大大提高了程序的并发性和效率。此外,它还能简化代码结构,避免了复杂的参数传递,为线程关联上下文信息提供了便捷手段,如日志记录中的会话ID。
但是,与其带来的好处相伴的是一些潜在的陷阱。最为严重的问题是与内存泄漏相关。因为ThreadLocal
使用弱引用来引用键,但其对应的值则是强引用。如果不适时地清理,尤其是在线程生命周期结束前不调用 remove()
方法,可能会造成内存泄漏。此外,过度或不适当地使用 ThreadLocal
可能导致代码结构混乱,并降低代码的可读性和维护性。
总之,当我们在项目中使用 ThreadLocal
时,应该始终注意其潜在的陷阱和限制。正确、合理地使用 ThreadLocal
可以为我们带来很多好处,但不恰当的使用可能会引发一系列问题。在使用前,充分了解其工作机制并持续关注是非常必要的。
InheritableThreadLocal
顾名思义,可继承的ThreadLocal。我们知道ThreadLocalMap是线程持有的,每个变量都在各自的线程中保存一个副本,每个线程都能拿到自己的值,但是如果父线程创建了一个子线程,那么这个子线程是无法拿到父线程中的ThreadLocalMap中的信息的。InheritableThreadLocal的出现就是解决这个问题的。它继承自ThreadLocal,相关用法与ThreadLocal一致,这里就不介绍了。
最佳实践
-
限制使用范围:仅在确实需要线程局部变量来解决问题时使用
ThreadLocal
。不应该过度使用或在不必要的场合使用它。 -
及时清理:
- 一定要在不再需要线程局部变量时调用
ThreadLocal
的remove()
方法,以释放资源并避免潜在的内存泄漏。 - 在 Web 容器中,例如 Tomcat,确保在请求结束后清除
ThreadLocal
,因为容器可能会重用线程。
- 一定要在不再需要线程局部变量时调用
-
避免长时间存活的线程局部变量:如果一个线程预计会长时间存活而不释放(例如线程池中的线程),那么这种线程中的
ThreadLocal
变量也会长时间存活。在这种情况下,应该特别注意清理这些变量。 -
不要存储大对象:为了避免内存消耗,不应该在
ThreadLocal
中存储大对象或那些你不打算很快释放的对象。、 -
考虑使用
InheritableThreadLocal
:当需要在一个线程及其所有子线程之间共享一个变量时,可以考虑使用InheritableThreadLocal
。但要注意,如果子线程修改了这个变量,它不会影响到父线程中的值。 -
考虑线程安全性:虽然
ThreadLocal
变量不需要同步来保证线程安全,但存储在其中的对象仍然可能需要同步,尤其是当多个线程可能访问同一个ThreadLocal
变量中的同一个实例时(例如,使用InheritableThreadLocal
)。 -
优先使用库提供的线程局部功能:有些库或框架可能已经提供了其自己的线程局部功能,例如 Java EE 和 Spring。在这种情况下,优先使用库或框架提供的功能,除非有特定的需求使得必须使用原生的
ThreadLocal
。 -
不要将
ThreadLocal
作为全局变量:尽量避免将ThreadLocal
作为静态变量,除非你确实需要这样做。静态的ThreadLocal
变量可能会导致预料之外的问题,尤其是当类被卸载时。 -
不建议你在线程池中使用 InheritableThreadLocal,不仅仅是因为它具有 ThreadLocal 相同的缺点——可能导致内存泄露,更重要的原因是:线程池中线程的创建是动态的,很容易导致继承关系错乱,如果你的业务逻辑依赖 InheritableThreadLocal,那么很可能导致业务逻辑计算错误,而这个错误往往比内存泄露更要命
总之,ThreadLocal
是一个有用但需要小心使用的工具。确保了解其工作原理,并始终遵循上述的最佳实践,这样可以最大化其价值并避免潜在的问题。
总结
好了,简单总结一下我们本篇讲述的内容,首先讲述了ThreadLocal是什么以及它的作用是什么,并通过图片展示ThreadLocal模型,知道了ThreadLocal其实就是一个工具类,内部不保存数据,真正保存数据的地方是在Thread本身,也就是我们常说的每个Thread都有一个变量的副本。也介绍了ThreadLocalMap中的Entry[]数组为什么大小一定要限制为2的幂次方,后面通过一段代码简单演示了ThreadLocal的使用,并再次声明了它的优势和其缺点以及使用不到出现的陷阱。讲述过程中提到了父子线程不共享变量副本的问题,而Java提供了InheritableThreadLocal解决这一问题。最终我们罗列了ThreadLocal的最佳实践。
相关文章:
ThreadLocal深度解析
简介 在并发编程中,导致并发bug的问题都会归结于对共享变量的操作不当。多个线程同时读写同一共享变量存在并发问题,我们可以利用写时复制、不变性来突破对原数据的写操作,没有写就没有并发问题,而本篇文章所介绍的技术是突破共享…...
06有监督学习——迁移学习
1.迁移学习分类 (1) 基于实例的迁移学习方法: 假设:源域中的一些数据和目标域会共享很多共同的特征方法:对源域进行instance reweighting,筛选出与目标域数据相似度高的数据,然后进行训练学习 (2&#x…...
快速连接服务器脚本 可从多个服务中选择并连接
使用 python 做一个可选择服务器登录连接的脚本 前置条件 需要有python 环境python --version 显示版本号即可检查 python 是否有 paramiko 包没有的话 python install paramiko创建一个python 文件,内容如下 # -*- coding: utf-8 -*-""" Authors: huxiaohua…...
MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法
目录 1、摘要 2、Method 2.1 模拟异常样本 2.2 Memory Module 2.3 空间注意模块 2.4 多尺度特征融合模块 2.5 损失函数设置 2.6 Decoder模块 1、摘要 本文认为人为创建类内差异和保持类内共性可以帮助模型实现更好的缺陷检测能力,从而更好地区分非正常图像。如…...
迈向未来的大门:人脸识别技术的突破与应用
迈向未来的大门:人脸识别技术的突破与应用 人脸识别:人脸识别的工作流程人脸识别的作用人脸识别技术的突破与应用 在深度学习人脸识别之前我们要先知道人脸识别是什么。 人脸识别: 人脸识别是一种基于人脸图像或视频进行身份验证或识别的技术…...
Vue-9.集成(.editorconfig、.eslintrc.js、.prettierrc)
介绍 同时使用 .editorconfig、.prettierrc 和 .eslintrc.js 是很常见的做法,因为它们可以在不同层面上帮助确保代码的格式一致性和质量。这种组合可以在开发过程中提供全面的代码维护和质量保证。然而,这也可能增加一些复杂性,需要谨慎配置…...
Qt 编译使用Bit7z库接口调用7z.dll、7-Zip.dll解压压缩常用Zip、ISO9660、Wim、Esd、7z等格式文件(一)
bit7z一个c静态库,为7-zip共享库提供了一个干净简单的接口 使用CMAKE重新编译github上的bit7z库,用来解压/预览iso9660,WIm,Zip,Rar等常用的压缩文件格式。z-zip库支持大多数压缩文件格式 导读 编译bit7z(C版本)使用mscv 2017编译…...
AndroidUI体系
见:GitHub - eHackyd/Android_UI: Android UI体系的学习笔记...
CBV (基于类的视图)源码解析(1)
面向对象和反射的一些补充说明 class Animal:def __init__(self, name, age, func_str):self.name nameself.age age# self 指的是类实例对象,此处指的是 Dog 的实例对象# 所以如果 Dog 中重写了 sleep 方法,那么 self.sleep() 调用的就是 Dog 中的 s…...
2023-08-17 Untiy进阶 C#知识补充7——C#8主要功能与语法
文章目录 一、Using 声明二、静态本地函数三、Null 合并赋值四、解构函数 Deconstruct五、模式匹配增强功能 注意:在此仅提及 Unity 开发中会用到的一些功能和特性,对于不适合在 Unity 中使用的内容会忽略。 C# 8 对应 Unity 版本: Un…...
登陆接口的的Filter过滤
目录 一、概述 二、基本操作 三、登陆检查接口 一、概述 什么是Filter? Filter表示过滤器,是 JavaWeb三大组件(Servlet、Filter、Listener)之一。 过滤器可以把对资源的请求拦截下来,从而实现一些特殊的功能 使用了过滤器之后࿰…...
【Python原创设计】基于Python Flask的全国气象数据采集及可视化系统-附下载方式以及项目参考论文,原创项目其他均为抄袭
基于Python Flask的全国气象数据采集及可视化系统 一、项目简介二、项目技术三、项目功能四、运行截图五、分类说明六、实现代码七、数据库结构八、源码下载 一、项目简介 本项目是一个基于Web技术的实时气象数据可视化系统。通过爬取中国天气网的各个城市气象数据,…...
【力扣】42. 接雨水 <模拟、双指针、单调栈>
【力扣】42. 接雨水 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 目录 【力扣】42. 接雨水题解暴力双指针单调栈 示例 1: 输入:height [0,1,0,2,1,0,1,3,2,1,2,1] 输出&…...
【leetcode 力扣刷题】链表基础知识 基础操作
链表基础知识 基础操作 链表基础操作链表基础知识插入节点删除节点查找节点 707. 设计链表实现:单向链表:实现:双向链表 链表基础操作 链表基础知识 在数据结构的学习过程中,我们知道线性表【一种数据组织、在内存中存储的形式】…...
关于openfeign调用时content-type的问题
问题1描述: 今天在A服务使用openfeign调用B服务的时候,发现经常会偶发性报错。错误如下: 情况为偶发,很让人头疼。 两个接口如下: A服务接口: delayReasonApi.test(student);就是使用openfeign调用B服务的…...
OpenCV 玩转图像和视频
为什么学OpenCV? • OpenCV ⽀持对图像缩放、旋转、绘制⽂字图形等基础操作 • OpenCV 库包含了很多计算机视觉领域常⻅算法:⽬标检测、⽬标跟踪等 OpenCV 简介 • OpenCV (Open Source Computer Vision) 是计算机视觉和机器学习软件库 • Intel 1999…...
技术分享 | 如何编写同时兼容 Vue2 和 Vue3 的代码?
LigaAI 的评论编辑器、附件展示以及富文本编辑器都支持在 Vue2(Web)与 Vue3(VSCode、lDEA)中使用。这样不仅可以在不同 Vue 版本的工程中间共享代码,还能为后续升级 Vue3 减少一定阻碍。 那么,同时兼容 Vue…...
基于ArcGis提取道路中心线
基于ArcGis提取道路中心线 文章目录 基于ArcGis提取道路中心线前言一、生成缓冲区二、导出栅格数据三、导入栅格数据四、新建中心线要素五、生成中心线总结 前言 最近遇到一个问题,根据道路SHP数据生成模型的时候由于下载的道路数据杂项数据很多,所以导…...
xcode14.3更新一系列问题
1. Missing file libarclite_iphoneos.a (Xcode 14.3) 解决方法 Xcode升级到14.3后编译失败,完整错误日志: File not found: /Applications/Xcode-beta.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/arc/libarclite_iphoneo…...
1U和2U的服务器怎么选择
企业建设网站的过程中,离不开租用服务器的环节,服务器在多种场景里面都可以发挥作用,服务器租用渠道有哪些?1U、2U选哪种服务器比较好?大家跟着壹基比小鑫一起来了解具体内容吧! 1U、2U选哪种服务器比较好&…...
【SA8295P 源码分析】05 - SA8295P QNX Host 上电开机过程 进一步梳理(结合代码)
【SA8295P 源码分析】05 - SA8295P QNX Host 上电开机过程 进一步梳理(结合代码) 一、APPS PBL(Application Primary Boot Loader):固化在CPU ROM中1.1 APPS PBL 加载 XBL Loader1.2 XBL Loader加载验证并运行SMSS进行自检,自检完成后触发Warm Reset1.3 WarmRest后,APPS…...
【数据结构与算法】迪杰斯特拉算法
迪杰斯特拉算法 介绍 迪杰斯特拉(Dijkstra)算法是典型最短路径算法,用于计算一个节点到其他节点的最短路径。它的主要特点是以中心向外层层扩展(广度优先搜索思想),直到扩展到终点为止。 算法过程 设置…...
python爬虫-网页数据提取
import requests #headers 网页右键->Network->最下面的User-Agent复制。 headers {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"} #你想要的网址 url &q…...
ZigBee的Many-to-One和Source Routing
1. Many-to-One Routing Many-to-One Routing,是一种简单的路由机制,使得整个网络中的路由设备拥有回到中心节点的路由。 在这种机制下,中心节点周期性发送Many-to-One route discovery广播(协议栈默认设置为60s,可以…...
七夕节 Chinese Valentine‘s Day 的由来
农历七月初七是七夕节。Qixi Festival falls on the seventh day of the seventh lunar month. 以前有一个牛郎,和他的哥哥和嫂子住在一起。他放的一头牛曾经是天庭的一个神仙,但他违反天庭的戒律,变成牛放到了人间。As the story goes,once …...
掌握JDK21全新结构化并发编程,轻松提升开发效率!
1 概要 通过引入结构化并发编程的API,简化并发编程。结构化并发将在不同线程中运行的相关任务组视为单个工作单元,从而简化错误处理和取消操作,提高可靠性,并增强可观察性。这是一个预览版的API。 2 历史 结构化并发是由JEP 42…...
【SA8295P 源码分析】00 - 系列文章链接汇总 - 持续更新中
【SA8295P 源码分析】00 - 系列文章链接汇总 - 持续更新中 一、分区、下载、GPIO等杂项相关二、开机启动流程代码分析二、OpenWFD 显示屏模块三、Touch Panel 触摸屏模块四、QUPv3 及 QNX Host透传配置五、Camera 摄像头模块(当前正在更新中...)六、网络…...
TCP拥塞控制详解 | 6. 主动队列管理
网络传输问题本质上是对网络资源的共享和复用问题,因此拥塞控制是网络工程领域的核心问题之一,并且随着互联网和数据中心流量的爆炸式增长,相关算法和机制出现了很多创新,本系列是免费电子书《TCP Congestion Control: A Systems …...
前端学习清单
顺序不分先后。 技术名称技术描述技术链接HTML5HTML5是下一代的HTML标准,是一种用于结构化内容的标记语言。MDN|HTMLCSS3CSS3是CSS技术的升级版本,它的最大好处就是可以让网页设计师更加方便的为网页添加各种各样的样式,而不用再局限于文字、…...
go atomic原子操作详细解读
文章目录 概要1、基本知识1.1 原子操作是什么1.2 CPU怎么实现原子操作的? 2、atomic包2.1、 Add函数2.2、CompareAndSwap函数2.3、Swap函数2.4、Load函数2.5、Store函数 3、atomic.Value值 概要 atomic包是golang通过对底层系统支持的原子操作进行封装,…...
自己开网站需要什么/推广软文案例
一、Java堆溢出 内存溢出和内存泄露 内存溢出:指程序运行过程中无法申请到足够的内存而导致的一种错误。内存溢出通常发生于OLD段或Perm段垃圾回收后,仍然无内存空间容纳新的Java对象的情况。 内存泄露:指程序中动态分配内存给一些临时对象&a…...
班级网站制作建设的设计和作用/长沙seo步骤
云质QMS原创 转载请注明来源. 作者:王洪石 FTA的历史 故障树分析(Fault Tree Analysis),简称FTA,1962年由贝尔实验室的H.A. Watson为美国空军开发。 FTA现在是最重要的系统可靠性和安全分析技术之一,也是根本原因分析的重要手段…...
生日快乐软件制作app/上海百度提升优化
今天在转换一个文件时iconv() 老是返回 -1, 提示编码转换失败。 一共 30 多个文件, 原编码都是一样的,为什么有的转换会失败,返回 -1呢? 网上搜索了一下, 找到一个随加参数: //IGNORE 说是 iconv_open() 的…...
wordpress cms社交/线上营销活动案例
收取邮件有两种协议,POP3和IMAP,POP3相对于IMAP功能较少无法对邮件进行更深层次的操作,因此本文使用IMAP协议收取邮件。python提供了很多收邮件的模块,本文使用imaplib来接收邮件。 前提 需要在邮件箱的设置中打开允许IMAP&#x…...
宁津网站开发/郑州seo外包服务
克服不良的 UNIX 使用模式 简介: 采用 10 个能够提高您的 UNIX 命令行效率的好习惯----并在此过程中摆脱不良的使用模式。本文循序渐进地指导您学习几项用于命令行操作的技术,这些技术非常好,但是通常被忽略。了解常见 错误和克服它们的方法&…...
wordpress 套餐/安卓aso优化
为什么80%的码农都做不了架构师?>>> 初始化内表的作用是清空内表所有的数据行,将内表恢复到填充或赋值之前的状态。初始化内表过程中需要注意之处仍然是初始化无 表头行内表和有表头行内表的区别,以及初始化内表和表头行的区别。…...