Transformer 杂记
Transformer输入的是token,来自语言序列的启发。
卷积神经网络(CNN)是如何进行物种分类的.它实际是直接对特征进行识别,也就是卷积神经网络最基本的作用:提取图像的特征。例如:卷积神经网络判断一只狗的时候,是从它的眼睛长啥样,鼻子长啥样,这些具体的特征去判断,而这些特征之间有什么联系它不会在意,比如眼睛长啥样并不会影响它对鼻子长啥样的判断。
注意力机制,是寻找一幅图中的每个token之间的相互联系。
图像分类:
VIT:VIT是Vision Transformer的缩写,是第一种将transformer运用到计算机视觉的网络架构。其将注意力机制也第一次运用到了图片识别上面。
Swin_Transformer:swintransformer的出现是为了解决传统的VIT对局部注意力关注度不够的问题,说人话就是,从VIT对整体的注意力的计算升级成了对图片分块后再进行小块的注意力计算。
Transformer经典论文:
1. Attention is All you Need
2. An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale
3. End-to-End Object Detection withTransformers
4. Long Range Arena: A Benchmark forEfficient Transformers
5. Pyramid Vision Transformer: A VersatileBackbone for Dense Prediction Without Convolutions
6. PVTv2: Improved Baselines with PyramidVision Transformer
7. Scaling Vision Transformers
8. Swin Transformer: Hierarchical VisionTransformer using Shifted Windows.
9. Swin Transformer V2: Scaling Up Capacityand Resolution
10. SegFormer: Simple and Efficient Designfor Semantic Segmentation with Transformers
11. Is Space-Time Attention All You Needfor Video Understanding?
12. VidTr: Video Transformer WithoutConvolutions
13. MixFormer: End-to-End Tracking withIterative Mixed Attention
14. EcoFormer: Energy-Saving Attention withLinear Complexity
15. Transformers in Vision: A Survey
16. Efficient Transformers: A Survey
17. MLP-Mixer: An all-MLP Architecture forVision
18. Dual Vision T ransformer
19. Vision Transformer Advanced byExploring Intrinsic Inductive Bias
Tranformer未来还能做什么?
Vision Transformer的故事还在继续,今年NeurIPS投稿也能看到大家陆续也在关注实测速度了,如TRT ViT,EfficientFormer, 但实际上ViT的工业落地相比CNN可能还是会有障碍。如量化上,ViT还是在低bit上还有很大提升空间。除此之外,我们组(https://ziplab.github.io/)也在探索Transformer的其他efficiency问题,比如
ViT的Training efficiency还有很大的空间。 ViT普遍难训练,需要的显存大,训练时间长。特别是backbone的公认setting是1024的batch size + 8 GPUs,使得很多小组连ViT跑都跑不起来(8卡 32GB V100不是所有人都有的),针对这一问题我们提出了一个针对Transformer的一个memory-efficient的训练框架: Mesa: A Memory-saving TrainingFramework for Transformers(https:arxiv.org/abs/2111.11124). 和普通训练相比,Mesa可以做到显存节省一半,同时与checkpointing和gradient accumulation等技术方案不冲突。
Transformer的能源消耗也是一个问题,特别是当下很多大组在跑以Transformer为backbone的大模型,训练时所造成的电力损耗,碳排放对Green AI这一长远目标不利。针对Energy efficiency,我们组在NeurIPS 2022最新的工作 EcoFormer: Energy-Saving Attention withLinear Complexity(https://arxiv.org/abs/2209.09004) 提出了一个Transformer二值化的全新方案,全新设计的EcoFormer是一个general的efficient attention, 性能和功耗上都优于一众线性复杂度的Linformer, Performer等,同时在45nm CMOS microcontroller上能耗更低,速度更快。
至于CNN和Transformer哪个好的问题,这个答案其实不必再过多讨论了,因为两者互补。通过合理地配置CNN和MSA在Backbone中的位置,可以让网络得到双倍的快乐。更不用说Convolution和MSA两者之间本身存在一种联系,比如我们组的另一篇工作:Pruning Self-attentions intoConvolutional Layers in Single Path(https://arxiv.org/abs/2111.11802), 巧妙地通过参数共享将计算复杂度较高的attention layer剪成更为efficient的convolutional layer,工程细节可以参考:https://github.com/ziplab/SPViT。
相关文章:
![](https://www.ngui.cc/images/no-images.jpg)
Transformer 杂记
Transformer输入的是token,来自语言序列的启发。卷积神经网络(CNN)是如何进行物种分类的.它实际是直接对特征进行识别,也就是卷积神经网络最基本的作用:提取图像的特征。例如:卷积神经网络判断一只狗的时候,…...
![](https://img-blog.csdnimg.cn/img_convert/51b309582bcf74f7079c27d438412cb2.png)
实现异步的8种方式
前言异步执行对于开发者来说并不陌生,在实际的开发过程中,很多场景多会使用到异步,相比同步执行,异步可以大大缩短请求链路耗时时间,比如:「发送短信、邮件、异步更新等」,这些都是典型的可以通…...
![](https://img-blog.csdnimg.cn/c6aacba6f52a41bb81ca5f9bbd7ada8f.png#pic_center)
Github隐藏功能显示自己的README,个人化你的Github主页
Github隐藏功能:显示自己的README 你可能还不知道,GitHub 悄悄上线了一个全新的个人页功能,显示一个自定义的 README.MD 在个人首页。要激活此功能,需要新建一个与自己 ID 同名的 Repository,新 Repo 里的README.MD将…...
![](https://img-blog.csdnimg.cn/28f16155a6bc4bb9b326a34b9dad5924.png)
单片机 | 51单片机原理
【金善愚】 单片机应用原理篇 笔记整理 课程视频 :https://space.bilibili.com/483942191/channel/collectiondetail?sid51090 文章目录一、引脚分布介绍1.分类2.电源引脚3.时钟引脚(2根)4.控制引脚(4根)5.端口引脚(32根)二、存储器结构及空间分布介绍1.存储器的划…...
![](https://img-blog.csdnimg.cn/7f92c4031d4d4db0bb01df2da0be4e7d.png)
(只需五步)注册谷歌账号详细步骤,解决“此电话号码无法验证”问题
目录 第一步:打开google浏览器 第二步:设置语言为英语(美国) 第三步:点击重新启动,重启浏览器 第四步:开始注册 第五步,成功登录google账号! 如果出现这样的原因&…...
![](https://img-blog.csdnimg.cn/ed693b35636242cb9cf3e1933b0493e8.png)
ChatGPT使用介绍、ChatGPT+编程、相关组件和插件记录
文章目录介绍认识ChatGPT是通过英汉互译来实现中文回答的吗同一个问题,为什么中英文回答不同ChatGPT的使用对话组OpenAI APIAI智能绘图DALLE 2ChatGPT for Google插件ChatGPT编程编写代码代码错误修正与功能解读代码评审与优化推荐技术方案编写和优化SQL语句在代码编…...
![](https://img-blog.csdnimg.cn/img_convert/9e8cf773fa72f3bcfe86278085c25121.png)
linux系统中复制粘贴和头文件问题解决方案
各位开发者大家好,好久不见,为了更好的服务大家,将平常所见所闻,以及遇到的问题和解决办法进行记录和总结。大家在学习过程中,有任何问题欢迎交流学习!!!。 第一:如何将w…...
![](https://img-blog.csdnimg.cn/5e027d9c222c44d088515002e4617e30.gif)
Vue项目实战 —— 后台管理系统( pc端 ) —— Pro最终版本
前期回顾 开源项目 —— 原生JS实现斗地主游戏 ——代码极少、功能都有、直接粘贴即用_js斗地主_0.活在风浪里的博客-CSDN博客JS 实现 斗地主网页游戏https://blog.csdn.net/m0_57904695/article/details/128982118?spm1001.2014.3001.5501 通用版后台管理系统,如果…...
![](https://img-blog.csdnimg.cn/img_convert/8dc7f491ba7593a3ed836c048a93d0f6.png)
Springboot+vue开发的图书借阅管理系统项目源码下载-P0029
前言图书借阅管理系统项目是基于SpringBootVue技术开发而来,功能相对比较简单,分为两个角色即管理员和学生用户,核心业务功能就是图书的发布、借阅与归还,相比于一些复杂的系统,该项目具备简单易入手,便于二…...
![](https://img-blog.csdnimg.cn/88043278c22c443e8639547c47ad23ff.png#pic_center)
学习 Python 之 Pygame 开发魂斗罗(十三)
学习 Python 之 Pygame 开发魂斗罗(十三)继续编写魂斗罗1. 创建敌人2类2. 编写敌人2类的draw()函数3. 编写敌人越界消失函数4. 编写敌人开火函数5. 把敌人2加入地图进行测试继续编写魂斗罗 在上次的博客学习 Python 之 Pygame 开发魂斗罗(十…...
![](https://img-blog.csdnimg.cn/fb8304eda2074cce8cd06be52d9b48f0.gif)
指针进阶(中)
提示: 上集内容小复习🥰🥰 int my_strlen(const char* str) {return 1; } int main() {//指针数组char* arr[10];//数组指针int arr2[5] { 0 };int(*p)[5] &arr2; //p是一个指向数组的指针变量//函数指针int (*pf)(const char*)&m…...
![](https://www.ngui.cc/images/no-images.jpg)
C/C++获取文件名的方法(__FILE__,__builtin_FILE(),__BASE_FILE__)
目录标题C/C获取文件名的方法__FILE__宏避免__FILE__宏的错误慎用$(subst $(dir $<),,$<)\"")来重定义__BASE_FILE__宏__builtin_FILE()函数Windows API函数GetModuleFileName()getenv()使用cmake中的变量重定义__FILE__宏的CMake示例C/C获取文件名的方法 使用…...
![](https://img-blog.csdnimg.cn/3c6e422b41d14866ae893dd2ed06dbe4.png)
线程池的讲解和实现
🚀🚀🚀🚀🚀🚀🚀大家好,今天为大家带来线程池相关知识的讲解,并且实现一个线程池 🌸🌸🌸🌸🌸🌸🌸🌸…...
![](https://www.ngui.cc/images/no-images.jpg)
linux编程──gcc和clang
实验链接 编译原理实验-GCC/Clang工具链在ARM架构上的使用 实验报告 第1关:理解程序的不同表示形式 ##问题1-1: 如果在命令行下执行 gcc -DNEG -E sample.c -o sample.i生成的sample.i 与之前的有何区别? 根据定义NEG,而选择了M定义为-4…...
![](https://img-blog.csdnimg.cn/ea48c1dc15804d2a965dcd5c0b0969c2.png)
字节跳动测试岗面试记:二面被按地上血虐,所幸Offer已到手...
在互联网做了几年之后,去大厂“镀镀金”是大部分人的首选。大厂不仅待遇高、福利好,更重要的是,它是对你专业能力的背书,大厂工作背景多少会给你的简历增加几分竞争力。 但说实话,想进大厂还真没那么容易。最近面试字…...
![](https://img-blog.csdnimg.cn/efa307fcdb6c4587badef2a4292e11a6.png)
5.多线程学习
作者:爱塔居 专栏:JavaEE 作者简介:大三学生,喜欢总结与分享~ 文章目录 目录 文章目录 章节回顾 一、wait 和notify 二、设计模式 2.1 单例模式 章节回顾 线程安全 1.一个线程不安全的案例(两个线程各自自增5w次&…...
![](https://img-blog.csdnimg.cn/5562aac243354a6b807ac853c04a5f9e.jpeg)
数据结构中的堆
一、树的重要知识点 节点的度:一个节点含有的子树的个数称为该节点的度(有几个孩子)叶节点或终端节点:度为0的节点称为叶节点;如上图:B、C、H、I...等节点为叶节点(0个孩子)非终端节点或分支节点…...
![](https://img-blog.csdnimg.cn/img_convert/d98aced98f3a440f93b3a6de652891d6.jpeg)
Linux内核设备信息集合
本文结合设备信息集合的详细讲解来认识一下设备和驱动是如何绑定的。所谓设备信息集合,就是根据不同的外设寻找各自的外设信息,我们知道一个完整的开发板有 CPU 和各种控制器(如 I2C 控制器、SPI 控制器、DMA 控制器等)࿰…...
![](https://img-blog.csdnimg.cn/b5f3eed322e1462b9cdccfa5da55f80b.png)
若依框架---权限管理设计
前言 若依权限管理包含两个部分:菜单权限 和 数据权限。菜单权限控制着我们可以执行哪些操作。数据权限控制着我们可以看到哪些数据。 菜单是一个概括性名称,可以细分为目录、菜单和按钮,以若依自身为例: 目录,就是页…...
![](https://www.ngui.cc/images/no-images.jpg)
Java设计模式(二)——工厂模式
当用户需要一个类的子类实例,且不希望与该类的子类形成耦合或者不知道该类有哪些子类可用时,可采用工厂模式;当用户需要系统提供多个对象,且希望和创建对象的类解耦时,可采用抽象工厂模式。 工厂模式一般分为简单工厂、…...
![](https://img-blog.csdnimg.cn/ca4a5d40857147cd864bc1bfcfa7dc71.png)
【Maven】
MavenMaven简介仓库坐标Maven项目构建依赖管理生命周期及插件插件模块拆分与开发聚合继承属性版本管理资源配置多环境开发配置跳过测试私服Maven简介 Maven的本质时一个项目管理工具,将项目开发和管理过程抽象成一个项目对象模型(POM) POM(Project Object Model)&a…...
![](https://img-blog.csdnimg.cn/9cacea44cacf4fb69df8797cbbc12ae9.png)
[JAVA]继承
目录 1.继承的概念 2.继承的语法 3.父类成员访问 3.1子类中访问父类成员变量 3.2子类中访问父类成员方法 4.super关键字 5.子类构造方法 6.继承方式 7.final关键字和类的关系 面向对象思想中提出了继承的概念,专门用来进行共性抽取,实现代码复…...
![](https://img-blog.csdnimg.cn/c5946b9b0ab54809918e9a2b4bdd2f2b.png)
Vue3 pinia持久化存储(组合式Api案例演示)
pinia-plugin-persist( pinia持久化插件) 本文采用的是 组合式Api的方式来做Pinia的持久化存储演示 如果对pinia的持久化还是不是很了解的👨🎓|👩🎓,可以看一下笔者的上一篇文章…...
![](https://www.ngui.cc/images/no-images.jpg)
8个你一看就觉得很棒的Vue开发技巧
1.路由参数解耦 通常在组件中使用路由参数,大多数人会做以下事情。 export default {methods: {getParamsId() {return this.$route.params.id}} }在组件中使用 $route 会导致与其相应路由的高度耦合,通过将其限制为某些 URL 来限制组件的灵活性。 正…...
![](https://img-blog.csdnimg.cn/f11db5c5bba349d18ef690b44b03fd41.png)
vue3+ts 开发效率提升
1、vite pnpm项目初始化 pnpm: 比npm或yarn快10倍 pnpm与其他包管理器(如npm和Yarn)的不同之处在于它使用一种称为“硬链接”的独特安装方法。当你使用PNPM安装一个包时,它并不会将包的文件复制到每个项目的node_modules目录中&a…...
![](https://img-blog.csdnimg.cn/6bb068d0fd2b4f06b770ac004cd3e064.png)
【数据结构与算法】队列和栈的相互实现以及循环队列
目录🌔一.用队列实现栈🌙1.题目描述🌙2.思路分析🌙3.代码实现⛈二.用栈实现队列☔1.题目描述☔2.思路分析☔3.代码实现🌈三.实现循环队列🌔一.用队列实现栈 🌙1.题目描述 我们先看一下题目链接…...
![](https://www.ngui.cc/images/no-images.jpg)
mysql连接不上问题解决
公司新搭内网测试环境,mysql远程登录问题解决 远程登录: 1 修改host, mysql> select user,host,plugin from user; ---------------------------------------------------- | user | host | plugin | ------------------------…...
![](https://img-blog.csdnimg.cn/8eb6a25e738049b199b8450834576c02.png#pic_center)
利用nginx实现动静分离的负载均衡集群实战
前言 大家好,我是沐风晓月,今天我们利用nginx来作为负载,实现两台apache服务器的动静分离集群实战; 本文收录于沐风晓月的专栏《linux基本功-系统服务实战》,更多内容可以关注我的博客: https://blog.csd…...
![](https://img-blog.csdnimg.cn/cd57a307ec014dcbb6d302b9a3fb4f16.gif)
与chatGPT神聊,引领你深入浅出系统调用
在操作系统的教学中,系统调用的作用不言而喻,但是,对系统调用常常是雾里看花,似乎明白,又难以真正的触及,即使在代码中调用了系统调用,比如调用fork()创建进程࿰…...
![](https://img-blog.csdnimg.cn/2232f84187074914b515026f43ded582.png)
自学大数据第十天~Hbase
随着数据量的增多,数据的类型也不像原来那样都是结构化数据,还有非结构化数据; Hbase时google 的bigtable的开源实现, BigtableHbase文件存储系统GFSHDFS海量数据处理MRMR协同管理服务chubbyzookeeper虽然有了HDFS和MR,但是对于数据的实时处理是比较困难的,没有办法应对数据的…...
![](https://img-blog.csdnimg.cn/20190430103809698.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2xsaGY2ODg=,size_16,color_FFFFFF,t_70)
100M家用宽带可做网站服务器吗/seo详细教程
批量更改数据的方法有很多,今天为您介绍的是使用Renamer这款专门为批量重命名文件而设计的一款工具,使用Renamer可以批量重命名文件,还可以批量更改文件的数据,操作简单,可快速地同时更改多个文件名称,支持…...
![](/images/no-images.jpg)
wordpress设置导航菜单显示位置/陕西网页设计
Oracle共享磁盘配置2018-07-25 11:24:32Oracle在11g 之前,可以直接使用裸设备安装rac。11g之后,必须用asm,所以这里就会涉及到设备持久话的问题,持久化有3种方法:(1) udev(2) multipath(3) Oracle asmlib任选一种即可&…...
![](/images/no-images.jpg)
仙桃哪里做网站/北京seo运营推广
WEB监听器 使用 使用方法,继承需要使用的监听器接口,根据业务需求实现接口中的抽象方法。 如果是ssm架构项目,将自定义监听器定义到 tomcat的web.xml中。 分类 监听 ServletContext对象,即 application对象。 javax.servlet.Se…...
![](https://images.cnblogs.com/cnblogs_com/hayate/0596100094.01._SCLZZZZZZZ_.jpg)
绵竹移动网站建设/湖北网站seo设计
http://www.amazon.com/gp/product/0596100094/refpd_rhf_p_1/104-8226245-7377542?%5FencodingUTF8&vglance&n283155电子书有了 一本小书 放上来分享转载于:https://www.cnblogs.com/hayate/archive/2005/12/04/290310.html...
![](https://img-blog.csdnimg.cn/img_convert/3aa9e6a7517a8d42f9bf53b3f261b30d.png)
wordpress 载入慢/郑州新闻发布
目录1. randsrc 无参数随机输出-1或1。有参数,按照概率输出m*m或m*n阶矩阵2. rand 随机产生0—1中某一数3. randint 无参数随机输出0或1。有参数,按照概率输出m*m或m*n阶矩阵4. randperm 返回从1到n随机分布的整数序列,长度为…...
![](https://img-blog.csdnimg.cn/img_convert/c6943588d5aa38e6fc7c9fdd37481d1c.png)
外国做视频在线观看网站/百度电话客服24小时
目录OutOfMemoryError 可以被 try catch 吗?捕获 OutOfMemoryError 有什么意义?JVM 中哪一块内存不会发生 OOM ?OutOfMemoryError 可以被 try catch 吗?群里小伙伴碰到的一道比较经典的面试题,但我相信很多第一次碰到这…...