九、初识卷积
文章目录
- 1、通过边缘检测认识卷积
- 2、Padding
- 3、Strid Convelution
- 4、RGB图像的卷积
- THE END
1、通过边缘检测认识卷积
\qquad 在使用神经网络进行图像识别时,神经网络的前几层需要完成对图像的边缘检测任务,所谓的边缘检测就是让计算机识别出一张图片的垂直边缘和水平边缘,如下图所示:

\qquad 加入当前有一张661的灰度图像,图像中的数字越小,表示图像的颜色越深,则通过以下卷积(符号为*)计算,可以得到一张新的441的图像,新图像中的中间部分便可以直观表现出原始图像的垂直边缘。

\qquad其中,中间参与卷积运算的331的矩阵称为卷积核(kernal)或者过滤器(filter)。
2、Padding
\qquad 设定原图像的尺寸为n∗nn*nn∗n,卷积核的维度为f∗ff*ff∗f,则经过卷积计算只有的输出图像的尺寸为(n−f+1)∗(n−f+1)(n-f+1)*(n-f+1)(n−f+1)∗(n−f+1)。从上述卷积计算过程可以发现,原图像边缘的像素点使用的次数远低于中间像素点的使用次数,为了充分利用边缘像素点的信息,可以通过Padding操作,在原图像的边缘添加额外的ppp层像素点,之后使用 Padding之后的图像进行卷积操作,操作过程如下图所示:

\qquad当Padding到原图像上的图像的层数p=f−12p=\frac{f-1}{2}p=2f−1时,Padding之后的图像经过f∗ff*ff∗f卷积层的卷积操作之后,得到的结果图像恰好和原图像的尺寸相同,为n∗nn*nn∗n。卷积核的维度fff通常为奇数。
3、Strid Convelution
\qquad 在进行卷积操作时,卷积核每一次移动的步长(strid)不一定为1,也可以为大于1的其他数。则考虑了移动步长sss之后,一幅n∗nn*nn∗n的图像,经过ppp层padding操作,经过f∗ff*ff∗f维度的卷积核进行卷积操作之后,可以得到结果图像的维度为:⌊n+2p−fs+1⌋∗⌊n+2p−fs+1⌋\lfloor{\frac{n+2p-f}{s}+1} \rfloor * \lfloor{\frac{n+2p-f}{s}+1}\rfloor⌊sn+2p−f+1⌋∗⌊sn+2p−f+1⌋。 Stride convelution的示意图如下图所示:

4、RGB图像的卷积
\qquad 对于RGB图像,令一幅RGB图像的输入维度为n∗n∗ncn*n*n_cn∗n∗nc其中,前两个nnn分别表示图像的高度和宽度,最后一个ncn_cnc维度表示图像的通道(channel)数量;对于RGB图像的卷积操作使用的卷积核的维度为f∗f∗ncf*f*n_cf∗f∗nc。最终输出的图像维度为:(n−f+1)∗(n−f+1)(n-f+1)*(n-f+1)(n−f+1)∗(n−f+1)。可以使用不同类型的多个卷积核,从而增加输出图像的通道数,如使用2个不同的卷积核,则输出图像的维度为:(n−f+1)∗(n−f+1)∗2(n-f+1)*(n-f+1)*2(n−f+1)∗(n−f+1)∗2。

THE END
相关文章:
九、初识卷积
文章目录1、通过边缘检测认识卷积2、Padding3、Strid Convelution4、RGB图像的卷积THE END1、通过边缘检测认识卷积 \qquad在使用神经网络进行图像识别时,神经网络的前几层需要完成对图像的边缘检测任务,所谓的边缘检测就是让计算机识别出一张图片的垂直…...
【Linux】【编译】编译调试过程中如何打印出实际的编译命令
🐚作者简介:花神庙码农(专注于Linux、WLAN、TCP/IP、Python等技术方向)🐳博客主页:花神庙码农 ,地址:https://blog.csdn.net/qxhgd🌐系列专栏:Linux技术&…...
linux安装jdk
step1 下载jdk 到下面的网站下载需要的jdk安装包版本。 Java Downloads | Oracle step2 复制到opt目录 其中user_name对应自己的home目录的用户文件夹 sudo cp /home/user_name//home/czh/Downloads/jdk-17_linux-x64_bin.tar.gz /opt/ step3 到opt目录解压安装包…...
迅为iTOP-3A5000龙芯开发板安装UOS操作系统
3A5000板卡采用全国产龙芯3A5000处理器,基于龙芯自主指令系统(LoongArch),市面上龙芯3A5000主板价格都在上万元,可以说是非常贵了, 迅为全新推出了款千元内的iTOP-3A5000开发板,这款板卡各方面的配置也是第…...
Firefox 110, Chrome 110, Chromium 110 官网离线下载 (macOS, Linux, Windows)
Mozilla Firefox, Google Chrome, Chromium, Apple Safari 请访问原文链接:https://sysin.org/blog/chrome-firefox-download/,查看最新版。原创作品,转载请保留出处。 作者主页:www.sysin.org 天下只剩三种(主流&am…...
如何使用ArcGIS转换坐标
1.概述大家都知道ArcGIS提供了坐标转换功能,在我们手里的数据坐标系千差万别,经常会遇到转换坐标的时候,那么是否可以用ArcGIS进行转换?答案是肯定的,但是转换的过程比较复杂,这里为大家介绍一下转换的方法…...
链表基本原理
链表基本原理1.链表1.1 基本原理1.2 链表大O记法表示2. 链表操作2.1 读取2.2 查找2.3 插入2.4 删除3.链表代码实现1.链表 1.1 基本原理 节点 组成链表的数据格子不是连续的。可以分布在内存的各个位置。这种不相邻的格子就叫结点。每个结点保存数据还保存着链表里的下一结点的…...
基于JAVA+SpringBoot+Vue+ElementUI中学化学实验室耗材管理系统
✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 当前,中学…...
1.输入子系统学习-struct input_dev-2023.02
内核版本:4.4.194 平台相关:rk3399 目前主要是看的触摸屏的代码 目录 一、include/linux/input.h(struct_input_dev) 二、结构体的注释部分(百度翻译) 三、Documentation/input/event-codes.txt&…...
解决:PDFBox报的java.io.IOException: Missing root object specification in trailer
文章目录问题描述原因分析解决方案问题描述 使用pdfbox类库操作pdf文件时,遇到下面的报错信息: java.io.IOException: Missing root object specification in trailer PDFBox参考: https://pdfbox.apache.org/ Apache PDFBox 库是一个开源的…...
MAC OSX安装Python环境 + Visual Studio Code
MAC上开发python怎么能少得了python3环境呢,而安装python3环境的方式也有多种,这里仅选用并记录本人认为比较方便的方式 安装Homebrew Homebrew是macOS 缺失的软件包管理器, 使用它可以在MAC上安装很多没有预装的东西,详细说明可…...
音乐 APP 用户争夺战,火山引擎 VeDI 助力用户体验升级!
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 国内数字音乐市场正在保持稳定增长。 根据华经产业研究院数据报告显示,2020 年数字音乐市场规模为 357.3 亿元,到 2022 年市场规模已增长至 482.7 …...
CAP和BASE理论
CAP理论CAP是 Consistency、Availability、Partition tolerance 三个词语的缩写,分别表示一致性、可用性、分区容忍性。它指出一个分布式计算系统不可能同时满足以下三点:• 一致性(Consistency) :等同于所有节点访问同…...
基于商品理解的成交能力和成交满意度优化在Lazada的实践
作者:马蕊 Lazada推荐算法团队 在Lazada各域推荐场景中,既有优质商品优质卖家不断涌现带来的机会,也有商品质量参差带来的问题。如何才能为用户提供更好的体验,对卖家变化行为进行正向激励呢?下面本文将为大家分享我们…...
idea推送镜像到desktop报错:Cannot run program “docker-credential-desktop“ 系统找不到指定的文件。
windows Docker 搭建仓库 打开docker desktop 。 打开windows cmd窗口或powershell窗口。 输入"docker run -d -p 5000:5000 --name test registry:2 "运行一个名字叫test的registry容器。 idea配置springboot项目的docker插件 在pom.xml中的plugins中加入下面代码…...
hive开窗函数
hive开窗函数 窗口函数 数据准备 1 jx 20 2 zx 24 3 yx 18 4 wz 10 5 yy 34 6 wy 25create table t (> id int,> name string,> age int> )> row format delimited fields terminated by ; load data inpath /data/data.txt into table t;ROW_NUMBER ROW_N…...
安全多方计算系列笔记1——前世今生
这一系列笔记参考了绿盟科技研究通讯的安全多方计算文章,及其他。 首先看定义:在不泄露参与方原始输入数据的前提下,允许分布式参与方合作计算任意函数,输出准确的计算结果。 起源 安全多方计算问题及解首先由姚期智(…...
16- 梯度提升分类树GBDT (梯度下降优化) (算法)
梯度提升算法 from sklearn.ensemble import GradientBoostingClassifier clf GradientBoostingClassifier(subsample0.8,learning_rate 0.005) clf.fit(X_train,y_train) 1、交叉熵 1.1、信息熵 构建好一颗树,数据变的有顺序了(构建前,…...
SpringCloud+Nacos+Gateway
SpringCloudNacosGatewaySpringBoot整合GatewayNacos一. 环境准备1. 版本环境2. 服务环境二. 实战1.创建用户服务2.创建订单服务3.创建网关服务4.测试三. 避坑指南问题1--503问题问题2--网关服务启动报错SpringBoot整合GatewayNacos 本篇文章只演示通过gateway网关服务访问其他…...
高通开发系列 - linux kernel内核升级msm-3.18升至msm-4.9(2)
By: fulinux E-mail: fulinux@sina.com Blog: https://blog.csdn.net/fulinus 喜欢的盆友欢迎点赞和订阅! 你的喜欢就是我写作的动力! 目录 返回高通开发系列 - 总目录 前面我们升级了msm-4.9内核系统正常启动了,文件系统也正常工作,但那是使用了老基线的文件系统,其yocto…...
构建拥有独立人格的QQ群聊智能体:OpenClaw与NapCatQQ深度集成指南
1. 项目概述:构建一个拥有独立人格的QQ群聊智能体如果你和我一样,厌倦了那些只会机械回复“你好”、“在吗”的聊天机器人,总想捣鼓点更有意思的东西,那么今天聊的这个项目,你可能会感兴趣。它不是一个简单的QQ自动回复…...
终极Android虚拟相机使用指南:从零开始掌握摄像头替换技术
终极Android虚拟相机使用指南:从零开始掌握摄像头替换技术 【免费下载链接】com.example.vcam 虚拟摄像头 virtual camera 项目地址: https://gitcode.com/gh_mirrors/co/com.example.vcam 你是否曾想过在视频会议中隐藏真实背景?是否希望在直播时…...
AISMM评估价值被严重低估!SITS2026现场实测:同一组织经AISMM牵引后,安全预算效能提升2.8倍
更多请点击: https://intelliparadigm.com 第一章:AISMM评估的价值被严重低估!SITS2026现场实测洞察 在 SITS2026(Software Intelligence & Trustworthiness Summit)技术展会上,我们对 AISMM…...
终极免费Switch模拟器Ryujinx:在PC上畅玩任天堂游戏的完整解决方案
终极免费Switch模拟器Ryujinx:在PC上畅玩任天堂游戏的完整解决方案 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx 想要在电脑上体验《塞尔达传说:旷野之息》的…...
手把手教你用PSIM搞定一个36V输出的直流升压电路(附50kHz参数计算与避坑指南)
手把手教你用PSIM搞定一个36V输出的直流升压电路(附50kHz参数计算与避坑指南) 在电力电子领域,直流升压电路(Boost Converter)是最基础也最实用的拓扑结构之一。无论是新能源发电系统、电动汽车还是工业电源࿰…...
Go语言构建高性能Discord机器人:并发架构与实战指南
1. 项目概述:一个用Go语言打造的Discord机器人框架如果你在Discord社区里泡过一段时间,或者自己运营过服务器,大概率会想过:“要是能有个机器人帮我自动处理这些重复性工作就好了。” 从欢迎新成员、管理频道、组织活动࿰…...
从“UI消失”到“ERROR”:一次 Unreal Engine 打包问题的排坑全记录
从“UI消失”到“ERROR”:一次 Unreal Engine 打包问题的排坑全记录 摘要:本文记录了一次在 Unreal Engine 开发中遇到的典型问题——UI 在编辑器中可见,但打包后消失。通过逐步排查,发现并解决了从逻辑缺失到节点连线错误的多个关键问题。 在 Unreal Engine 的开发过程中,…...
百度网盘秒传脚本:永久有效的文件分享终极解决方案
百度网盘秒传脚本:永久有效的文件分享终极解决方案 【免费下载链接】rapid-upload-userscript-doc 秒传链接提取脚本 - 文档&教程 项目地址: https://gitcode.com/gh_mirrors/ra/rapid-upload-userscript-doc 你是否曾因百度网盘分享链接7天后失效而烦恼…...
解锁个性化键盘革命:Cherry MX键帽3D模型完全指南
解锁个性化键盘革命:Cherry MX键帽3D模型完全指南 【免费下载链接】cherry-mx-keycaps 3D models of Chery MX keycaps 项目地址: https://gitcode.com/gh_mirrors/ch/cherry-mx-keycaps 你是否厌倦了千篇一律的键盘外观?想要打造真正属于自己的机…...
nli-MiniLM2-L6-H768保姆级教程:模型输出logits解析+置信度阈值调优方法
nli-MiniLM2-L6-H768保姆级教程:模型输出logits解析置信度阈值调优方法 1. 模型简介 nli-MiniLM2-L6-H768是一个专为自然语言推理(NLI)与零样本分类设计的轻量级交叉编码器(Cross-Encoder)模型。它采用6层Transformer架构,隐藏层维度为768,…...
