卷积神经网络的底层是傅里叶变换
1
卷积神经网络与傅里叶变换、希尔伯特空间坐标变换的关系_卷积神经网络与傅里页变换之间的关系-CSDN博客
从卷积到图像卷积再到卷积神经网络,到底卷了什么?
一维信号卷积:当前时刻之前的每一个时刻是如何对当前时刻产生影响的
图像卷积:卷积核的理解:周围像素点是如何对当前像素点产生影响的,不同的卷积核就是规定了不同影响的关键
请添加图片描述
卷积神经网络:
第一步:识别局部特征,如上图的卷积核,具备提取特征的卷积核,保存某些特征,即对周围像素点的一个主动试探(不同卷积核主动选取)
在这里插入图片描述
总结:
1、对一维卷积来说(以吃饭和消化,求胃里食物剩量问题为例):是不稳定输入,稳定输出,求系统存量的问题
2、对于图像处理来说,一个卷积核就是规定了周围像素点是如何对当前像素点产生影响的。
3、不同的卷积核就是规定了不同影响的关键,如何筛选图像的特征
卷积神经网络与傅里叶变换
对输入图像8进行特征提取,分为不同的特征,这样就能区别于全连接神经网络,特征可以重复利用
(1)cnn中隐含的傅里叶变换
在这里插入图片描述
cnn的经过学习后的卷积运算过程,就可以理解为傅里叶变换,或者傅里叶级数展开,也即不同正交向量的加权和。卷积核就可以理解维正交向量。
(2)频域里的每一个点都是对全时域范围的特定信息的一个浓缩
在这里插入图片描述
(3)CNN感受野与加窗傅里叶变换的关系
变换域做到了与位置无关,但缺点却是全局感受能力太强了,引起变换域的变化波动过大,通过加窗傅里叶变换,可以约束这种全局感受能力。
而加窗后的傅里叶变换,就跟cnn感受野的设计很一致。这样就很能发现局部特征具有的一致性。
在这里插入图片描述
y-t与Y-w之间的关系:y-t是不同w下的所有y-t,也就是不同w下的正弦波的叠加。
(4)升维变换,来理解空间域和变换域公式
相同问题,在不同维度空间下表示的区别:二维空间的一条线,在无穷维/高维空间中,只需要一个点就行。
v1,v2,vn就是高维空间下的正交基,无穷维空间的一个点,就是这些正交基不同权重下的加权和(这个地方,变换域的绿色曲线和时域黄色曲线的物理意义是不同的,虽然形状相同,但我认为不能互相表示)
升维不是目的,目的是让二维空间的曲线降维(深度学习里面encoder产生latent space的作用)。
在这里插入图片描述
(5)希尔伯特空间(欧几里得空间的扩展)
将低维图像映射到高位空间的一个点,重点不是这个点本身,而是高维空间的点可以用向量进行等价表示。即低位数据可以表示为高维空间的一组向量(正交基的权重集合)。
在这里插入图片描述
从时域到频域,相当于在希尔伯特空间(高维空间)做了一次坐标变化。
dn所代表的正交向量,可以用一个具体的向量e^(iwt)表示,这就是傅里叶变换在希尔伯特空间下选择的特殊坐标系(坐标轴),或称选择的特殊正交基。
在这里插入图片描述
在这里插入图片描述
上述的表示更具一般性。而考虑傅里叶变换选择的正交基e^(iwt),其正交基的模为
在这里插入图片描述
所以,将无穷小的累加,转换为积分形式
(6)对傅里叶变换的修改
在这里插入图片描述
因为正弦余弦曲线是全局的,以正余弦作为基向量(锚点)去衡量信号,找到的特征,自然是一个全局的特征
那有没有办法对这个基进行修改,让其只考虑局部情况,而不再考虑全局情况?也就是问有窗口范围的基应该如何表示?
简单的方法就是构建一个分段函数g()
在这里插入图片描述
为了维持函数表示处处可微,改写函数g()为
在这里插入图片描述
a为方差,来决定窗口的大小;s为期望,来决定窗口的位置;n保持不变,代表选择的不同模式 / 不同基向量。这里面用高斯分布作g函数的变换,就是Gabor变换
这里不把窗口的大小作为变量,知识一个参数。因为任何一个具体的
在这里插入图片描述
窗口大小,都可以对应的完备的基(n来确定)。
在这里插入图片描述
Gabor变换完整表达,g函数的不同就代表了不同的变换
在这里插入图片描述
g函数为指数函数,则变化为拉普拉斯变换
在这里插入图片描述
如果窗口大小不再固定,也作为一个控制变量,可以根据频率动态变化,这就是小波变换
总结
各种变换的本质,就是在希尔伯特空间下选择了一组基向量,然后对原来的函数进行变换。
具体变换之后有什么特性,能做什么,关键看变换是基于的那组基有什么特点。
回归的最开始的cnn
两个目标:1.特征和位置无关,即位置不同,在变换域中式相同的表示;2.特征应该是局部的。
n代表着变换域下的不同频率,正交基
s代表着在时域上开出的窗口位置,只有把窗口开在相应波形的位置上,才能在变换域有明显的特征(权重)体现。
在这里插入图片描述
Gabor变换与cnn参数的对应关系:
黄色f(t):对应原始图片
红色f(n,s): 对应feature map,即基向量的权重
绿色s: 对应中心像素点的位置,卷积核的中心
模式(基向量)g_a(t-s)·e^(int):不同的卷积核,下图模式1到模式4。可由反向传播优化更新得到。
红色a(窗口大小):卷积核的大小,窗口的大小也是二维的
在这里插入图片描述
与卷积定理之间的关系
在这里插入图片描述
通过多层cnn的叠加,就可以将感受野覆盖到整个图片
https://blog.csdn.net/u014439531/article/details/131904485
卷积神经网络的底层是傅里叶变换,傅里叶变换的底层是希尔伯特空间坐标变换_哔哩哔哩_bilibili
从“卷积”、到“图像卷积操作”、再到“卷积神经网络”,“卷积”意义的3次改变_哔哩哔哩_bilibili
特征(Features)在机器学习和统计建模中,特征是指数据集中用于预测或分析的变量。特征可以是数值型(如年龄、价格、身高等)或分类型(如性别、产品类型、地区等)。
特征是模型用来做出预测或决策的基础。
轴(Axes)在图表或图形中,轴是用于表示数据维度的直线。在二维或三维空间中,轴通常用来表示数据的不同维度或特征。例如:
基上有眼睛,鼻子,脚三个坐标轴,眼睛,鼻子轴上的值很大,而脚的值很小,那机器就可以知道这可能是一张脸。而为什么基上这些轴代表了眼睛等等这样的特征?这是通过训练集和梯度下降学习出来的,人工无法去设定,机器慢慢就从大量训练中发现可以从这些角度去识别图片。
再谈怎么实现局部特征的提取不用考虑空间关系,这实际上可以从做卷积核操作的时候看出来。在用3*3这样的小卷积核而不是整个图片大小的卷积核去卷积的时候,已经就忽略了那些不在卷积核范围的数据了,
3*3的卷积核代表了一个3*3的局部特征,只对3*3这一小块的局部数据进行卷积,
池化层可以看作是滤波?在数字信号处理中,对数值求平均的过程其实就是一个低通FIR滤波器,把高频分量去掉。采集的信号中往往有噪声,大部分情况下噪声都是高频分量。也可以理解为给频域加窗,只保留幅度比较大的低频部分。
人脑是可以通过眼睛鼻子这些局部特征来识别。
卷积操作和傅里叶变换一样,是在希尔伯特空间的一种基变换。通过基变换,就可以将图标的特征表示出来。
基的每个坐标轴会代表一种特征,通过分析坐标轴上的值,也就是特征的权重就可以识别
基、核、坐标系、变换都是同一个东西的不同说法,其实就是编辑映射关系
相关文章:
![](https://i-blog.csdnimg.cn/direct/62afe9b20d584cc280db1ab7d75bde56.png)
卷积神经网络的底层是傅里叶变换
1 卷积神经网络与傅里叶变换、希尔伯特空间坐标变换的关系_卷积神经网络与傅里页变换之间的关系-CSDN博客 从卷积到图像卷积再到卷积神经网络,到底卷了什么? 一维信号卷积:当前时刻之前的每一个时刻是如何对当前时刻产生影响的 图像卷积&…...
![](https://www.ngui.cc/images/no-images.jpg)
Bootstrap 下拉菜单
Bootstrap 下拉菜单 Bootstrap 是一个流行的前端框架,它提供了许多预构建的组件,其中之一就是下拉菜单。下拉菜单是一个交互式元素,允许用户从一系列选项中选择一个。在本篇文章中,我们将详细介绍如何在 Bootstrap 中创建和使用下…...
![](https://www.ngui.cc/images/no-images.jpg)
计算机组成原理(计算机系统3)--实验一:WinMIPS64模拟器实验
一、实验目标: 了解WinMIPS64的基本功能和作用; 熟悉MIPS指令、初步建立指令流水执行的感性认识; 掌握该工具的基本命令和操作,为流水线实验做准备。 二、实验内容 按照下面的实验步骤及说明,完成相关操作记录实验…...
![](https://www.ngui.cc/images/no-images.jpg)
读书笔记~管理修炼-风险性决策:学会缩小风险阈值
假设你的团队为了提升业绩,提出了两个解决方案:A方案是通过营销提升老产品的利润;B方案是通过研发开拓新产品,你会怎么选? 我们先来分析下,其实无论是A方案还是B方案,都会遇到市场难题…...
![](https://i-blog.csdnimg.cn/direct/4f9c019cf81b4ac1b398f2d965c23447.png)
VIVADO FIFO (同步和异步) IP 核详细使用配置步骤
VIVADO FIFO (同步和异步) IP 核详细使用配置步骤 目录 前言 一、同步FIFO的使用 1、配置 2、仿真 二、异步FIFO的使用 1、配置 2、仿真 前言 在系统设计中,利用FIFO(first in first out)进行数据处理是再普遍不过的应用了,…...
![](https://www.ngui.cc/images/no-images.jpg)
tcp粘包原理和解决
tcp粘包原理和解决 咱们先通过展示基于tcp 的cs端消息通信时的现象,带着问题再解释下面的tcp粘包问题。 一、原始代码 tcp 服务端代码 // socket_stick/server/main.gofunc process(conn net.Conn) {defer conn.Close()reader : bufio.NewReader(conn)var bu…...
![](https://i-blog.csdnimg.cn/direct/82bf9044e2db4d419604de2d118da9bb.jpeg)
C语言预处理艺术:编译前的魔法之旅
大家好,这里是小编的博客频道 小编的博客:就爱学编程 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!! 本文目录 引言正文一、预处理的作用与流程…...
![](https://i-blog.csdnimg.cn/direct/48f144ebe6814f7eba53e32d0a00a35a.gif)
C++算法第十六天
本篇文章我们继续学习动态规划 第一题 题目链接 978. 最长湍流子数组 - 力扣(LeetCode) 题目解析 从上图可见其实有三个状态 代码原理 注意:我们在分析题目的时候分析出来的是三个状态,分别是上升、下降、平坦,但是…...
![](https://i-blog.csdnimg.cn/direct/486a2c946d324dfcb87399112c86d0b0.png)
计算机网络 (45)动态主机配置协议DHCP
前言 计算机网络中的动态主机配置协议(DHCP,Dynamic Host Configuration Protocol)是一种网络管理协议,主要用于自动分配IP地址和其他网络配置参数给连接到网络的设备。 一、基本概念 定义:DHCP是一种网络协议…...
![](https://i-blog.csdnimg.cn/img_convert/5e62ad87d9d563bdcf6227b5ba3a5495.webp?x-oss-process=image/format,png)
归子莫的科技周刊#2:白天搬砖,夜里读诗
归子莫的科技周刊#2:白天搬砖,夜里读诗 本周刊开源,欢迎投稿。 刊期:2025.1.5 - 2025.1.11。原文地址。 封面图 下班在深圳看到的夕阳,能遇到是一种偶然的机会,能拍下更是一种幸运。 白天搬砖,…...
![](https://i-blog.csdnimg.cn/direct/6a803f9b5a0b4d6482363a36329b21c8.png)
平滑算法 效果比较
目录 高斯平滑 效果对比 移动平均效果比较: 高斯平滑 效果对比 右边两个参数是1.5 2 代码: smooth_demo.py import numpy as np import cv2 from scipy.ndimage import gaussian_filter1ddef gaussian_smooth_array(arr, sigma):smoothed_arr = gaussian_filter1d(arr, s…...
![](https://www.ngui.cc/images/no-images.jpg)
Elasticsearch容器启动报错:AccessDeniedException[/usr/share/elasticsearch/data/nodes];
AccessDeniedException 表明 Elasticsearch 容器无法访问或写入数据目录 /usr/share/elasticsearch/data/nodes。这是一个权限问题。 问题原因: 1、宿主机目录权限不足:映射到容器的数据目录 /data/es/data 在宿主机上可能没有足够的权限供容器访问。 …...
![](https://www.ngui.cc/images/no-images.jpg)
【Linux系统编程】——深入理解 GCC/G++ 编译过程及常用选项详解
文章目录 1. GCC/G 编译过程预处理(Preprocessing)编译(Compilation)汇编(Assembly)连接(Linking) 静态链接与动态链接静态链接动态链接静态库和动态库 GCC 常用选项关于编译器的周边…...
![](https://i-blog.csdnimg.cn/direct/91dd3e30c30e472c93409b8350cd2ff0.png)
Mac安装配置使用nginx的一系列问题
brew安装nginx https://juejin.cn/post/6986190222241464350 使用brew安装nginx,如下命令所示: brew install nginx 如下图所示: 2.查看nginx的配置信息,如下命令: brew info nginxFrom:xxx 这样的,是n…...
![](https://www.ngui.cc/images/no-images.jpg)
Vue3中使用组合式API通过路由传值详解
在Vue 3中,使用组合式API来传递路由参数是一种常见的需求。Vue Router 是 Vue.js 的官方路由管理工具,可以在不同的场景下通过多种方式传递和接收路由参数。下面将详细讲解几种常见的路由传值方式,并提供相应的代码示例。 1. 通过路由参数传…...
![](https://i-blog.csdnimg.cn/direct/de1bf47e9ce1479c8cbccaca3f1cbfc9.png)
两分钟解决 :![rejected] master -> master (fetch first) , 无法正常push到远端库
目录 分析问题的原因解决 分析问题的原因 在git push的时候莫名遇到这种情况 若你在git上修改了如README.md的文件。由于本地是没有README.md文件的,所以导致 远端仓库git和本地不同步。 将远端、本地进行合并就可以很好的解决这个问题 注意:直接git pu…...
![](https://www.ngui.cc/images/no-images.jpg)
浏览器安全(同源策略及浏览器沙箱)
一、同源策略(Same Origin Policy) 1.定义 同源策略(Same - origin Policy)是一种浏览器的安全机制。它规定一个网页的脚本只能访问和操作与它同源的资源。这里的 “源” 包括协议(如 http、https)、域名&…...
![](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=https%3A%2F%2Fs2.51cto.com%2Fimages%2Fblog%2F202407%2F22102101_669dc20d2258141920.png&pos_id=lRVHkIuf)
w~Transformer~合集11
我自己的原文哦~ https://blog.51cto.com/whaosoft/12472192 #LightSeq 最高加速9倍!字节跳动开源8比特混合精度Transformer引擎,近年来,Transformer 已经成为了 NLP 和 CV 等领域的主流模型,但庞大的模型参数限制了它的高效训练和推理。…...
![](https://i-blog.csdnimg.cn/direct/68ba6bdfee47424c8a5ec7fd3c3c2d42.png)
Coursera四门课备考入学考试
某学校入学考试复习用,刷到的话纯靠缘分,不方便回答多余问题 (博主本人waive掉了没有考过,但还是基本都学完了) 记录学习coursera的四门课(顺序Py在DS前,其他无所谓) Mathematics fo…...
![](https://i-blog.csdnimg.cn/direct/a81da2479f974b8c9aafe36a5fac2f2d.png)
Flink(八):DataStream API (五) Join
1. Window Join Window join 作用在两个流中有相同 key 且处于相同窗口的元素上。这些窗口可以通过 window assigner 定义,并且两个流中的元素都会被用于计算窗口的结果。两个流中的元素在组合之后,会被传递给用户定义的 JoinFunction 或 FlatJoinFunct…...
![](https://i-blog.csdnimg.cn/direct/e7b01ac48c61434099a6b4d2c22e383f.png)
HarmonyOS NEXT边学边玩:从零实现一个影视App(六、视频播放页的实现)
在HarmonyOS NEXT中,ArkUI是一个非常强大的UI框架,能够帮助开发者快速构建出美观且功能丰富的用户界面。本文将详细介绍如何使用ArkUI实现一个影视App的视频播放页面。将从零开始,逐步构建一个功能完善的视频播放页面,并解释每一部…...
![](https://www.ngui.cc/images/no-images.jpg)
salesforce实现一个字段的默认初始值根据另一个字段的值来自动确定
在 Salesforce 中,可以通过 公式字段 或 触发器 (Trigger) 实现字段的默认初始值根据另一个字段的值来自动确定,具体实现方法如下: 1. 使用公式字段 公式字段是一种动态字段,值会根据公式实时计算。 步骤: 导航到字段…...
![](https://www.ngui.cc/images/no-images.jpg)
Linux 文件权限详解
目录 前言 查看文件权限 修改文件权限 符号方式 数字方式 前言 Linux 文件权限是系统中非常重要的概念之一,用于控制对文件和目录的访问。权限分为读(Read)、写(Write)、执行(Execute)三个…...
![](https://i-blog.csdnimg.cn/direct/77bc480c8d764f1dbeea734e82a348fa.png)
【混合开发】CefSharp+Vue桌面应用程序开发
为什么选择CefSharpVue做桌面应用程序 CefSharp 基于 Chromium Embedded Framework (CEF) ,它可以将 Chromium 浏览器的功能嵌入到 .NET 应用程序中。通过 CefSharp,开发者可以在桌面应用程序中集成 Web 技术,包括 HTML、JavaScript、CSS 等…...
![](https://www.ngui.cc/images/no-images.jpg)
springBoot项目使用Elasticsearch教程
目录 一、引言(一)使用背景(二)版本库区别 二、引入依赖(一)springboot集成的es依赖(建议)(二)es提供的客户端库 三、配置(以yaml文件为例&#x…...
![](https://i-blog.csdnimg.cn/direct/8bd7e50194994a2ebaf4935b26e91590.png)
模型 多元化思维(系统科学)
系列文章分享模型,了解更多👉 模型_思维模型目录。融合多学科知识,全面解决问题。 1 多元化思维模型的应用 1.1 完美日记的私域流量运营 完美日记作为美妆行业的新兴品牌,通过多元化的思维模型在私域流量运营中取得了显著成功。…...
![](https://www.ngui.cc/images/no-images.jpg)
Google地图瓦片爬虫
地图地址说明 1、谷歌矢量(中文标注) http://mt{0-3}.google.cn/vt/vm416115521&hlzh-CN&glcn&x{x}&y{y}&z{z}&sGalileo 2、谷歌矢量(英文标注) http://mt{0-3}.google.cn/vt/vm416115521&hlen&glcn&x{x}&y{y}&z{z}&sGali…...
![](https://i-blog.csdnimg.cn/direct/fc6ac6d93b4745b591bb8a8e48f86779.png#pic_right)
【C++】size_t全面解析与深入拓展
博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 💯前言💯一、什么是size_t?为什么需要size_t? 💯二、size_t的特性与用途1. size_t是无符号类型示例: 2. size_t的跨平台适应性示例对…...
![](https://i-blog.csdnimg.cn/direct/fabb57fb74544ffa957751b5579addfc.png)
Web端实时播放RTSP视频流(监控)
一、安装ffmpeg: 1、官网下载FFmpeg: Download FFmpeg 2、点击Windows图标,选第一个:Windows builds from gyan.dev 3、跳转到下载页面: 4、下载后放到合适的位置,不用安装,解压即可: 5、配置path 复制解压后的\bin路径,配置环境变量如图: <...
![](https://i-blog.csdnimg.cn/img_convert/62ad4cc3ce98f19220ca13b0807cb1a6.png)
学习 Git 的工作原理,而不仅仅是命令
Git 是常用的去中心化源代码存储库。它是由 Linux 创建者 Linus Torvalds 创建的,用于管理 Linux 内核源代码。像 GitHub 这样的整个服务都是基于它的。因此,如果您想在 Linux 世界中进行编程或将 IBM 的 DevOps Services 与 Git 结合使用,那…...
做酸菜视频网站/博客可以做seo吗
前天看了一篇关于三维立体画制作的文章,最近项目时间比较轻松,正好开始学习C#,就写了一个来练手。下载程序:http://files.cnblogs.com/realfun/StereoGraph.rar下载源码:http://files.cnblogs.com/realfun/StereoGraph…...
![](https://img-blog.csdnimg.cn/img_convert/5691782fc30e206700e075d91222febd.png)
企业网站建设规划的基本原则是什么/百度关键词优化排名
现在很多行业,都离不开Excel:做财务的,要用Excel做报表;做物流的,会用Excel来跟踪订单情况;做HR的,会用Excel算工资;做运营的,会用Excel记录数据做分析。不知道你有没有这…...
如何免费申请公司网站/快推广app下载
在《【ASP.NET】利用UpdatePanel与ScriptManager完成局部的更新》(点击打开链接)介绍过如果直接利用C#完成javascript中Ajax的局部更新。 其实在ASP.NET3.5版本之后,可以完全可以像窗体程序《【C#】Timer、窗体大小和屏幕大小》(…...
![](https://img-blog.csdnimg.cn/img_convert/637c06e21c5ed56faaa121ade8e5fa13.png)
陕西住房建设厅考试官方网站/b站推广网站2024mmm
拼多多用短短三年时间就成为国内第三大电商,这让阿里和京东这两大电商倍感压力,面对这种挑战这两大近期纷纷推出拼购活动,然而这可能恰恰可能是它们误入拼多多的圈套。阿里与京东之争在多年以前,阿里以淘宝起家,通过大…...
![](https://www.oschina.net/img/hot3.png)
网站运行维护/9个成功的市场营销案例
2019独角兽企业重金招聘Python工程师标准>>> /* B:拦截导弹查看提交统计提问总时间限制:1000ms 内存限制:65536kB描述某国为了防御敌国的导弹袭击,开发出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的…...
![](https://img-blog.csdnimg.cn/20210808194256454.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2RvbmtleWJveTAwMQ==,size_16,color_FFFFFF,t_70)
京东商城网站建设/搜狐综合小时报2022113011
基本介绍: 1)开闭原则(Open Close Principle)是编程中最基础、最重要的设计原则 2)一个软件实体如类,模块和函数应该对扩展开放(对提供方),对修改关闭(对使…...