线性代数空间理解
学习线性代数已经很久,但是在使用过程中仍然还是不明所以,比如不知道特征向量和特征值的含义、矩阵的相乘是什么意思、如何理解矩阵的秩……。随着遇到的次数越来越多,因此我决定需要对线性代数的本质做一次深刻的探讨了。
本次主要是参考了3Blue1Brown和其他若干博客来对此展开笔记的记录。
需要说明的是,这里的是记录线性代数的本质,因此关于如何计算的方法或者内容则相对较少。
向量是什么
先抛出一个问题,什么是向量。这里存在着三个观点。虽然不同,但是存在着一定的联系。
主要由物理专业、计算机专业和数学专业三种角度来看待这个问题。
- 物理学家认为,向量是空间中的箭头,决定一个向量的是它的长度和它所指的方向。因此只要在空间中,能够保证以上两个特征,那么就可以自由移动一个向量而保持不变。
- 计算机专业的则认为,向量是有序的数字列表。
这两种观点的存在就导致在使用或者讨论过程中存在两种观点,即向量到底是空间中的箭头,还是一组有序的序列?
-
因此,数学家则尝试概括这两种情况,其认为,向量只要保证两个向量相加和数字与向量相乘有具体的含义,则向量可以是任何的东西。也正因如此,向量在使用过程中,可以将空间中的箭头转为对应的有序数列;而有序的序列也可以转为空间中的一个箭头(具有几何意义)。
这里之所以被数学家认为只需要考虑加法和乘法,我认为是因为对于一个空间来说,根据一个坐标空间中的基向量,只用加法和乘法就是可以完全表示基向量所在的空间。因此不需要考虑其他的运算了。
这个过程可以参考视频来理解。
因此,线性代数的意义有:
1. **为数据分析提供了一条将大量数据列表概念化和可视化的渠道,了解特定运算的含义。**
1. **给物理学家和计算机程序员提供了一种语言,这样就可以通过计算机能处理数字,进一步而操纵空间。**
线性变换和矩阵
先说线性变换。线性变换其实就是函数,只不过输入就是向量,输出还是向量而已。但是为什么从功能上来看是一样的操作,但是却要用两个概念来定义呢?
这是因为,线性变换体现在变换这个词上。The word “transformation” suggests that you think using movement
. 也就是,线性变换就是一种向量的变动/运动。
原则上,变换可以是多种多样的,但是线性代数将变换进行了约束,即限制在线性的特殊变换上。
这里说一下线性的两个特点,只要满足皆为线性变换:1)直线变换之后仍然保持为直线;2)原点必须保持固定。
如果要是从图形的角度上来看,那么借助带有网格线的坐标系来看,所谓的能够符合线性变换的定义的变换,就是变换之后的网格线仍然保持平行且等距的特点。此时就可以认为是线性变换。
下面只有第一个图才是线性变换,其他的都不是。




那么接下来就引出“如何用数值来描述这些线性变换呢?”这就要引出接下来要说的矩阵了。
先说一个列向量 V ^ = [ 1 , 2 ] T \hat V = [1,2]^T V^=[1,2]T,用基向量 i , j i, j i,j可以在坐标系中表示如下:
那么我们进行坐标系的整体旋转。如下图所示,原坐标系为浅色细线构成,剪切后(视频中定义为Shear
,它是一种拉伸。而旋转被定义为Rotation
,它是常见的旋转操作)的坐标系为蓝色粗线构成。
此时基向量在原来的坐标系中表示为 [ 1 , − 2 ] T [1, -2]^T [1,−2]T和 [ 3 , 0 ] T [3, 0]^T [3,0]T。转变后的向量 V ^ \hat V V^等于 [ 5 , 2 ] T [5, 2]^T [5,2]T。
至此,便可以总结几点信息:
- 在原直角坐标系中,基坐标 i = [ 1 , 0 ] T , j = [ 0 , 1 ] T i=[1, 0]^T, j=[0, 1]^T i=[1,0]T,j=[0,1]T;
- 向量的线性转化在公示上表现为左乘一个矩阵,该矩阵就是一个新坐标系的基(当然该矩阵的列向量可以线性相关,也可以线性无关。比如在二维平面中,线性相关就表示为两个重叠的基向量,那么就体现为一条直线了);
- 线性变换的本质其实就是向量的空间变换;
- 其实这个过程也可以侧面说明,为什么数学家把向量的定义为
向量只要保证两个向量相加和数字与向量相乘有具体的含义
。在线性变换的过程中,也就只使用了加法和乘法两种运算就实现了线性变换。 - 同时这也可以看出,只需要记录基向量,那么就可以表示出任意向量的落脚点。
线性变换的复合和矩阵乘法
先说结论:两矩阵相乘的几何意义,也就是两个线性变化的相继作用(multiplying two matrices like this has the geometric meaning of applying one transformation then another)
如下图所示,基向量经过两次复合变换。但是如何记录这两次复合变换的过程。这就需要用到矩阵的相乘。
其实这就很简单,只需要按照变换的顺序,写出对应的变换矩阵就可以了,剩下的就是交给矩阵相乘。
行列式
“The purpose of computation is insight, not numbers”—Richard Hamming
在线性变换的时候,网格图的单位坐标会发生缩放,那么对于单位长度围成的图形来说,就可以计算出对应的面积。那么在缩放单位坐标时,所围成的图形的面积也跟着对应缩放。
在下图中,图形由原来的面积A变为6A,面积增长了6倍。此时就引出了行列式在几何中的定义:线性变换改变面积的比例被称为线性变换的行列式。
这里还有一个特殊情况,就是当行列式为0时,那么对应的几何效果如下。这时候说明它将整个平面压缩到一条线上,甚至是在一个点上。
正是因为有这个特性,那么可以得出一个结论:只需要检验一个矩阵的行列式是否为0,我们就能了解这个矩阵所代表的变换是否将空间压缩到更小的维度上。
换句话说,只有矩阵代表的变换将空间压缩到更低的维度时(空间压缩对应的就是矩阵的行列式为零),才会存在一个非零向量,使得矩阵和它的乘积向量为零向量。
实际上,特征值是存在为负数的情况的,那么该如何理解缩放为负数倍的情况呢?
动画说明
这里以二维平面为例,从几何上来说,其实是空间上的一次翻转,就类似一枚硬币,从正面翻转到反面的效果。
那么如果从基向量的角度上来看,那么就可以认为是两个基向量的相对位置发生了变换。具体如下面两张图所示.


扩展了解:
- 如何理解为什么负的面积与定向(orientation)的改变有关?
- d e t ( M ) < 0 det(M) \lt 0 det(M)<0意味着什么? 在三维空间下是什么意思?
- 如何计算行列式?在几何层面行列式的计算证明。
矩阵的逆
矩阵的逆时应用在解方程组的时候使用的。
具体来说,对于一个线性变换 A x ⃗ = v ⃗ A \vec{x} = \vec{v} Ax=v ,其对应的几何变换如下图所示,即需要找到一个向量 x ⃗ \vec{x} x在变换矩阵 A A A的作用下,使得与向量 v ⃗ \vec{v} v重合(如粉红色箭头所示)。

而矩阵的逆或者说逆变换则是指与向量 v ⃗ \vec{v} v重合之后,通过线性变换再变回向量 x ⃗ \vec{x} x。而此时的计算就变为了 x ⃗ = A − 1 v ⃗ \vec{x} = A^{-1} \vec{v} x=A−1v。这时就需要考虑$ A^{-1} $的情况
在#行列式#一节中说到,变换矩阵的行列式决定了该线性变换是否会产生压缩空间的情况发生。因此$ A^{-1} 有两种情况,即 有两种情况,即 有两种情况,即det(A)=?0$。
当 d e t ( A ) ≠ 0 det(A) \ne 0 det(A)=0时,就几何变换如下图所示(存在非零向量的变换)


其实这两张图更直观地可以看出 A − 1 A = E A^{-1} A=E A−1A=E,表示什么变换都没有。
如果 d e t ( A ) = 0 det(A) = 0 det(A)=0时,那么在几何上就表示为变换空间压缩到更低的维度上。由于不能将一条线反转或者解压缩为一个平面(以2-D为例),因此就不存在这样的逆变换。
基变换
前文一直以来都是以标准的直角坐标系来当作基向量来说明向量。但是事实上,还是存在其他的基向量,比如下图中,两个基向量分别是 b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1,b2。那么对应的向量就是单位向量。

但是在标准的直角坐标系中, b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1,b2就不是单位向量了(如下图)。

正是因为对基的不同选择,那么就造成了不同向量的表达。那么该如何实现不同基下的向量转换呢?
比如,在新坐标系中,有一向量 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [−12]。那么在标准的直角坐标系中应该是多少呢?
其实很简单,根据#线性变换和矩阵#章节的内容就可以知道,矩阵与向量的乘积就表示了基向量的转换。计算过程如下图所示。新坐标系中,基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1=[21];b2=[−11]。
r如果仔细想一想,上述的过程是反着的。正常的逻辑不应该是用新坐标系中的 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [−12]与 b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1,b2构成的向量的逆相乘吗?这样才能够变换回去呀。
但是如果再仔细一想,新基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1=[21];b2=[−11]是在标准坐标系中表示的。那么假设 A = [ 2 − 1 1 2 ] A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix} A=[21−12],那么对于新坐标系来说,其要转为标准直角坐标系下的向量,那么变换的逆矩阵就是A。
接下来就基变换的问题来引申出以往见过的矩阵表达式 A − 1 M A A^{-1}MA A−1MA的含义是什么。
在标准的直角坐标系中,坐标系的逆时针循转可以用如下的矩阵来实现。
那么如果用基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1=[21];b2=[−11]的新坐标系中实现某一向量 v ⃗ \vec{v} v在新坐标系中的转换呢?
在下图的公式中(矩阵相乘从右往左看)就给出了计算的转换方法。其中 A = [ 2 − 1 1 2 ] A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix} A=[21−12], M = [ 0 − 1 1 0 ] M=\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} M=[01−10]
所以, A − 1 M A A^{-1}MA A−1MA暗示了一种数学上的转移作用,中间矩阵 M M M表示某种变换,而外侧的两个矩阵代表着转移作用,页就是视觉上的转化。
特征值和特征向量
首先考虑这样一个问题,对于一个向量,其张成的空间如下图所示(也就是通过原点和向量尖端的直线)

现在让这个坐标系进行变换,变换矩阵为 [ 3 1 0 2 ] \begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix} [3012],那么此时大部分的向量离开了其张成的空间,效果如下图:

但是,有一些向量却没有离开其张成的空间,变换矩阵只是对其进行了缩放而已,效果如下图所示:

在经过定性分析之后,我们展开对其的定量分析。在变换的过程中我们发现有两组向量张成的空间是特殊的(即没有离开其张成的空间),我们依次来看。
首先是x轴的变换,如下图所示,在变换之后,单位长度被放大了3倍。


而向量 [ − 1 , 1 ] [-1, 1 ] [−1,1]也是同样,但是其单位长度倍放大了2倍。


那么对这两个向量的缩放结果如下图所示:

而这两个向量就是我们所说的特征向量,而缩放的倍数就是特征值。
特征向量的特点:在旋转之后还会留在他张成(形成)的向量空间里。
特征值是衡量特征向量在变换中拉伸或者压缩比例的因子。

从这里可以看出特征值的乘积就是经过线性变换后矩阵行列式的值,如果特征值出现了负数,那么其几何含义与行列式是一样的。
理解线性变换作用的关键往往较少依赖于特定坐标系。(This gives too mush weight to our coordinate system)
更好的方法就是求出它的特征向量和特征值。
扩展了解:
-
若想考虑为什么那么重要,那么具有用途并值得研究,那么就来考虑三维空间中的旋转。
-
对角矩阵的应用以及如何转化。
如果一个矩阵可以对角化,那么可以有很多用处,比如幂迭代法求解特征值分解和奇异值分解等
2024/04/17:只对向量的本质作了进一步的了解。只能说数形结合太重要了
相关文章:

线性代数空间理解
学习线性代数已经很久,但是在使用过程中仍然还是不明所以,比如不知道特征向量和特征值的含义、矩阵的相乘是什么意思、如何理解矩阵的秩……。随着遇到的次数越来越多,因此我决定需要对线性代数的本质做一次深刻的探讨了。 本次主要是参考了3…...

Spring Boot教程之五:在 IntelliJ IDEA 中运行第一个 Spring Boot 应用程序
在 IntelliJ IDEA 中运行第一个 Spring Boot 应用程序 IntelliJ IDEA 是一个用 Java 编写的集成开发环境 (IDE)。它用于开发计算机软件。此 IDE 由 Jetbrains 开发,提供 Apache 2 许可社区版和商业版。它是一种智能的上下文感知 IDE,可用于在各种应用程序…...

C51相关实验
C51相关实验 LED //功能:1.让开发板的LED全亮,2,点亮某一个LED,3.让LED3以5Hz的频率闪动#include "reg52.h"#define LED P2 sbit led1 LED^1;void main(void) {LED 0xff;//LED全灭led1 0;while(1)//保持应用程序不退出{} }LED 输出端是高…...

docker离线安装linux部分问题整理
0:离线安装docker过程命令 echo $PATH tar -zxvf docker-26.1.4.tgz chmod 755 -R docker cp docker/* /usr/bin/ root 权限 vim /etc/systemd/system/docker.service --------- [Unit] DescriptionDocker Application Container Engine Documentationhttps://docs.do…...

ISUP协议视频平台EasyCVR萤石设备视频接入平台银行营业网点安全防范系统解决方案
在金融行业,银行营业厅的安全保卫工作至关重要,它不仅关系到客户资金的安全,也关系到整个银行的信誉和运营效率。随着科技的发展,传统的安全防护措施已经无法满足现代银行对于高效、智能化安全管理的需求。 EasyCVR视频汇聚平台以…...

递推概念和例题
一、什么是递推 递推算法以初始值为基础,用相同的运算规律,逐次重复运算,直至求出问题的解,它的本质是按照固定的规律逐步推出(计算出)下一步的结果 这种从“起点”重复相同的的方法直至到达问题的解&…...

开发工具 - VSCode 快捷键
以下是一些常用的 VS Code 快捷键(Windows、macOS 和 Linux 均适用,略有不同): 常用快捷键 功能Windows/LinuxmacOS打开命令面板Ctrl Shift P 或 F1Cmd Shift P打开文件Ctrl OCmd O保存文件Ctrl SCmd S全部保存Ctrl K,…...

数据库的联合查询
数据库的联合查询 简介为什么要使⽤联合查询多表联合查询时MYSQL内部是如何进⾏计算的构造练习案例数据案例:⼀个完整的联合查询的过程 内连接语法⽰例 外连接语法 ⽰例⾃连接应⽤场景示例表连接练习 ⼦查询语法单⾏⼦查询多⾏⼦查询多列⼦查询在from⼦句中使⽤⼦查…...

【人工智能】基于PyTorch的深度强化学习入门:从DQN到PPO的实现与解析
《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 深度强化学习(Deep Reinforcement Learning)是一种结合深度学习和强化学习的技术,适用于解决复杂的决策问题。深度Q网络(DQN)和近端策略优化(PPO)是其中两种经典的算法,被广泛应用于游戏、机器人控…...

【深度学习】【RKNN】【C++】模型转化、环境搭建以及模型部署的详细教程
【深度学习】【RKNN】【C】模型转化、环境搭建以及模型部署的详细教程 提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论 文章目录 【深度学习】【RKNN】【C】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转rknnpytorch转onnxonnx转rkn…...

CentOS环境上离线安装python3及相关包
0. 准备操作系统及安装包 准备操作系统环境: 首先安装依赖包,安装相应的编译工具 [rootbigdatahost bin]# yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-d…...

学习threejs,使用设置bumpMap凹凸贴图创建褶皱,实现贴图厚度效果
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.MeshPhongMaterial高…...

React表单联动
Ant Design 1、dependencies Form.Item 可以通过 dependencies 属性,设置关联字段。当关联字段的值发生变化时,会触发校验与更新。 一种常见的场景:注册用户表单的“密码”与“确认密码”字段。“确认密码”校验依赖于“密码”字段&#x…...

408数据结构:栈、队列和数组选择题做题笔记
408数据结构 第一章 绪论 第二章 线性表 绪论、线性表选择题做题笔记 第三章 栈、队列和数组 栈、队列和数组选择题做题笔记 文章目录 408数据结构前言 一、队列二、栈和队列的应用总结 前言 本篇文章为针对王道25数据结构课后习题的栈、队列和数组的做题笔记,后续…...

sql工具!好用!爱用!
SQLynx的界面设计简洁明了,操作逻辑清晰易懂,没有复杂的图标和按钮,想对哪部分操作就在哪里点击右键,即使你是数据库小白也能轻松上手。 尽管SQLynx是一款免费的工具,但是它的功能却丝毫不逊色于其他付费产品ÿ…...

嵌入式驱动开发详解3(pinctrl和gpio子系统)
文章目录 前言pinctrl子系统pin引脚配置pinctrl驱动详解 gpio子系统gpio属性配置gpio子系统驱动gpio子系统API函数与gpio子系统相关的of函数 pinctrl和gpio子系统的使用设备树配置驱动层部分用户层部分 前言 如果不用pinctrl和gpio子系统的话,我们开发驱动时需要先…...

【C++】IO库(一):IO类
IO 库 C 不直接处理输入输出,而是通过定义一族定义在标准库当中的类型来处理IO。 8.1 IO 类 为了支持不同种类的 IO 处理操作,除了 istream 和 ostream 之外,标准库还定义了其它 IO 类型。这些类型分别定义在三个独立的头文件当中…...

uniapp介入极光推送教程 超级详细
直接按照下面教程操作 一步一步来 很快就能 完成 下面的文章非常详细 ,我就不班门弄斧了 直接上原文链接 https://blog.csdn.net/weixin_52830464/article/details/143823231...

阿里云整理(一)
阿里云整理 1. 介绍规模 2. 专业名词2.1 专有网络VPC2.2 安全组SG2.3 云服务器ECS2.4 资源组2.5 部署集2.5 web测试 1. 介绍 阿里云是一家提供云计算和人工智能服务的科技公司,成立于2009年,总部位于杭州。它为全球客户提供全方位的云服务ÿ…...

论文笔记 网络安全图谱以及溯源算法
本文提出了一种网络攻击溯源框架,以及一种网络安全知识图谱,该图由六个部分组成,G <H,V,A,E,L,S,R>。 1|11.知识图 网络知识图由六个部分组成,…...

室内定位论文速递(11.23-11.25)
多传感器姿态估计的Delta滤波器和卡尔曼滤波器设计在球形移动测绘系统中的应用 关键词 球形机器人;姿态估计;传感器融合;卡尔曼滤波器;Delta滤波器;移动测绘;LiDAR 研究问题 球形移动测绘系统中的惯性姿态估计过滤技术尚未得到充分研究。由于其内在的滚动运动,该系统…...

英伟达推出了全新的小型语言模型家族——Hymba 1.5B
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...

云网络基础- TCP/IP 协议
文章目录 典型服务模式TCP/IP 协议设置和查看IPIP地址的分类:IP地址组成: 网络位主机位组成克隆:产生一台新的虚拟机win2008 典型服务模式 • C/S,Client/Server架构 – 由服务器提供资源或某种功能 – 客户机使用资源或功能 TCP/IP 协议 • TCP/IP是最广泛支持的通信协议集合…...

android 音效可视化--Visualizer
Visualizer 是使应用程序能够检索当前播放音频的一部分以进行可视化。它不是录音接口,仅返回部分低质量的音频内容。但是,为了保护某些音频数据的隐私,使用 Visualizer 需要 android.permission.RECORD_AUDIO权限。传递给构造函数的音频会话 …...

Python人工智能项目报告
一、实践概述 1、实践计划和目的 在现代社会,计算机技术已成为支撑社会发展的核心力量,渗透到生活的各个领域,应关注人类福祉,确保自己的工作成果能够造福社会,同时维护安全、健康的自然环境,设计出具有包…...

DockerFile 构建基础镜像
1.准备东西 DockerFile 文件 以及安装docker环境 文件内容如下: # 使用Alpine Linux作为基础镜像 FROM --platformlinux/amd64 nginx:1.27.2-alpine # 维护者信息 LABEL maintainer"xu_yhao163.com" ENV LANG en_US.UTF-8 ENV LANGUAGE en_US:en ENV …...

卷积神经网络学习记录
目录 神经网络基础定义: 基本组成部分 工作流程 卷积层(卷积定义)【CONV】: 卷积层(Convolutional Layer) 特征提取:卷积层的主要作用是通过卷积核(或滤波器)运算提…...

5种常见的k8s云原生数据管理方案详解
Kubernetes(K8s)是云原生架构的核心组件,提供高效的容器编排和管理功能。在数据存储方面,K8s通过PersistentVolumes(PV)和PersistentVolumeClaims(PVC)机制实现数据持久化࿰…...

[C++]了解内置类型升级
内置类型升级 1.调用模板T时,为什么可以使用T()类型的匿名对象来传参2.内置类型被升级成为类后的使用事项 1.调用模板T时,为什么可以使用T()类型的匿名对象来传参 当我们在定义或声明一个函数时,如果想使用模板T类型的默认构造(例…...

docker镜像源配置、换源、dockerhub国内镜像最新可用加速源(仓库)
一、临时拉取方式 在docker pull后先拼接镜像源域名,后面拼接拉取的镜像名 $ docker pull dockerpull.org/continuumio/miniconda3 二、永久配置方式 vim修改/etc/docker/daemon.json,并重启docker服务。 # 创建目录 sudo mkdir -p /etc/docker# 写…...