当前位置：首页 > news >正文

学习笔记：Opencv实现图像特征提取算法SIFT

news 2026/2/8 3:50:48

2023.8.19

为了在暑假内实现深度学习的进阶学习，特意学习一下传统算法，分享学习心得，记录学习日常

SIFT的百科：

SIFT = Scale Invariant Feature Transform, 尺度不变特征转换

全网最详细SIFT算法原理实现_ssift算法_Tc.小浩的博客-CSDN博客

在环境配置中要配置opencv：

pip install opencv-contrib-python

SIFT算法的三个计算步骤：

1，在DOG尺度空间中获取特征点；

2，关键点的方向估计（寻找主方向）

3，通过各关键点的特征向量（关键点的描述子生成）

进行两两比较找出相互匹配的若干对特征点，建立两图间景物间的对应关系，可以基于SIFT实现图像拼接

Code of SIFT and lena：

注意你是否有lena.png图像

import cv2 as cvimg = cv.imread('lena.png')
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
sift = cv.xfeatures2d.SIFT_create()
# sift = cv.SIFT_create()
kp = sift.detect(gray, None)
img = cv.drawKeypoints(gray, kp, img)
cv.imshow("SIFT", img)
cv.imwrite('sift_keypoints.jpg', img)
cv.waitKey(0)
cv.destroyAllWindows()

Result is shown in these figrues : SIFT 提取了lena的特征点

基于SIFT的图片实现图片拼接：

代码是Copy大神的，注意有两个代码，运行第二个喔。代码所用的图片也附上！

import numpy as np
import cv2class Stitcher:# 拼接函数def stitch(self, images, ratio=0.75, reprojThresh=4.0, showMatches=False):# 获取输入图片(imageB, imageA) = images# 检测A、B图片的SIFT关键特征点，并计算特征描述子(kpsA, featuresA) = self.detectAndDescribe(imageA)(kpsB, featuresB) = self.detectAndDescribe(imageB)# 匹配两张图片的所有特征点，返回匹配结果M = self.matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh)# 如果返回结果为空，没有匹配成功的特征点，退出算法if M is None:return None# 否则，提取匹配结果# H是3x3视角变换矩阵(matches, H, status) = M# 将图片A进行视角变换，result是变换后图片result = cv2.warpPerspective(imageA, H, (imageA.shape[1] + imageB.shape[1], imageA.shape[0]))# 将图片B传入result图片最左端result[0:imageB.shape[0], 0:imageB.shape[1]] = imageB# 检测是否需要显示图片匹配if showMatches:# 生成匹配图片vis = self.drawMatches(imageA, imageB, kpsA, kpsB, matches, status)# 返回结果return (result, vis)# 返回匹配结果return resultdef detectAndDescribe(self, image):# 将彩色图片转换成灰度图gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 建立SIFT生成器descriptor = cv2.xfeatures2d.SIFT_create()# 检测SIFT特征点，并计算描述子(kps, features) = descriptor.detectAndCompute(image, None)# 将结果转换成NumPy数组kps = np.float32([kp.pt for kp in kps])print(kps)# 返回特征点集，及对应的描述特征return (kps, features)def matchKeypoints(self, kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh):# 建立暴力匹配器matcher = cv2.DescriptorMatcher_create("BruteForce")# 使用KNN检测来自A、B图的SIFT特征匹配对，K=2rawMatches = matcher.knnMatch(featuresA, featuresB, 2)matches = []for m in rawMatches:# 当最近距离跟次近距离的比值小于ratio值时，保留此匹配对if len(m) == 2 and m[0].distance < m[1].distance * ratio:# 存储两个点在featuresA, featuresB中的索引值matches.append((m[0].trainIdx, m[0].queryIdx))# 当筛选后的匹配对大于4时，计算视角变换矩阵if len(matches) > 4:# 获取匹配对的点坐标ptsA = np.float32([kpsA[i] for (_, i) in matches])ptsB = np.float32([kpsB[i] for (i, _) in matches])# 计算视角变换矩阵(H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC, reprojThresh)# 返回结果return (matches, H, status)# 如果匹配对小于4时，返回Nonereturn Nonedef drawMatches(self, imageA, imageB, kpsA, kpsB, matches, status):# 初始化可视化图片，将A、B图左右连接到一起(hA, wA) = imageA.shape[:2](hB, wB) = imageB.shape[:2]vis = np.zeros((max(hA, hB), wA + wB, 3), dtype="uint8")vis[0:hA, 0:wA] = imageAvis[0:hB, wA:] = imageB# 联合遍历，画出匹配对for ((trainIdx, queryIdx), s) in zip(matches, status):# 当点对匹配成功时，画到可视化图上if s == 1:# 画出匹配对ptA = (int(kpsA[queryIdx][0]), int(kpsA[queryIdx][1]))ptB = (int(kpsB[trainIdx][0]) + wA, int(kpsB[trainIdx][1]))cv2.line(vis, ptA, ptB, (0, 255, 0), 1)# 返回可视化结果return vis

from Stitcher import Stitcher
import cv2# 读取拼接图片
imageA = cv2.imread("image/left_01.png")
imageB = cv2.imread("image/right_01.png")# 把图片拼接成全景图
stitcher = Stitcher()
(result, vis) = stitcher.stitch([imageA, imageB], showMatches=True)# 显示所有图片
cv2.imshow("Image A", imageA)
cv2.imshow("Image B", imageB)
cv2.imshow("Keypoint Matches", vis)
cv2.imshow("Result", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

代码使用的图片

效果是这样：

学习笔记：Opencv实现图像特征提取算法SIFT

2023.8.19 为了在暑假内实现深度学习的进阶学习，特意学习一下传统算法，分享学习心得，记录学习日常 SIFT的百科： SIFT Scale Invariant Feature Transform, 尺度不变特征转换全网最详细SIFT算法原理实现_ssift算法_Tc.小浩的博客…...

编程日记 2023/8/20 14:40:54

【golang】接口类型（interface）使用和原理

接口类型的类型字面量与结构体类型的看起来有些相似，它们都用花括号包裹一些核心信息。只不过，结构体类型包裹的是它的字段声明，而接口类型包裹的是它的方法定义。接口类型声明中的这些方法所代表的就是该接口的方法集合。一个接口的方法集…...

编程日记 2023/8/20 14:39:53

【Linux操作系统】Linux系统编程中的共享存储映射（mmap）

在Linux系统编程中，进程之间的通信是一项重要的任务。共享存储映射（mmap）是一种高效的进程通信方式，它允许多个进程共享同一个内存区域，从而实现数据的共享和通信。本文将介绍共享存储映射的概念、原理、使用方法和注意…...

编程日记 2023/8/20 14:38:52

2235.两整数相加：19种语言解法（力扣全解法）

【LetMeFly】2235.两整数相加：19种语言解法（力扣全解法） 力扣题目链接：https://leetcode.cn/problems/add-two-integers/ 给你两个整数 num1 和 num2，返回这两个整数的和。示例 1： 输入：num…...

编程日记 2023/8/20 14:37:50

中国剩余定理及扩展

目录中国剩余定理解释中国剩余定理扩展——求解模数不互质情况下的线性方程组： 代码实现： 互质： 非互质： 中国剩余定理解释在《孙子算经》中有这样一个问题：“今有物不知其数，三三数之剩二&#x…...

编程日记 2023/8/20 14:36:48

数据在内存中的存储（deeper）

数据在内存中的存储（deeper） 一.数据类型的详细介绍二.整形在内存中的存储三.浮点型在内存中的存储一.数据类型的详细介绍类型的意义： 使用这个类型开辟内存空间的大小（大小决定了使用范围）如何看待内存空间的视角…...

编程日记 2023/8/20 14:35:46

算法修炼Day52|● 300.最长递增子序列 ● 674. 最长连续递增序列 ● 718. 最长重复子数组

LeetCode:300.最长递增子序列 300. 最长递增子序列 - 力扣（LeetCode） 1.思路 dp[i]的状态表示以nums[i]为结尾的最长递增子序列的个数。 dp[i]有很多个，选择其中最大的dp[i]Math.max(dp[j]1,dp[i]) 2.代码实现 1class Solution {2 pub…...

编程日记 2023/8/20 14:34:44

使用 HTML、CSS 和 JavaScript 创建实时 Web 编辑器

使用 HTML、CSS 和 JavaScript 创建实时 Web 编辑器在本文中，我们将创建一个实时网页编辑器。这是一个 Web 应用程序，允许我们在网页上编写 HTML、CSS 和 JavaScript 代码并实时查看结果。这是学习 Web 开发和测试代码片段的绝佳工具。我们将使用ifram…...

编程日记 2023/8/20 14:33:43

百望云联合华为发布票财税链一体化数智解决方案赋能企业数字化升级

随着数据跃升为数字经济关键生产要素，数据安全成为整个数字化建设的重中之重。为更好地帮助企业发展，中央及全国和地方政府相继出台了多部与数据相关的政策法规，鼓励各领域服务商提供具有自主创新的软件产品与服务，帮助企业在合规…...

编程日记 2023/8/20 14:32:42

实现两个栈模拟队列

实现两个栈模拟队列思路：可以想象一下左手和右手，两个栈：stack1（数据所在的栈） ，stack2（临时存放）。入队：需要将入队 num 加在 stack1 的栈顶即可； 出队&am…...

编程日记 2023/8/20 14:31:41

无涯教程-TensorFlow - 单词嵌入

Word embedding是从离散对象(如单词)映射到向量和实数的概念，可将离散的输入对象有效地转换为有用的向量。 Word embedding的输入如下所示: blue: (0.01359, 0.00075997, 0.24608, ..., -0.2524, 1.0048, 0.06259) blues: (0.01396, 0.11887, -0.48963, ..., 0.03…...

编程日记 2023/8/20 14:30:40

Facebook AI mBART：巴别塔的硅解

2018年，谷歌发布了BERT（来自transformers的双向编码器表示），这是一种预训练的语言模型，在一系列自然语言处理（NLP）任务中对SOTA结果进行评分，并彻底改变了研究领域。类似的基于变压器…...

编程日记 2023/8/20 14:29:39

BDA初级分析——SQL清洗和整理数据

一、数据处理数据处理之类型转换字符格式与数值格式存储的数据，同样是进行大小排序， 会有什么区别？ 以rev为例，看看字符格式与数值格式存储时，排序会有什么区别？ 用cast as转换为字符后进行排序 SEL…...

编程日记 2023/8/20 14:28:37

汽车后视镜反射率测定仪

后视镜是驾驶员坐在驾驶室座位上直接获取汽车后方、侧方和下方等外部信息的工具。它起着“第三只眼睛”的作用。后视镜按安装位置划分通常分为车外后视镜、监视镜和内后视镜。外后视镜观察汽车后侧方监视镜观察汽车前下方内后视镜观察汽车后方及车内情况。用途不一样镜面结构也…...

编程日记 2023/8/20 14:27:36

Redis学习笔记

redis相关内容默认端口6379 默认16个数据库，初始默认使用0号库使用select 切换数据库统一密码管理，所有库密码相同 dbsize：查看当前库key的数量 flushdb：清空当前库 flushall：清空全部库 redis是单线程多路…...

编程日记 2023/8/20 14:26:35

韩顺平Linux 四十四--

四十四、rwx权限权限的基本介绍输入指令 ls -l 显示的内容如下 -rwxrw-r-- 1 root 1213 Feb 2 09:39 abc0-9位说明第0位确定文件类型（d , - , l , c , b) l 是链接，相当于 windows 的快捷方式- 代表是文件是普通文件d 是目录，相…...

编程日记 2023/8/20 14:25:34

【支付宝小程序】分包优化教程

🦖我是Sam9029，一个前端 Sam9029的CSDN博客主页:Sam9029的博客_CSDN博客-JS学习,CSS学习,Vue-2领域博主 🐱‍🐉🐱‍🐉恭喜你，若此文你认为写的不错，不要吝啬你的赞扬，求收…...

编程日记 2023/8/20 14:24:31

语言基础2 矩阵和数组

语言基础2 矩阵和数组矩阵和数组是matlab中信息和数据的基本表示形式可以创建常用的数组和网格合并现有的数组操作数组的形状和内容以及使用索引访问数组元素用到的函数列表如下一创建串联和扩展矩阵矩阵时按行和列排列的数据元素的二维数据元素的二维矩…...

编程日记 2023/8/20 14:23:30

在过滤器中引入org.springframework.web.servlet.HandlerExceptionResolver AutowiredQualifier("handlerExceptionResolver")private HandlerExceptionResolver resolver; // doFilter中处理if (条件1) {if (条件2) {resolver.resolveException(request, response, …...

编程日记 2023/8/20 14:22:29

图像检索技术研究：深度度量与深度散列在相似性学习中的应用比较与实践 - 使用Python与Jupyter环境

引言在计算机视觉领域，图像检索是一个长期存在并持续受到研究者关注的重要话题。随着大数据时代的到来，如何高效、准确地从海量数据中检索到相似的图像成为一个巨大的挑战。传统的检索方法在大数据环境下表现不佳，而深度学习技术的崛起为图…...

编程日记 2023/8/20 14:21:28

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留，CCA-Attention为LLM长文本建模带来突破性进展琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），…...

编程新知 2026/2/5 4:25:15

STM32F4基本定时器使用和原理详解

STM32F4基本定时器使用和原理详解前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

编程新知 2026/1/26 21:56:38

【LeetCode】算法详解#6 ---除自身以外数组的乘积

1.题目介绍给定一个整数数组 nums，返回数组 answer ，其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积。题目数据保证数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位整数范围内。请不要使用除法，且在 O…...

编程新知 2026/2/1 20:47:10

Java求职者面试指南：Spring、Spring Boot、Spring MVC与MyBatis技术解析

Java求职者面试指南：Spring、Spring Boot、Spring MVC与MyBatis技术解析一、第一轮基础概念问题 1. Spring框架的核心容器是什么？它的作用是什么？ Spring框架的核心容器是IoC（控制反转）容器。它的主要作用是管理对…...

编程新知 2025/7/17 8:16:30

VisualXML全新升级 | 新增数据库编辑功能

VisualXML是一个功能强大的网络总线设计工具，专注于简化汽车电子系统中复杂的网络数据设计操作。它支持多种主流总线网络格式的数据编辑（如DBC、LDF、ARXML、HEX等），并能够基于Excel表格的方式生成和转换多种数据库文件。由此&…...

编程新知 2026/2/6 5:51:15

ZYNQ学习记录FPGA(一)ZYNQ简介

一、知识准备 1.一些术语,缩写和概念： 1）ZYNQ全称：ZYNQ7000 All Pgrammable SoC 2）SoC:system on chips(片上系统)，对比集成电路的SoB（system on board） 3）ARM：处理器…...

编程新知 2026/2/5 9:30:45

在 Visual Studio Code 中使用驭码 CodeRider 提升开发效率：以冒泡排序为例

目录前言1 插件安装与配置1.1 安装驭码 CodeRider1.2 初始配置建议 2 示例代码：冒泡排序3 驭码 CodeRider 功能详解3.1 功能概览3.2 代码解释功能3.3 自动注释生成3.4 逻辑修改功能3.5 单元测试自动生成3.6 代码优化建议 4 驭码的实际应用建议5 常见问题与解决建议…...

编程新知 2026/2/4 18:09:46

Mac flutter环境搭建

一、下载flutter sdk 制作 Android 应用 | Flutter 中文文档 - Flutter 中文开发者网站 - Flutter 1、查看mac电脑处理器选择sdk 2、解压 unzip ~/Downloads/flutter_macos_arm64_3.32.2-stable.zip \ -d ~/development/ 3、添加环境变量命令行打开配置环境变量文件 ope…...

编程新知 2026/1/29 7:12:33

深入解析 ReentrantLock：原理、公平锁与非公平锁的较量

ReentrantLock 是 Java 中 java.util.concurrent.locks 包下的一个重要类，用于实现线程同步，支持可重入性，并且可以选择公平锁或非公平锁的实现方式。下面将详细介绍 ReentrantLock 的实现原理以及公平锁和非公平锁的区别。 ReentrantLock 实现原理基本架构 ReentrantLo…...

编程新知 2025/10/12 23:48:51

计算机系统结构复习-名词解释2

1.定向：在某条指令产生计算结果之前，其他指令并不真正立即需要该计算结果，如果能够将该计算结果从其产生的地方直接送到其他指令中需要它的地方，那么就可以避免停顿。 2.多级存储层次：由若干个采用不同实现技术的存储…...

编程新知 2025/12/9 20:41:12

学习笔记：Opencv实现图像特征提取算法SIFT

相关文章：

学习笔记：Opencv实现图像特征提取算法SIFT

【golang】接口类型（interface）使用和原理

【Linux操作系统】Linux系统编程中的共享存储映射（mmap）

2235.两整数相加：19种语言解法（力扣全解法）

中国剩余定理及扩展

数据在内存中的存储（deeper）

算法修炼Day52|● 300.最长递增子序列 ● 674. 最长连续递增序列 ● 718. 最长重复子数组

使用 HTML、CSS 和 JavaScript 创建实时 Web 编辑器

百望云联合华为发布票财税链一体化数智解决方案赋能企业数字化升级

实现两个栈模拟队列

无涯教程-TensorFlow - 单词嵌入

Facebook AI mBART：巴别塔的硅解

BDA初级分析——SQL清洗和整理数据

汽车后视镜反射率测定仪

Redis学习笔记

韩顺平Linux 四十四--

【支付宝小程序】分包优化教程

语言基础2 矩阵和数组

springMVC中过滤器抛出异常，自定义异常捕获

图像检索技术研究：深度度量与深度散列在相似性学习中的应用比较与实践 - 使用Python与Jupyter环境

51c自动驾驶~合集58

STM32F4基本定时器使用和原理详解

【LeetCode】算法详解#6 ---除自身以外数组的乘积

Java求职者面试指南：Spring、Spring Boot、Spring MVC与MyBatis技术解析

VisualXML全新升级 | 新增数据库编辑功能

ZYNQ学习记录FPGA(一)ZYNQ简介

在 Visual Studio Code 中使用驭码 CodeRider 提升开发效率：以冒泡排序为例

Mac flutter环境搭建

深入解析 ReentrantLock：原理、公平锁与非公平锁的较量

计算机系统结构复习-名词解释2