计算机视觉之图像特征提取
图像特征提取是计算机视觉中的重要任务,它有助于识别、分类、检测和跟踪对象。以下是一些常用的图像特征提取算法及其简介:
-
颜色直方图(Color Histogram):
- 简介:颜色直方图表示图像中各种颜色的分布情况。通过将图像中的像素分成颜色通道(如RGB)并计算每个通道的颜色值分布,可以捕捉到图像的颜色信息。
- 应用:颜色直方图常用于图像检索、图像分类和图像匹配等任务。
-
局部二值模式(Local Binary Pattern,LBP):
- 简介:LBP是一种用于纹理特征提取的方法。它通过比较每个像素与其邻域像素的灰度值来构建特征。LBP特征对纹理的变化和结构有很好的描述能力。
- 应用:LBP常用于人脸识别、纹理分类和目标检测等任务。
-
方向梯度直方图(Histogram of Oriented Gradients,HOG):
- 简介:HOG是一种用于物体检测的特征提取方法,特别适用于行人检测。它通过计算图像中每个像素的梯度方向并构建梯度方向的直方图来表示图像。
- 应用:HOG广泛应用于行人检测、目标识别和行为分析等领域。
-
尺度不变特征变换(Scale-Invariant Feature Transform,SIFT):
- 简介:SIFT是一种用于检测和描述图像中局部特征的方法。它对图像的尺度、旋转和亮度变化具有不变性,因此在各种条件下都表现良好。
- 应用:SIFT广泛用于特征匹配、物体识别和图像配准等任务。
-
加速稳定特征(Speeded-Up Robust Features,SURF):
- 简介:SURF是一种用于图像特征提取的快速算法。它结合了SIFT的特点,并使用积分图像来加速特征检测和描述子计算。
- 应用:SURF适用于实时应用,如实时目标跟踪和图像拼接。
-
卷积神经网络特征(Convolutional Neural Network Features):
- 简介:基于深度学习的方法,如卷积神经网络(CNN),已经取得了在图像特征提取任务上的显著成功。通过在预训练的CNN模型上提取特征向量,可以获得强大的图像表示。
- 应用:CNN特征广泛用于图像分类、目标检测、图像生成等各种计算机视觉任务。
历程:
颜色直方图 (Color Histogram) 示例:
#include <opencv2/opencv.hpp>int main() {cv::Mat image = cv::imread("image.jpg");cv::Mat hist;// 将图像转换为HSV颜色空间cv::cvtColor(image, image, cv::COLOR_BGR2HSV);// 计算直方图int histSize = 256; // 直方图的大小float range[] = {0, 256}; // 像素值范围const float* histRange = {range};cv::calcHist(&image, 1, 0, cv::Mat(), hist, 1, &histSize, &histRange);// 打印直方图for (int i = 0; i < histSize; i++) {std::cout << "Bin " << i << ": " << hist.at<float>(i) << std::endl;}return 0;
}
局部二值模式 (Local Binary Pattern, LBP) 示例:
#include <opencv2/opencv.hpp>int main() {cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);cv::Mat lbpImage;// 计算LBP图像cv::Ptr<cv::ximgproc::LBP> lbp = cv::ximgproc::createLBPFast();lbp->compute(image, lbpImage);return 0;
}
方向梯度直方图 (Histogram of Oriented Gradients, HOG) 示例:
#include <opencv2/opencv.hpp>int main() {cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);cv::HOGDescriptor hog;// 设置HOG参数hog.winSize = cv::Size(64, 128); // 检测窗口大小hog.blockSize = cv::Size(16, 16); // 块大小hog.blockStride = cv::Size(8, 8); // 块的步幅hog.cellSize = cv::Size(8, 8); // 细胞大小// 计算HOG特征向量std::vector<float> descriptors;hog.compute(image, descriptors);return 0;
}
加速稳健特征 (Speeded-Up Robust Features, SURF) 示例:
#include <opencv2/opencv.hpp>int main() {cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);cv::Ptr<cv::xfeatures2d::SURF> surf = cv::xfeatures2d::SURF::create();// 检测关键点和计算描述子std::vector<cv::KeyPoint> keypoints;cv::Mat descriptors;surf->detectAndCompute(image, cv::noArray(), keypoints, descriptors);return 0;
}
尺度不变特征变换 (Scale-Invariant Feature Transform, SIFT) 示例:
#include <opencv2/opencv.hpp>int main() {cv::Mat image = cv::imread("image.jpg", cv::IMREAD_GRAYSCALE);cv::Ptr<cv::xfeatures2d::SIFT> sift = cv::xfeatures2d::SIFT::create();// 检测关键点和计算描述子std::vector<cv::KeyPoint> keypoints;cv::Mat descriptors;sift->detectAndCompute(image, cv::noArray(), keypoints, descriptors);return 0;
}
卷积神经网络特征 (Convolutional Neural Network Features) 示例:
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>int main() {cv::Mat image = cv::imread("image.jpg");cv::dnn::Net net = cv::dnn::readNetFromCaffe("deploy.prototxt", "model.caffemodel");// 预处理图像(归一化、尺寸调整等)cv::Mat blob = cv::dnn::blobFromImage(image, 1.0, cv::Size(224, 224), cv::Scalar(104, 117, 123));// 设置输入图像net.setInput(blob);// 前向传播并获取特征向量cv::Mat features = net.forward();return 0;
}
相关文章:
计算机视觉之图像特征提取
图像特征提取是计算机视觉中的重要任务,它有助于识别、分类、检测和跟踪对象。以下是一些常用的图像特征提取算法及其简介: 颜色直方图(Color Histogram): 简介:颜色直方图表示图像中各种颜色的分布情况。通…...

【面试经典150题】移除元素·JavaScript版
题目来源 大致思路:遍历数组,如果遇到值为val的元素,使用数组最后一个元素替换它。详细过程: /*** param {number[]} nums* param {number} val* return {number}*/ var removeElement function(nums, val) {let i0,nnums.leng…...
Cesium 相机的三种放置方式
文章目录 Cesium 相机的三种放置方式第一种:setView 计算视角1. Cartesian3 方式2. Rectangle 方式 第二种:flyTo第三种:lookAt Cesium 相机的三种放置方式 Cesium 提供了三种方式对相机的位置进行摆放 第一种:setView 计算视角 …...

看了我这篇帖子,你还会觉得制作电子杂志很难吗?
如果你也像我一样笨手笨脚的不会设计排版制作杂志也没关系,用FLBOOK就能在线制作电子杂志,效果极好! 工具:FLBOOK 步骤如下: 1.打开FLBOOK在线制作电子杂志平台 2.点击开始创作,有四个创建作品的方式&…...

SRE 与开发的自动化协同 -- 生产环境出现 bug 自动生成异常追踪
简介 生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。 以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常…...

【简单认识Docker基本管理】
文章目录 一、Docker概述1、定义2.容器化流行的原因3.Docker和虚拟机的区别4.Docker核心概念 二、安装docker三、镜像管理1.搜索镜像2.下载(拉取)镜像3.查看已下载镜像4.查看镜像详细信息5.修改镜像标签6.删除镜像7.导出镜像文件和拉取本地镜像文件8.上传…...

设备管理系统是什么?的修设备管理系统有什么功能?
随着计算机技术的迅速发展和移动互联网的商业化和社会化应用,设备的种类和数量急剧增加。如何利用先进的网络技术和快速更新的计算机设备来有效地收集和处理设备信息,建立以信息化为核心的管理体系,减轻管理和业务人员的数据处理负担…...

Docker安装并配置Pushgateway
Linux下安装Docker请参考:Linux安装Docker 简介 Pushgateway是Prometheus的一个组件,prometheus server默认是通过Exporter主动获取数据(默认采取pull拉取数据),Pushgateway则是通过exporter主动方式推送数据到Pushg…...
汽车OTA活动高质量发展的“常”与“新”
伴随着车主的频繁崔更,车企除了卷硬件、拼价格,逐渐将精力转移到汽车全生命周期的常用常新。时至下半年,车企OTA圈愈发热闹,以新势力、新实力为代表新一代车企,OTA运营活动逐渐进入高质量发展期。 所谓高质量…...

C++信息学奥赛1121:计算矩阵边缘元素之和
题解:i0 or j0 or in-1 or jm-1 or in-1 or jm-1 代码: #include<iostream> // 包含输入输出流库 #include<cmath> // 包含数学函数库 using namespace std; // 使用标准命名空间int main() {int n,m;cin>>n>>m; // 输入…...

Android Selector 的使用
什么是 Selector? Selector 和 Shape 相似,是Drawable资源的一种,可以根据不同的状态,设置不同的图片效果,关键节点 < selector > ,例如:我们只需要将Button的 background 属性设置为该dr…...
k8s集群中service的域名解析、pod的域名解析
前言 在k8s集群中,service和pod都可以通过域名的形式进行相互通信,换句话说,在k8s集群内,通过service和pod的域名,可以直接访问内部应用,不必在通过service ip地址进行通信,一般的,…...

Shell 编程快速入门 之 数学计算和函数基础
目录 1. 求两数之和 整数之和 浮点数之和 2. 计算1-100的和 for...in C风格for循环 while...do until...do while和until的区别 关系运算符 break与continue的区别 3. shell函数基础知识 函数定义 函数名 函数体 参数 返回值 return返回值的含义 return与…...
学习php中如何获取pdf文件中的文本内容
学习php中如何获取pdf文件中的文本内容 要使用PHP获取PDF文件中的文本内容,可以使用PDF解析库。以下是一些流行的PDF解析库: pdftotext:它是一个命令行工具,可以将PDF文件转换为文本文件。可以使用PHP exec()函数运行该工具。 FP…...

分布式数据库架构:高可用、高性能的数据存储
在现代信息时代,数据是企业发展的核心。为了支持海量数据的存储、高并发访问以及保证数据的可靠性,分布式数据库架构应运而生。分布式数据库架构是一种将数据存储在多个物理节点上,并通过一系列复杂的协调和管理机制来提供高可用性和高性能的…...
Python工具箱系列(四十)
使用gzip对数据进行压缩 这是python提供的压缩模块,便于用户对数据、文件进行压缩。功能类似于 GNU 应用程序gzip和gunzip。以下代码压缩一段字节流。 import gzip# 压缩一段英文 originstr The World Health Organization officially declared on Saturday that …...

【Hibench 】完成 HDP-Spark 性能测试
🍁 博主 "开着拖拉机回家"带您 Go to New World.✨🍁 🦄 个人主页——🎐开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客 🎐✨🍁 🪁🍁 希望本文能够给您带来一定的…...

【C++奇遇记】内存模型
🎬 博客主页:博主链接 🎥 本文由 M malloc 原创,首发于 CSDN🙉 🎄 学习专栏推荐:LeetCode刷题集 数据库专栏 初阶数据结构 🏅 欢迎点赞 👍 收藏 ⭐留言 📝 如…...

Debootstrap 教程
文章目录 Debootstrap 教程安装 debootstrap使用 debootstrap运行 debootstrap进入新的系统结束语 Debootstrap 教程 debootstrap 是一个用于在 Debian-based 系统上创建一个基本的 Debian 系统的工具。它可以用于创建 chroot 环境、容器或者为新的系统安装做准备。 安装 deb…...

MySQL之InnoDB引擎
MySQL之InnoDB引擎 简介逻辑存储结构InnoDB架构内存架构缓冲池LRU List、Free List和Flush List更改缓冲区(在5.x版本之前叫做插入缓冲区)自适应hash日志缓冲区 磁盘架构System TablespaceFile Per Table TabspaceGeneral TablespceUndo TablespaceTemp …...
【Linux】C语言执行shell指令
在C语言中执行Shell指令 在C语言中,有几种方法可以执行Shell指令: 1. 使用system()函数 这是最简单的方法,包含在stdlib.h头文件中: #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...

RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
视觉语言模型(Vision-Language Models, VLMs),为真实环境中的机器人操作任务提供了极具潜力的解决方案。 尽管 VLMs 取得了显著进展,机器人仍难以胜任复杂的长时程任务(如家具装配),主要受限于人…...
MySQL JOIN 表过多的优化思路
当 MySQL 查询涉及大量表 JOIN 时,性能会显著下降。以下是优化思路和简易实现方法: 一、核心优化思路 减少 JOIN 数量 数据冗余:添加必要的冗余字段(如订单表直接存储用户名)合并表:将频繁关联的小表合并成…...
scikit-learn机器学习
# 同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可: # Also add the following code, # so that every time the environment (kernel) starts, # just run the following code: import sys sys.path.append(/home/aistudio/external-libraries)机…...
人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent
安全大模型训练计划:基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标:为安全大模型创建高质量、去偏、符合伦理的训练数据集,涵盖安全相关任务(如有害内容检测、隐私保护、道德推理等)。 1.1 数据收集 描…...

Ubuntu系统复制(U盘-电脑硬盘)
所需环境 电脑自带硬盘:1块 (1T) U盘1:Ubuntu系统引导盘(用于“U盘2”复制到“电脑自带硬盘”) U盘2:Ubuntu系统盘(1T,用于被复制) !!!建议“电脑…...
LLaMA-Factory 微调 Qwen2-VL 进行人脸情感识别(二)
在上一篇文章中,我们详细介绍了如何使用LLaMA-Factory框架对Qwen2-VL大模型进行微调,以实现人脸情感识别的功能。本篇文章将聚焦于微调完成后,如何调用这个模型进行人脸情感识别的具体代码实现,包括详细的步骤和注释。 模型调用步骤 环境准备:确保安装了必要的Python库。…...

归并排序:分治思想的高效排序
目录 基本原理 流程图解 实现方法 递归实现 非递归实现 演示过程 时间复杂度 基本原理 归并排序(Merge Sort)是一种基于分治思想的排序算法,由约翰冯诺伊曼在1945年提出。其核心思想包括: 分割(Divide):将待排序数组递归地分成两个子…...

职坐标物联网全栈开发全流程解析
物联网全栈开发涵盖从物理设备到上层应用的完整技术链路,其核心流程可归纳为四大模块:感知层数据采集、网络层协议交互、平台层资源管理及应用层功能实现。每个模块的技术选型与实现方式直接影响系统性能与扩展性,例如传感器选型需平衡精度与…...