[python-opencv] PNG 裁切物体
拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。
1. 读取PNG的4个通道
image = cv.imread(image_path, cv.IMREAD_UNCHANGED)
附参数说明:
| IMREAD_UNCHANGED = -1 | 返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道 |
| IMREAD_GRAYSCALE = 0 | 将图像转换为单通道灰度图像 |
| IMREAD_COLOR = 1 | 将图像转换成3通道BGR彩色图像 |
| IMREAD_ANYDEPTH = 2 | 在输入具有相应深度时返回16位/32位图像,否则将其转换为8位 |
| IMREAD_ANYCOLOR = 4 | 图像可能以任何颜色格式读取 |
| IMREAD_LOAD_GDAL = 8 | 使用gdal驱动程序加载图像 |
| IMREAD_REDUCED_GRAYSCALE_2 = 16 | 将图像转换为单通道灰度图像且图像大小减少1/2 |
| IMREAD_REDUCED_COLOR_2 = 17 | 将图像转换为3通道BGR彩色图像且图像大小减少1/2 |
| IMREAD_REDUCED_GRAYSCALE_4 = 32 | 将图像转换为单通道灰度图像且图像大小减少1/4 |
| IMREAD_REDUCED_COLOR_4 = 33 | 将图像转换为3通道BGR彩色图像且图像大小减少1/4 |
| IMREAD_REDUCED_GRAYSCALE_8 = 64 | 将图像转换为单通道灰度图像且图像大小减少1/8 |
| IMREAD_REDUCED_COLOR_8 = 65 | 将图像转换为3通道BGR彩色图像且图像大小减少1/8 |
| IMREAD_IGNORE_ORIENTATION = 128 | 不会根据EXIF的方向标志旋转图像 |
2. 遍历文件夹获取每个图像文件:
def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)
3. 找到PNG中物体的ROI:
def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax
4. 遍历文件夹将jpg转PNG
def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path) # 打开jpg文件img.save(png_path, 'PNG') # 保存为png文件
5. 按照指定ROI图像获取图像区域并保存
def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])
6. 按照问题所在ROI获取图像区域
def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])
Imwrite参数说明
| IMWRITE_JPEG_QUALITY | 对于JPEG,它可以是从0到100的质量(越高越好)。默认值是95。 |
| IMWRITE_JPEG_PROGRESSIVE | 启用JPEG功能,0或1,默认为False。 |
| IMWRITE_JPEG_OPTIMIZE | 启用JPEG功能,0或1,默认为False。 |
| IMWRITE_JPEG_RST_INTERVAL | JPEG重新启动间隔,0 - 65535,默认为0 - 不重新启动。 |
| IMWRITE_JPEG_LUMA_QUALITY | 单独的亮度质量等级,0 - 100,默认为0 - 不使用。 |
| IMWRITE_JPEG_CHROMA_QUALITY | 独立的色度质量等级,0 - 100,默认为0 - 不使用。 |
| IMWRITE_PNG_COMPRESSION | 对于PNG,它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。 |
| IMWRITE_PNG_STRATEGY | cv :: ImwritePNGFlags之一,默认为IMWRITE_PNG_STRATEGY_DEFAULT。 |
| IMWRITE_PNG_BILEVEL | 二进制级PNG,0或1,默认为0。 |
| IMWRITE_PXM_BINARY | 对于PPM,PGM或PBM,它可以是二进制格式标志,0或1.默认值为1。 |
| IMWRITE_WEBP_QUALITY | 对于WEBP,它可以是从1到100的质量(越高越好)。默认情况下(没有任何参数),质量超过100的情况下使用无损压缩。 |
| IMWRITE_PAM_TUPLETYPE | 对于PAM,将TUPLETYPE字段设置为为格式定义的相应字符串值。 |
| IMWRITE_TIFF_RESUNIT | 对于TIFF,用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。 |
| IMWRITE_TIFF_XDPI | 对于TIFF,用于指定X方向DPI。 |
| IMWRITE_TIFF_YDPI | 对于TIFF,用于指定Y方向DPI。 |
| IMWRITE_TIFF_COMPRESSION | 对于TIFF,用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意,对于深度为CV_32F的图像,仅使用libtiff的SGILOG压缩方案。对于其他支持的深度,可以通过此标志指定压缩方案; LZW压缩是默认值。 |
| IMWRITE_JPEG2000_COMPRESSION_X1000 | 对于JPEG2000,用于指定目标压缩率(乘以1000)。该值可以是0到1000.默认值是1000 |
相关文章:
[python-opencv] PNG 裁切物体
拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。 1. 读取PNG的4个通道 image cv.imread(image_path, cv.IMREAD_UNCHANGED) 附参数说明: IMREAD_UNCHANGED -1 返…...
机器学习——有监督学习和无监督学习
有监督学习 简单来说,就是人教会计算机学会做一件事。 给算法一个数据集,其中数据集中包含了正确答案,根据这个数据集,可以对额外的数据希望得到一个正确判断(详见下面的例子) 回归问题 例如现在有一个…...
MySQL单主模式部署组复制集群
前言 本篇文章介绍MySQL8.0.27版本的组复制详细搭建过程,教你如何快速搭建一个三节点的单主模式组复制集群。 实际上,MySQL组复制是MySQL的一个插件 group_replication.so,组中的每个成员都需要配置并安装该插件,配置和安装过程…...
【大厂AI课学习笔记】【1.5 AI技术领域】(10)对话系统
对话系统,Dialogue System,也称为会话代理。是一种模拟人类与人交谈的计算机系统,旨在可以与人类形成连贯通顺的对话,通信方式主要有语音/文本/图片,当然也可以手势/触觉等其他方式 一般我们将对话系统,分…...
【ARM 嵌入式 编译系列 2.7 -- GCC 编译优化参数详细介绍】
请阅读【嵌入式开发学习必备专栏 】 文章目录 GCC 编译优化概述常用优化等级-O1 打开的优化选项-O2 打开的优化选项-O3 打开的优化选项-Os 打开的优化选项优化技术使用优化选项的注意事项GCC 编译优化概述 GCC(GNU Compiler Collection)包含了用于C、C++、Objective-C、Fort…...
《剑指 Offer》专项突破版 - 面试题 38、39 和 40 : 通过三道面试题详解单调栈(C++ 实现)
目录 面试题 38 : 每日温度 面试题 39 : 直方图最大矩形面积 方法一、暴力求解 方法二、递归求解 方法三、单调栈法 面试题 40 : 矩阵中的最大矩形 面试题 38 : 每日温度 题目: 输入一个数组,它的每个数字是某天的温度。请计算每天需要等几天才会…...
动态规划C语言
#include <stdio.h> #include <stdlib.h> //0-1背包问题是一种经典的组合优化问题, //问题描述为:有一个给定容量的背包和一组具有不同价值和重量的物品,如何选择物品放入背包中,以使得背包中物品的总价值最大化&…...
基于微信小程序的校园二手交易平台
博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…...
K8S系列文章之 [使用 Alpine 搭建 k3s]
官方文档:K3s - 轻量级 Kubernetes | K3s 官方描述,可运行在 systemd 或者 openrc 环境上,那就往精简方向走,使用 alpine 做系统。与 RHEL、Debian 的区别,主要在防火墙侧;其他基础配置需求类似࿰…...
计算机视觉 | OpenCV 实现手势虚拟控制亮度和音量
Hi,大家好,我是半亩花海。在当今科技飞速发展的时代,我们身边充斥着各种智能设备,然而,如何更便捷地与这些设备进行交互却是一个不断被探索的课题。本文将主要介绍一个基于 OpenCV 的手势识别项目,通过手势…...
python28-Python的运算符之三目运算符
Python可通过if语句来实现三目运算符的功能,因此可以近似地把这种if语句当成三目运算符。作为三目运算符的f语句的语法格式如下 True_statements if expression else False_statements 三目运算符的规则是:先对逻辑表达式expression求值,如果逻辑表达式…...
高德 API 10009
问题 笔者使用高德地图所提供的API接口,访问接口报错 {"info":"USERKEY_PLAT_NOMATCH","infocode":"10009","status":"0","sec_code_debug":"d41d8cd98f00b204e9800998ecf8427e"…...
Go 语言中如何大小端字节序?int 转 byte 是如何进行的?
嗨,大家好!我是波罗学。 本文是系列文章 Go 技巧第十五篇,系列文章查看:Go 语言技巧。 我们先看这样一个问题:“Go 语言中,将 byte 转换为 int 时是否涉及字节序(endianness)&#x…...
论文阅读——MP-Former
MP-Former: Mask-Piloted Transformer for Image Segmentation https://arxiv.org/abs/2303.07336 mask2former问题是:相邻层得到的掩码不连续,差别很大 denoising training非常有效地稳定训练时期之间的二分匹配。去噪训练的关键思想是将带噪声的GT坐标…...
JPEG图像的压缩标准(1)
分3个博客详细介绍JPEG图像的压缩标准,包含压缩和解压缩流程,熵编码过程和文件存储格式。 一、JPEG压缩标准概述 JPEG压缩标准由国际标准化组织 (International Organization for Standardization, ISO) 制订,用于静态图像压缩。JPEG标准包…...
数解 transformer 之 self attention transformer 公式整理
句子长度为n;比如2048,或1024,即,一句话最多可以是1024个单词。 1, 位置编码 可知,E是由n个列向量组成的矩阵,每个列向量表示该列号的位置编码向量。 2, 输入向量 加入本句话第一个单词的词嵌入向量是, 第…...
ubuntu22.04@laptop OpenCV Get Started
ubuntu22.04laptop OpenCV Get Started 1. 源由2. 步骤3. 预期&展望4. 参考资料 1. 源由 OpenCV在学校的时候接触过,不过当时专注在物理、研究方面,没有好好的学习下。 这次借后续视频分析刚性需求,对OpenCV做个入门的学习和研读&#…...
【Java】苍穹外卖 Day01
苍穹外卖-day01 课程内容 软件开发整体介绍苍穹外卖项目介绍开发环境搭建导入接口文档Swagger 项目整体效果展示: 管理端-外卖商家使用用户端-点餐用户使用当我们完成该项目的学习,可以培养以下能力: 1. 软件开发整体介绍 作为一名软件开…...
Ivanti Pulse Connect Secure VPN SSRF(CVE-2023-46805)漏洞
免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…...
GPT-4:比ChatGPT3.5好得多,但它有多好你知道么?
GPT-4简介 GPT-4是一款由OpenAI开发的人工智能语言模型,它是ChatGPT3.5的升级版。GPT-4拥有更强大的学习能力、更高的生成质量和更广泛的知识覆盖范围,被誉为人工智能技术的重要突破。 GPT-4与ChatGPT3.5的对比 1. 学习能力 GPT-4采用了更多的神经网…...
网络六边形受到攻击
大家读完觉得有帮助记得关注和点赞!!! 抽象 现代智能交通系统 (ITS) 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 (…...
基于大模型的 UI 自动化系统
基于大模型的 UI 自动化系统 下面是一个完整的 Python 系统,利用大模型实现智能 UI 自动化,结合计算机视觉和自然语言处理技术,实现"看屏操作"的能力。 系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...
高等数学(下)题型笔记(八)空间解析几何与向量代数
目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...
今日学习:Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存
文章目录 优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义 使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因 常见解决方法更好的解决方法设计精妙之处 登录续期登录续期常见实现方式特…...
在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的?
uni-app 中 Web-view 与 Vue 页面的通讯机制详解 一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件,用于在原生应用中加载 HTML 页面: 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...
基于Java+MySQL实现(GUI)客户管理系统
客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息,对客户进行统一管理,可以把所有客户信息录入系统,进行维护和统计功能。可通过文件的方式保存相关录入数据,对…...
从面试角度回答Android中ContentProvider启动原理
Android中ContentProvider原理的面试角度解析,分为已启动和未启动两种场景: 一、ContentProvider已启动的情况 1. 核心流程 触发条件:当其他组件(如Activity、Service)通过ContentR…...
安卓基础(Java 和 Gradle 版本)
1. 设置项目的 JDK 版本 方法1:通过 Project Structure File → Project Structure... (或按 CtrlAltShiftS) 左侧选择 SDK Location 在 Gradle Settings 部分,设置 Gradle JDK 方法2:通过 Settings File → Settings... (或 CtrlAltS)…...
Linux中《基础IO》详细介绍
目录 理解"文件"狭义理解广义理解文件操作的归类认知系统角度文件类别 回顾C文件接口打开文件写文件读文件稍作修改,实现简单cat命令 输出信息到显示器,你有哪些方法stdin & stdout & stderr打开文件的方式 系统⽂件I/O⼀种传递标志位…...
ubuntu22.04有线网络无法连接,图标也没了
今天突然无法有线网络无法连接任何设备,并且图标都没了 错误案例 往上一顿搜索,试了很多博客都不行,比如 Ubuntu22.04右上角网络图标消失 最后解决的办法 下载网卡驱动,重新安装 操作步骤 查看自己网卡的型号 lspci | gre…...
