人脸图像数据增强
为什么要做数据增强
在计算机视觉相关任务中,数据增强(Data Augmentation)是一种常用的技术,用于扩展训练数据集的多样性。它包括对原始图像进行一系列随机或有规律的变换,以生成新的训练样本。数据增强的主要目的是增加模型的泛化能力、提高模型的鲁棒性,并减轻过拟合的风险。以下是进行数据增强的几个重要原因:
-
增加数据样本数量:数据增强可以通过生成变体来增加训练样本的数量。这对于具有有限标记样本的任务非常重要,因为更多的数据样本有助于提高模型的性能。
-
泛化能力:数据增强可以引入多样性,使模型能够更好地泛化到新的、未见过的数据。这有助于模型在真实世界的各种情况下表现良好,而不仅仅是在训练时的数据分布中表现良好。
-
鲁棒性:通过对数据进行多样性的变换,模型可以更好地处理因噪声、光照变化、旋转、缩放等因素引起的图像变化。这提高了模型在复杂环境中的稳健性。
-
降低过拟合风险:数据增强可以减轻模型过拟合的风险,因为它迫使模型不仅仅学会记住训练数据,还要学会对数据的变化做出反应。这有助于提高模型对新数据的适应能力。
-
类别平衡:在多类别分类任务中,某些类别的样本数量可能较少。数据增强可以帮助平衡各个类别的样本数量,以防止模型偏向于出现频率较高的类别。
-
节省标注成本:在某些情况下,收集和标记大量的训练数据可能非常昂贵和耗时。通过数据增强,您可以使用较少的标记样本来训练模型,同时保持性能。
常见的数据增强技术包括图像翻转、旋转、缩放、裁剪、颜色变换、加噪声等。选择哪些数据增强技术以及如何应用它们通常取决于具体任务和数据集的特点。数据增强在许多计算机视觉任务中都被广泛使用,包括图像分类、目标检测、分割、人脸识别等。通过增强数据的多样性,可以提高模型的性能并使其更适应复杂的现实世界场景。
人脸图像数据增强
对于人脸图像数据增强,有多种方法可以提高模型的鲁棒性和性能。以下是一些常见的人脸图像数据增强方法:
- 旋转和翻转: 随机旋转或翻转图像,以改变人脸的角度和方向,使模型更具鲁棒性。
- 缩放和裁剪: 随机调整图像的大小并进行裁剪,以模拟不同尺度和视角下的人脸。
- 亮度和对比度调整: 修改图像的亮度、对比度和色彩平衡,以增加模型的鲁棒性。
- 噪声添加: 向图像中添加随机噪声,以模拟真实世界中的图像变化。
- 颜色扭曲: 扭曲图像的颜色通道,使图像对于不同的照明条件更具鲁棒性。
- 遮挡和变形: 在图像中添加遮挡物或变形,以增加模型对于不完整或变形人脸的处理能力。
- 人脸关键点扰动: 对图像中的人脸关键点进行随机扰动,以改变面部特征的位置。
- 风格迁移: 将不同图像的风格应用到人脸图像上,以增加多样性。
- 镜像对称: 镜像对称图像,以生成左右对称的人脸数据。
- 增加噪声数据: 引入合成噪声数据,以增加模型对于嘈杂环境下的鲁棒性。
这些增强方法可以单独使用,也可以组合使用。
实现
以下是个人实现的一些人脸增强方式,不会对原始人脸数据造成太大的干扰,进而不会引入脏数据:
- 旋转:范围在(-20°, 20°) 表示向左向右旋转
def rotate_image(image):rows, cols, _ = image.shapeangle = random.randint(-20, 20)M = cv2.getRotationMatrix2D((cols/2, rows/2), angle, 1)rotated_image = cv2.warpAffine(image, M, (cols, rows))return rotated_image
- 翻转:只水平翻转
def flip_image(image):return cv2.flip(image, 1)
- 缩放:范围是原先的(0.8, 1.2)之间
def scale_image(image, scale_factor):scale_factor = random.uniform(0.8, 1.2)rows, cols, _ = image.shapenew_size = (int(cols * scale_factor), int(rows * scale_factor))scaled_image = cv2.resize(image, new_size)return scaled_image
- 改变亮度对比度
def adjust_brightness_contrast(image):alpha = random.uniform(0.5, 1.5)beta = random.randint(10, 50)return cv2.convertScaleAbs(image, alpha=alpha, beta=beta)
- 改变颜色
def color_distortion(image, color_matrix):# color_matrix = np.array([[0.393, 0.769, 0.189], [0.349, 0.686, 0.168], [0.272, 0.534, 0.131]])return cv2.transform(image, color_matrix)
- 加椒盐噪声
def salt_and_pepper_noise(image, salt_prob=0.01, pepper_prob=0.01):noisy_image = image.copy()total_pixels = image.sizenum_salt = int(total_pixels * salt_prob)salt_coords = [np.random.randint(0, i-1, num_salt) for i in image.shape]noisy_image[salt_coords[0], salt_coords[1]] = 255num_pepper = int(total_pixels * pepper_prob)pepper_coords = [np.random.randint(0, i-1, num_pepper) for i in image.shape]noisy_image[pepper_coords[0], pepper_coords[1]] = 0return noisy_image
- 直方图均衡化
def equalizeHist_image(image):image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)return cv2.equalizeHist(image)
- 自适应直方图均衡化
def clahe_image(image):b, g, r = cv2.split(image)clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(5, 5))clahe_b = clahe.apply(b)clahe_g = clahe.apply(g)clahe_r = clahe.apply(r)return cv2.merge((clahe_b, clahe_g, clahe_r))
- 油画与非真实感渲染
def detailEnhance_image(image):return cv2.detailEnhance(image, None, 20, 0.8)
- 局部区域亮度调整
def illumination_change(image):img_zero = np.zeros(image.shape, dtype=np.uint8)return cv2.illuminationChange(image, mask=img_zero, alpha=0.2, beta=0.4)
- 人脸中心点加强或者变暗
def enhance_reduce(image, strength=100):# strength > 0 enhance, strength < 0 reducex, y, _ = image.shaperadius = np.random.randint(10, int(min(x, y)), 1)pos_x = np.random.randint(0, (min(x, y)-radius), 1)pos_y = np.random.randint(0, (min(x, y)-radius), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])radius = int(radius[0])for j in range(pos_y-radius, pos_y+radius):for i in range(pos_x-radius, pos_x+radius):distance = math.pow((pos_x-i), 2) + math.pow((pos_y-j), 2)distance = np.sqrt(distance)if distance < radius:result = 1 - distance/radiusresult = result*strengthif strength > 0:image[i, j, 0] = min((image[i, j, 0]+result), 255)image[i, j, 1] = min((image[i, j, 1]+result), 255)image[i, j, 2] = min((image[i, j, 2]+result), 255)else:image[i, j, 0] = max((image[i, j, 0]+result), 0)image[i, j, 1] = max((image[i, j, 1]+result), 0)image[i, j, 2] = max((image[i, j, 2]+result), 0)image = image.astype(np.uint8)return image
- 遮盖
def mask(image, low=10, high=50):x, y, _ = image.shapemask_size = np.random.randint(low, high, 1)pos_x = np.random.randint(low, (min(x, y)-high), 1)pos_y = np.random.randint(low, (min(x, y)-high), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])mask_size = int(mask_size[0])image[pos_x:pos_x+mask_size, pos_y:pos_y+mask_size] = 0return image
将上述合并为一个类:
import os
import cv2
import sys
import json
import math
import random
import numpy as npclass ImageAugment:def rotate_image(self, image):rows, cols, _ = image.shapeangle = random.randint(-20, 20)M = cv2.getRotationMatrix2D((cols/2, rows/2), angle, 1)rotated_image = cv2.warpAffine(image, M, (cols, rows))return rotated_imagedef flip_image(self, image):return cv2.flip(image, 1)def scale_image(self, image, scale_factor):scale_factor = random.uniform(0.8, 1.2)rows, cols, _ = image.shapenew_size = (int(cols * scale_factor), int(rows * scale_factor))scaled_image = cv2.resize(image, new_size)scaled_image = cv2.resize(scaled_image, (112, 112))return scaled_imagedef adjust_brightness_contrast(self, image):alpha = random.uniform(0.5, 1.5)beta = random.randint(10, 50)return cv2.convertScaleAbs(image, alpha=alpha, beta=beta)def color_distortion(self, image, color_matrix):return cv2.transform(image, color_matrix)def salt_and_pepper_noise(self, image, salt_prob=0.01, pepper_prob=0.01):noisy_image = image.copy()total_pixels = image.sizenum_salt = int(total_pixels * salt_prob)salt_coords = [np.random.randint(0, i-1, num_salt) for i in image.shape]noisy_image[salt_coords[0], salt_coords[1]] = 255num_pepper = int(total_pixels * pepper_prob)pepper_coords = [np.random.randint(0, i-1, num_pepper) for i in image.shape]noisy_image[pepper_coords[0], pepper_coords[1]] = 0return noisy_imagedef equalizeHist_image(self, image):image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)return cv2.equalizeHist(image)def clahe_image(self, image):b, g, r = cv2.split(image)clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(5, 5))clahe_b = clahe.apply(b)clahe_g = clahe.apply(g)clahe_r = clahe.apply(r)return cv2.merge((clahe_b, clahe_g, clahe_r))def detailEnhance_image(self, image):return cv2.detailEnhance(image, None, 20, 0.8)def illumination_change(self, image):img_zero = np.zeros(image.shape, dtype=np.uint8)return cv2.illuminationChange(image, mask=img_zero, alpha=0.2, beta=0.4)def enhance_reduce(self, image, strength=100):# strength > 0 enhance, strength < 0 reducex, y, _ = image.shaperadius = np.random.randint(10, int(min(x, y)), 1)pos_x = np.random.randint(0, (min(x, y)-radius), 1)pos_y = np.random.randint(0, (min(x, y)-radius), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])radius = int(radius[0])for j in range(pos_y-radius, pos_y+radius):for i in range(pos_x-radius, pos_x+radius):distance = math.pow((pos_x-i), 2) + math.pow((pos_y-j), 2)distance = np.sqrt(distance)if distance < radius:result = 1 - distance/radiusresult = result*strengthif strength > 0:image[i, j, 0] = min((image[i, j, 0]+result), 255)image[i, j, 1] = min((image[i, j, 1]+result), 255)image[i, j, 2] = min((image[i, j, 2]+result), 255)else:image[i, j, 0] = max((image[i, j, 0]+result), 0)image[i, j, 1] = max((image[i, j, 1]+result), 0)image[i, j, 2] = max((image[i, j, 2]+result), 0)image = image.astype(np.uint8)return imagedef mask(self, image, low=10, high=50):x, y, _ = image.shapemask_size = np.random.randint(low, high, 1)pos_x = np.random.randint(low, (min(x, y)-high), 1)pos_y = np.random.randint(low, (min(x, y)-high), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])mask_size = int(mask_size[0])image[pos_x:pos_x+mask_size, pos_y:pos_y+mask_size] = 0return imageif __name__ == '__main__':ia = ImageAugment()image_path = sys.argv[1]image = cv2.imread(image_path)rotated_image = ia.rotate_image(image)flipped_image = ia.flip_image(image)scaled_image = ia.scale_image(image, scale_factor=1.2)adjusted_image = ia.adjust_brightness_contrast(image)color_matrix = np.array([[0.393, 0.769, 0.189], [0.349, 0.686, 0.168], [0.272, 0.534, 0.131]])color_distorted_image = ia.color_distortion(image, color_matrix)salt_image = ia.salt_and_pepper_noise(image)equalize_image = ia.equalizeHist_image(image)clahe_image = ia.clahe_image(image)detailenhance_image = ia.detailEnhance_image(image)illumination_image = ia.illumination_change(image)enhance_image = ia.enhance_reduce(image, 100)reduce_image = ia.enhance_reduce(image, -100)mask_image = ia.mask(image)# savecv2.imwrite('rotated.jpg', rotated_image)cv2.imwrite('flipped.jpg', flipped_image)cv2.imwrite('scaled.jpg', scaled_image)cv2.imwrite('adjusted.jpg', adjusted_image)cv2.imwrite('colorDistorted.jpg', color_distorted_image)cv2.imwrite('salt.jpg', salt_image)cv2.imwrite('equalize.jpg', equalize_image)cv2.imwrite('clahe.jpg', clahe_image)cv2.imwrite('detailenhance.jpg', detailenhance_image)cv2.imwrite('illumination.jpg', illumination_image)cv2.imwrite('enhance.jpg', enhance_image)cv2.imwrite('reduce.jpg', reduce_image)cv2.imwrite('mask.jpg', mask_image)
结果如下:
-
origin image:
-
rotate:
- flip:
- scale:
- adjust:
- colorDistorted:
- salt:
- equalize:
- clahe:
- detailenhance:
- illumination:
- enhance and reduce:
- mask:
参考
- https://blog.csdn.net/qq_39450134/article/details/121886296
- https://blog.csdn.net/u011808673/article/details/90752958
- https://www.youbiguo.com/py/273.html
相关文章:

人脸图像数据增强
为什么要做数据增强 在计算机视觉相关任务中,数据增强(Data Augmentation)是一种常用的技术,用于扩展训练数据集的多样性。它包括对原始图像进行一系列随机或有规律的变换,以生成新的训练样本。数据增强的主要目的是增…...

Android 查看按键信息的常用命令详解
Android 查看按键信息的常用命令详解 文章目录 Android 查看按键信息的常用命令详解一、主要命令:二、命令详解1、getevent2、getevent -l3、dumsys input4、cat XXX.kl4、cat /dev/input/eventX5、getevent 其他命令6、input keyevent XX 三、简单示例修改四、总结…...

【Java 基础篇】Properties 结合集合类的使用详解
Java 中的 Properties 类是一个常见的用于管理配置信息的工具,它可以被看作是一种键值对的集合。虽然 Properties 通常用于处理配置文件,但它实际上也可以作为通用的 Map 集合来使用。在本文中,我们将详细探讨如何使用 Properties 作为 Map 集…...

数字孪生体标准编程
数字孪生体标准 括ISO TC184/SC4正在制定数字孪生制造标准ISO 23247、ISO/IEC JTC1/AG11正在推动数字孪生体标准、IEEE P2806正在做有关“数字表达”的标准。赢家通吃的标准战 卡尔夏皮罗和哈尔范里安撰写了《信息规则:网络经济战略指南》(Information R…...

力扣 -- 394. 字符串解码
解题方法: 参考代码: class Solution{ public:string decodeString(string s){stack<string> sst;stack<int> dst;//防止字符串栈为空的时候再追加字符串到栈顶元素sst.push("");int n s.size();int i 0;while(i<n)//最好不…...

面试官:什么是虚拟DOM?如何实现一个虚拟DOM?说说你的思路
🎬 岸边的风:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 一、什么是虚拟DOM 二、为什么需要虚拟DOM 三、如何实现虚拟DOM 小结 一、什么是虚拟DOM 虚拟 DOM (…...

Ubuntu安装中文拼音输入法
ubuntu安装中文拼音输入法 ubuntu版本为23.04 1、安装中文语言包 首先安装中文输入法必须要让系统支持中文语言,可以在 Language Support 中安装中文语言包。 添加或删除语音选项,添加中文简体,然后会有Applying changes的对话框&#x…...

高端知识竞赛中用到的软件和硬件有哪些
现在单位搞知识竞赛,已不满足于用PPT放题,找几个简单的抢答器、计分牌弄一下了,而是对现场效果和科技感要求更高了。大屏要分主屏侧屏,显示内容要求丰富炫酷;选手和评委也要用到平板等设备;计分要大气些&am…...

Vue 3.3 发布
本文为翻译 原文地址:宣布推出 Vue 3.3 |The Vue Point (vuejs.org) 今天我们很高兴地宣布 Vue 3.3 “Rurouni Kenshin” 的发布! 此版本侧重于开发人员体验改进 - 特别是 TypeScript 的 SFC <script setup> 使用。结合 Vue Language Tools&…...

算法|图论 3
LeetCode 130- 被围绕的区域 题目链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 题目描述:给你一个 m x n 的矩阵 board ,由若干字符 X 和 O ,找到所有被 X 围绕的区域,并将这些区域…...

【数据结构】二叉树的层序遍历(四)
目录 一,层序遍历概念 二,层序遍历的实现 1,层序遍历的实现思路 2,创建队列 Queue.h Queue.c 3,创建二叉树 BTree.h BTree.c 4,层序遍历的实现 一,层序遍历概念 层序遍历:除了先序…...

macOS文件差异比较最佳工具:Beyond Compare 4
Beyond Compare for mac是一款Scooter Software研发的文件同步对比工具。你可以选择针对多字节的文本、文件夹、源代码,甚至是支持比对adobe文件、pdf文件或是整个驱动器,检查其文件大小、名称、日期等信息。你也可以选择使用Beyond Compare合并两个不同…...

Windows+Pycharm 如何创建虚拟环境
当我们开发一个别人的项目的时候,因为项目里有很多特有的包,比如 Pyqt5.我们不想破坏电脑上原来的包版本,这个时候,新建一个虚拟环境,专门针对这个项目就很有必要了. 简略步骤: 1.新建虚拟环境 1.打开 pycharm 终端(Terminal)安装虚拟环境工具: pip install virtualenv2.创…...

vant 按需导入 vue2
vant 按需导入 vue2 1、通过npm安装 # Vue 3 项目,安装最新版 Vant: npm i vant -S# Vue 2 项目,安装 Vant 2: npm i vantlatest-v2 -S2、自动按需引入组件 babel-plugin-import 是一款 babel 插件,它会在编译过程中…...

Java手写分治算法和分治算法应用拓展案例
Java手写分治算法和分治算法应用拓展案例 1. 算法思维导图 以下是用Mermanid代码表示的分治算法的实现原理: #mermaid-svg-nvJwIm97kPHEXQOR {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-nvJwIm97kP…...

学习 CodeWhisperer 的一些总结
目前一些常见的的 AI 工具 GitHub Copilot:GitHub 与 OpenAI 合作开发的一个人工智能助手。 Codeium:是一个免费的人工智能驱动的代码生成工具 Tabnine:一个自动代码生成工具,免费版本非常有限,只提供简短的代码完成…...

JavaScript 中的 `this` 指向问题与其在加密中的应用
JS中的 this 关键字是一个非常重要的概念,它在不同情况下会指向不同的对象或值。在本文中,我们将深入探讨 JavaScript 中 this 的各种情况,并思考如何将其应用于 JS加密中的一些有趣用途。 1. 全局上下文中的 this 在全局上下文中ÿ…...

深入理解算法的时间复杂度
文章目录 时间复杂度的定义时间复杂度的分类时间复杂度分析常见数据结构和算法的时间复杂度常见数据结构常见算法 常见排序算法说明冒泡排序(Bubble Sort)快速排序(Quick Sort)归并排序(Merge Sort)堆排序(Heap Sort) 时间复杂度的定义 时间复杂度就是一种用来描述算法在输入规…...

2023年度教育部人文社会科学研究一般项目评审结果,已公布!
【SciencePub学术】 9月15日,教育部社科司公示了2023年度教育部人文社会科学研究一般项目评审结果,共3482项。 其中,规划基金、青年基金、自筹经费项目共3029项通过专家评审;西部和边疆地区项目200项,新疆项目20项&a…...

十一、MySql的事务(上)
文章目录 一、引入(一)CURD不加控制,会有什么问题?(二)CURD满足什么属性,能解决上述问题? 二、什么是事务?三、事务的特性(一)原子性:…...

时间序列分析1--生成和导出时间序列数据
时间序列数据的生成 直接录入 1.行录入 ts.(price,startc(2015,1),frequency 12) # price为时间序列变量,start为起始读入时间 frequncy指定每年读入的数据的频率,frequncy4为季度数据、frequncy52为星期数据 2.列录入 scan() 1:101 ....6:7 7:…...

HarmonyOS应用开发—资源分类与访问
应用开发过程中,经常需要用到颜色、字体、间距、图片等资源,在不同的设备或配置中,这些资源的值可能不同。 应用资源:借助资源文件能力,开发者在应用中自定义资源,自行管理这些资源在不同的设备或配置中的表…...

C++中的转换构造函数
在 C/C++ 中,不同的数据类型之间可以相互转换。无需用户指明如何转换的称为自动类型转换(隐式类型转换),需要用户显式地指明如何转换的称为强制类型转换。 自动类型转换示例: int a = 6;a = 7.5 + a; 编译器对 7.5 是作为 double 类型处理的,在求解表达式时,先将 a 转换…...

JSP ssm 特殊人群防走失系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计
一、源码特点 JSP ssm 特殊人群防走失系统是一套完善的web设计系统(系统采用SSM框架进行设计开发,springspringMVCmybatis),对理解JSP java编程开发语言有帮助,系统具有完整的源 代码和数据库,系统主要…...

怎么实现一个登录时需要输入验证码的功能
今天给项目换了一个登录页面,而这个登录页面设计了验证码,于是想着把这个验证码功能实现一下吧。 这篇文章就如何实现登录时的验证码的验证功能结合代码进行详细地介绍,以及介绍功能实现的思路。 目录 页面效果 实现思路 生成验证码的控制…...

在android工程中新建Android模块报错
复制了复制正常的build.gradle文件,然后把theme里面的东西改成了下面这个样就好了 <resources xmlns:tools"http://schemas.android.com/tools"><!-- Base application theme. --><style name"Theme.JiQuan" parent"Theme…...

电脑桌面的复选框如何取消
电脑桌面图标的复选框如何取消 1. 概述2. 去掉图标的复选框方法结束语 1. 概述 当你拿到新的电脑开机后,发现桌面上软件应用的图标左上角有个小框,每次点击图标都会显示,并且点击图标时,小框还会打上√; 这个小框的…...

【Unity每日一记】资源加载相关和检测相关
👨💻个人主页:元宇宙-秩沅 👨💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨💻 本文由 秩沅 原创 👨💻 收录于专栏:uni…...

【数据结构】长篇详解堆,堆的向上/向下调整算法,堆排序及TopK问题
文章目录 堆的概念性质图解 向上调整算法算法分析代码整体实现 向下调整算法算法分析整体代码实现 堆的接口实现初始化堆销毁堆插入元素删除元素打印元素判断是否为空取首元素实现堆 堆排序创建堆调整堆整合步骤 TopK问题 堆的概念 堆就是将一组数据所有元素按完全二叉树的顺序…...

DAQ高频量化平台:引领Ai高频量化交易模式变革
近年来,数字货币投资市场掀起了一股热潮,以(BTC)为代表的区块链技术带来了巨大的商业变革。数字资产的特点,如无国界、无阶级、无门槛、高流动性和高透明度,吸引了越来越多的人们的关注和认可,创…...