当前位置：首页 > news >正文

opencv进阶 ——（九）图像处理之人脸修复祛马赛克算法CodeFormer

news 文章来源：https://blog.csdn.net/fengqiao1999/article/details/139027453 2025/4/3 16:17:27

算法简介

CodeFormer是一种基于AI技术深度学习的人脸复原模型，由南洋理工大学和商汤科技联合研究中心联合开发，它能够接收模糊或马赛克图像作为输入，并生成更清晰的原始图像。算法源码地址：https://github.com/sczhou/CodeFormer

Face Restoration

Face Color Enhancement and Restoration

Face Inpainting

模型部署

如果想用C++进行模型推理部署，首先要把模型转换成onnx，转成onnx就可以使用onnxruntime c++库进行部署，或者使用OpenCV的DNN也可以。

1、可在以下地址下载模型：https://github.com/sczhou/CodeFormer/releases/tag/v0.1.0

2、下载CodeFormer源码，在工程目录下添加onnx转换python代码

import torch
from basicsr.utils.registry import ARCH_REGISTRYif __name__ == '__main__':device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')net = ARCH_REGISTRY.get('CodeFormer')(dim_embd=512, codebook_size=1024, n_head=8, n_layers=9, connect_list=['32', '64', '128', '256']).to(device)# ckpt_path = 'weights/CodeFormer/codeformer.pth'ckpt_path = './codeformer.pth'checkpoint = torch.load(ckpt_path)['params_ema']net.load_state_dict(checkpoint)net.eval()input_tensor = torch.zeros((1, 3, 512, 512)).to(device)torch.onnx.export(net,  # 模型实例input_tensor,  # 输入张量"./codeformer.onnx",  # 输出的ONNX模型路径export_params=True,  # 是否包含模型参数opset_version=11,  # ONNX操作集版本do_constant_folding=True,  # 是否进行常量折叠优化input_names=['input'],  # 输入名称output_names=['output'],  # 输出名称dynamic_axes={'input': {0: 'batch_size'}, 'output': {0: 'batch_size'}}  # 声明动态轴)

3、采用onnxruntime加载模型，示例代码如下

#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <fstream>
#include <numeric>
#include <opencv2/imgproc.hpp>
#include <opencv2/highgui.hpp>
//#include <cuda_provider_factory.h>  ///nvidia-cuda加速
#include <onnxruntime_cxx_api.h>using namespace cv;
using namespace std;
using namespace Ort;class CodeFormer
{
public:CodeFormer(string modelpath);Mat detect(Mat cv_image);
private:void preprocess(Mat srcimg);vector<float> input_image_;vector<double> input2_tensor;int inpWidth;int inpHeight;int outWidth;int outHeight;float min_max[2] = { -1,1 };//存储初始化获得的可执行网络Env env = Env(ORT_LOGGING_LEVEL_ERROR, "CodeFormer");Ort::Session *ort_session = nullptr;SessionOptions sessionOptions = SessionOptions();vector<char*> input_names;vector<char*> output_names;vector<vector<int64_t>> input_node_dims; // >=1 outputsvector<vector<int64_t>> output_node_dims; // >=1 outputs
};CodeFormer::CodeFormer(string model_path)
{//OrtStatus* status = OrtSessionOptionsAppendExecutionProvider_CUDA(sessionOptions, 0);  ///nvidia-cuda加速sessionOptions.SetGraphOptimizationLevel(ORT_ENABLE_BASIC);std::wstring widestr = std::wstring(model_path.begin(), model_path.end());   ///如果在windows系统就这么写ort_session = new Session(env, widestr.c_str(), sessionOptions);   ///如果在windows系统就这么写///ort_session = new Session(env, model_path.c_str(), sessionOptions);  ///如果在linux系统，就这么写size_t numInputNodes = ort_session->GetInputCount();size_t numOutputNodes = ort_session->GetOutputCount();AllocatorWithDefaultOptions allocator;for (int i = 0; i < numInputNodes; i++){input_names.push_back(ort_session->GetInputName(i, allocator));Ort::TypeInfo input_type_info = ort_session->GetInputTypeInfo(i);auto input_tensor_info = input_type_info.GetTensorTypeAndShapeInfo();auto input_dims = input_tensor_info.GetShape();input_node_dims.push_back(input_dims);}for (int i = 0; i < numOutputNodes; i++){output_names.push_back(ort_session->GetOutputName(i, allocator));Ort::TypeInfo output_type_info = ort_session->GetOutputTypeInfo(i);auto output_tensor_info = output_type_info.GetTensorTypeAndShapeInfo();auto output_dims = output_tensor_info.GetShape();output_node_dims.push_back(output_dims);}this->inpHeight = input_node_dims[0][2];this->inpWidth = input_node_dims[0][3];this->outHeight = output_node_dims[0][2];this->outWidth = output_node_dims[0][3];input2_tensor.push_back(0.5);
}void CodeFormer::preprocess(Mat srcimg)
{Mat dstimg;cvtColor(srcimg, dstimg, COLOR_BGR2RGB);resize(dstimg, dstimg, Size(this->inpWidth, this->inpHeight), INTER_LINEAR);this->input_image_.resize(this->inpWidth * this->inpHeight * dstimg.channels());int k = 0;for (int c = 0; c < 3; c++){for (int i = 0; i < this->inpHeight; i++){for (int j = 0; j < this->inpWidth; j++){float pix = dstimg.ptr<uchar>(i)[j * 3 + c];this->input_image_[k] = (pix / 255.0 - 0.5) / 0.5;k++;}}}
}Mat CodeFormer::detect(Mat srcimg)
{int im_h = srcimg.rows;int im_w = srcimg.cols;this->preprocess(srcimg);array<int64_t, 4> input_shape_{ 1, 3, this->inpHeight, this->inpWidth };vector<int64_t> input2_shape_ = { 1 };auto allocator_info = MemoryInfo::CreateCpu(OrtDeviceAllocator, OrtMemTypeCPU);vector<Value> ort_inputs;ort_inputs.push_back(Value::CreateTensor<float>(allocator_info, input_image_.data(), input_image_.size(), input_shape_.data(), input_shape_.size()));ort_inputs.push_back(Value::CreateTensor<double>(allocator_info, input2_tensor.data(), input2_tensor.size(), input2_shape_.data(), input2_shape_.size()));vector<Value> ort_outputs = ort_session->Run(RunOptions{ nullptr }, input_names.data(), ort_inputs.data(), ort_inputs.size(), output_names.data(), output_names.size());post_processfloat* pred = ort_outputs[0].GetTensorMutableData<float>();//Mat mask(outHeight, outWidth, CV_32FC3, pred); /经过试验,直接这样赋值,是不行的const unsigned int channel_step = outHeight * outWidth;vector<Mat> channel_mats;Mat rmat(outHeight, outWidth, CV_32FC1, pred); // RMat gmat(outHeight, outWidth, CV_32FC1, pred + channel_step); // GMat bmat(outHeight, outWidth, CV_32FC1, pred + 2 * channel_step); // Bchannel_mats.push_back(rmat);channel_mats.push_back(gmat);channel_mats.push_back(bmat);Mat mask;merge(channel_mats, mask); // CV_32FC3 allocated///不用for循环遍历Mat里的每个像素值,实现numpy.clip函数mask.setTo(this->min_max[0], mask < this->min_max[0]);mask.setTo(this->min_max[1], mask > this->min_max[1]);   也可以用threshold函数,阈值类型THRESH_TOZERO_INVmask = (mask - this->min_max[0]) / (this->min_max[1] - this->min_max[0]);mask *= 255.0;mask.convertTo(mask, CV_8UC3);cvtColor(mask, mask, COLOR_BGR2RGB);return mask;
}int main()
{CodeFormer mynet("codeformer.onnx");string imgpath = "input.png";Mat srcimg = imread(imgpath);Mat dstimg = mynet.detect(srcimg);resize(dstimg, dstimg, Size(srcimg.cols, srcimg.rows), INTER_LINEAR);//imwrite("result.jpg", dstimg)namedWindow("srcimg", WINDOW_NORMAL);imshow("srcimg", srcimg);namedWindow("dstimg", WINDOW_NORMAL);imshow("dstimg", dstimg);waitKey(0);destroyAllWindows();
}

效果展示

面部恢复

面部色彩增强与恢复

面部修复

破旧照片修复效果

opencv进阶 ——（九）图像处理之人脸修复祛马赛克算法CodeFormer

算法简介 CodeFormer是一种基于AI技术深度学习的人脸复原模型，由南洋理工大学和商汤科技联合研究中心联合开发，它能够接收模糊或马赛克图像作为输入，并生成更清晰的原始图像。算法源码地址：https://github.com/sczhou/CodeFormer…...

编程日记 2024/6/2 5:16:43

虚拟机改IP地址

使用场景：当你从另一台电脑复制一个VMware虚拟机过来，就是遇到一个问题，虚拟的IP地址不一样（比如，一个是192.168.1.3，另一个是192.168.2.4，由于‘1’和‘2’不同，不是同一网段&#…...

编程日记 2024/6/2 5:15:41

MySQL(二)-基础操作

一、约束有时候，数据库中数据是有约束的，比如性别列，你不能填一些奇奇怪怪的数据~ 如果靠人为的来对数据进行检索约束的话，肯定是不行的，人肯定会犯错~因此就需要让计算机对插入的数据进行约束要求！ 约…...

编程日记 2024/6/2 5:14:40

1.学习参考资料 vue3菜鸟教程：https://www.runoob.com/vue3/vue3-tutorial.html 官方网站：https://cn.vuejs.org/ 中文文档: https://cn.vuejs.org/guide/introduction.html Webpack 入门教程：https://www.runoob.com/w3cnote/webpack-tutor…...

编程日记 2024/6/2 5:12:37

微信小程序怎么进行页面传参

微信小程序页面传参的方式有多种，每种方式都有其特定的使用场景和优势。以下是几种常见的页面传参方式，以及它们的具体使用方法和示例： URL参数传值原理：通过在跳转链接中附加参数，在目标页面的onLoad函数中获取参数…...

编程日记 2024/6/2 5:09:34

隆道出席河南ClO社区十周年庆典，助推采购和供应链数字化发展

5月26日，“河南ClO社区十周年庆典”活动在郑州举办，北京隆道网络科技有限公司总裁助理姚锐出席本次活动，并发表主题演讲《数字化采购与供应链：隆道的探索与实践》，分享隆道公司在采购和供应链数字化转型方面的研究成果…...

编程日记 2024/6/2 5:08:33

NetApp财季报告亮点：全闪存阵列需求强劲，云计算收入增长放缓但AI领域前景乐观

在最新的财季报告中，NetApp的收入因全闪存阵列的强劲需求而显著增长。截至2024年4月26日的2024财年第四季度，NetApp的收入连续第三个季度上升，达到了16.7亿美元，较前一年同期增长6%，超出公司指导中值。净利润为2.91亿美…...

编程日记 2024/6/2 5:07:31

javascript读取本地目录

在JavaScript中，直接读取本地目录的能力受到浏览器安全限制，因为出于隐私和安全考虑，浏览器的JavaScript环境通常不允许直接访问用户的文件系统。然而，随着Web技术的发展，一些现代浏览器引入了File System API或Web Fi…...

编程日记 2024/6/2 5:06:29

Java基础八股

Java基础八股 Java语言Java语言有什么特点Java与C区别Java如何实现跨平台JVMvsJDKvsJRE标识符和关键字的区别是什么自增自减运算符移位运算符continue,break,return的区别是什么final,finally,finalize的区别final关键字的作用时什么变量 Java语言 Java语言有什么特点 Java是…...

编程日记 2024/6/2 5:03:26

【机器学习300问】102、什么是混淆矩阵？

一、混淆矩阵的定义混淆矩阵是一种用于评估分类模型性能的评估指标。当模型对数据进行预测并将数据分配到预定义的类别时，混淆矩阵提供了一种直观的方式来总结这些预测与数据实际类别之间的对应关系。具体来说，它是一个表格。二、分类模型性能评估一级…...

编程日记 2024/6/2 4:59:23

基于SpringBoot3和JDK17，集成H2数据库和jpa

基于SpringBoot3和JDK17，集成H2数据库和jpa 学会用H2数据库，为了快速写出需要处理数据关系的demo。文章目录基于SpringBoot3和JDK17，集成H2数据库和jpa工程配置pom.xml文件application.properties文件练习H2数据库的操作h2数据库的建表自…...

编程日记 2024/6/2 4:56:20

《逆水寒》手游周年庆，热度不减反增引发热议

易采游戏网5月31日最新消息：随着数字娱乐时代的飞速发展，手游市场的竞争愈发激烈。在这样的大背景下，《逆水寒》手游以其独特的古风武侠世界和深度的社交体验，自上线以来便吸引了无数玩家的目光。如今，这款游戏迎来了它…...

编程日记 2024/6/2 4:55:19

Kotlin使用Dagger2但无法生成对应类 Unresolved reference: DaggerMyComponent

最近在使用Dagger2时，遇到这个错误，app/build/generated/source/没有生成对应类，没有生成如下类，网上看了许多博客替换版本，添加dagger2的其他依赖均未成功，最终看到一篇大佬的文章才终于得以解决解决&am…...

编程日记 2024/6/2 4:53:17

Vue组件通讯⽗组件中通过 provide 来提供变量，然后在⼦组件中通过 inject 来注⼊变量例子

在Vue中，provide 和 inject 主要用于依赖注入，允许祖先组件向其所有子孙组件提供一个依赖，而不论组件层次有多深。这在开发高阶插件/组件库时特别有用。以下是一个简单的例子，演示了如何在父组件中使用 provide 提供变量&#x…...

编程日记 2024/6/2 4:52:15

教你搞一个比较简单的计时和进度条装饰器

教你搞一个比较简单的计时和进度条装饰器什么是装饰器为啥要用装饰器呢？上代码！如何使用装饰器效果什么是装饰器装饰器的英文是：Decorator。装修的英文是：Decoration。顾名思义就是我们要用装饰器在函数func()上搞点儿事儿&am…...

编程日记 2024/6/2 4:50:13

跑马灯的两种实现方式

方式一：利用元素尺寸变化监听api，计算宽度，得出时间，进行无限次数动画。优点：能自定义速度（0 - 1）。 <template><div class"box"><i class"iconfont icon-gon…...

编程日记 2024/6/2 4:49:11

OpenAI 的 GPT-4o 是目前最先进的人工智能模型！如何在工作或日常生活中高效利用它？

OpenAI 的 GPT-4o 是目前最先进的人工智能模型！如何在工作或日常生活中高效利用它？ 博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能！ 专栏链接： 🔗 精选专栏： 《面试题大…...

编程日记 2024/6/2 4:45:07

安卓ANR检测、分析、优化面面谈

前言一个引发讨论的楔子，以下三种现象有什么区别： App停止运行App暂无响应App闪退答案： 产生原因不同：停止运行是UNCheckExceptionError暂无响应是ANRDialog闪退是CheckExceptionError 本文讨论的主题是ANR的定义、分类、复现…...

编程日记 2024/6/2 4:44:06

“手撕”链表的九道OJ习题

目录 1. 第一题 2. 第二题 3. 第三题 4. 第四题 5. 第五题 6. 第六题 7. 第七题 8. 第八题 9. 第九题 1. 第一题删除链表中等于给定值 val 的所有节点。OJ链接思路如下： 相当于链表的removeAll();制定prev和cur，prev记录前一个节点&#xff…...

编程日记 2024/6/2 4:42:04

解决 Git commit 或 Git merge 跑到 VIM 里面去了

像 git commit 分支名字或 git merge 分支名字这个命令后面最好加上 -m "消息"，如果你不加上 -m "消息"的话，它会打开一个程序让你去加上消息，这个程序还是在控制台里面，只不过是 Linux 里面一个叫做 VIM 的…...

编程日记 2024/6/2 4:41:03

营造科技展厅主题氛围，多媒体应用有哪些新策略？

长久以来，展厅作为线下向公众传递信息的窗口，其设计风格与内容主题紧密相连，展现出千姿百态的面貌。然而，随着数字多媒体技术的日新月异，展厅不再仅仅是传统的信息展示平台，而是成为了引领内容展示潮流的风…...

编程日记 2024/6/2 4:39:01

【UML用户指南】-04-从代码到UML的关键抽象

1、关键抽象声明了一个名为paint的操作，它的实现调用名为drawString的另一个操作，drawString操作负责在指定的位置上打印“Hello,World!”。在通常的面向对象的方式下，drawString是一个名称为g的参数上的一个操作，g的类型是类Gr…...

编程日记 2024/6/2 4:37:59

（2024，LoRA，全量微调，低秩，强正则化，缓解遗忘，多样性）LoRA 学习更少，遗忘更少

LoRA Learns Less and Forgets Less 公和众和号：EDPJ（进 Q 交流群：922230617 或加 VX：CV_EDPJ 进 V 交流群） 目录 0. 摘要 1. 引言 2. 背景 3. 实验设置 3.2 使用编码和数学基准测试来衡量学习（目标域…...

编程日记 2024/6/2 4:36:58

【Java】面向对象的三大特征：封装、继承、多态

封装什么叫封装？ 在我们写代码的时候经常会涉及两种角色： 类的实现者和类的调用者。封装的本质就是让类的调用者不必太多的了解类的实现者是如何实现类的， 只要知道如何使用类就行了，这样就降低了类使用者的学习和使用成本&a…...

编程日记 2024/6/2 4:35:57

请问Java8进阶水平中，常用的设计模式有哪些？

设计模式通常被分为三大类：创建型（Creational）、结构型（Structural）和行为型（Behavioral）。以下是这20个设计模式的分类： 创建型（Creational）设计模式&#…...

编程日记 2024/6/2 4:34:56

力扣--最大子数组和

给你一个整数数组 nums ，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例 1： 输入：nums [-2,1,-3,4,-1,2,1,-5,4] 输出：…...

编程日记 2024/6/2 4:33:54

C# 中的字符与字符串

简介在C#编程语言中，字符和字符串是处理文本数据的基础。字符是单个的字母或符号，而字符串是字符的集合。本篇博客将详细介绍C#中的字符类型 char 和字符串类型 string，以及它们的基本操作。字符类型 char char 类型在C#中用于表示单个字…...

编程日记 2024/6/2 4:32:52

TPM之VMK密封

本篇文章主要介绍基于TPM的Bitlocker全盘加密时，VMK密钥的密封（Seal）流程，至于TPM、Bitlocker、密钥保护器、VMK密钥等这些东西是什么，这里不做解释，需要自己脑补一下（╮(╯▽╰)╭）…...

编程日记 2024/6/2 4:31:51

Fastjson 反序列化漏洞[1.2.24-rce]

漏洞复现环境搭建请参考 http://t.csdnimg.cn/vSaaw kali切换jdk版本请参考 Kali安装JAVA8和切换JDK版本的详细过程_kali安装jdk8-CSDN博客漏洞原理 Fastjson提供的com.sun.rowset.JdbcRowSetImpl类下的dataSourceName方法支持传入一个RMI/LDAP源，支持远程调用。…...

编程日记 2024/6/2 4:29:48

【面试宝藏】Go基础面试题其一

探索Go语言：特性、用法与最佳实践 Go语言（Golang）自发布以来迅速成为开发者社区中的热门选择。本文将探讨Go语言的优势、数据类型、包管理、类型转换、并发处理、同步机制、通道特性及其使用中的注意事项等内容，并回答一些常见的…...

编程日记 2024/6/2 4:28:46