当前位置: 首页 > news >正文

Python - 搭建 Flask 服务实现图像、视频修复需求

目录

一.引言

二.服务构建

1.主函数 upload_gif

2.文件接收

3.专属目录

4.图像修复

5.gif2mp4

6.mp42gif

7.图像返回

三.服务测试

1.服务启动

2.服务调用

四.总结


一.引言

前面我们介绍了如何使用 Real-ESRGAN 进行图像增强并在原始格式 jpeg、jpg、mp4 的基础上增加了 gif 图像的处理:

◆ 图像修复:  Python - Real-ESRGAN 提升图像、视频清晰度

◆ 动图修复:  Python - Real-ESRGAN 提高 gif 图像质量

为了方便随时随地上传图片即可修图,我们将上面的内容结合,通过 Flask 框架搭建图像修复服务。

二.服务构建

1.主函数 upload_gif

from flask import Flask, request, send_file, abort
from moviepy.editor import VideoFileClip
import os
import subprocess
import shutil
from enhance_frame import enhanceapp = Flask(__name__)output="./server/"@app.route('/upload-gif', methods=['POST'])
def upload_gif():if 'gif' not in request.files:return abort(400, 'No gif file part in the request')file = request.files['gif']# 确保文件名安全if file.filename == '':return abort(400, 'No selected file')if file and file.filename.lower().endswith('.gif'):# 1.创建专属文件夹gif_name = file.filename.split(".")[0]cur_dir = os.path.join(output, gif_name)# 临时测试#shutil.rmtree(cur_dir)if not os.path.isdir(cur_dir):print(f"文件夹 {cur_dir} 不存在,创建中 ...")os.makedirs(cur_dir)#  2.图像转存至本地并切换为 mp4 格式input_path = os.path.join(cur_dir, file.filename)print(f"原始图像保存路径 {input_path}")file.save(input_path)mp4_path, w, h = gif2mp4(input_path, gif_name, cur_dir)print(f"GIF 转 MP4 路径 {mp4_path}")# 3.对图像进行增强行理enhance(mp4_path, cur_dir)enhance_output = os.path.join(cur_dir, gif_name + "_trans_out.mp4")# 4.转换为 gif 并返回final_output = os.path.join(cur_dir, gif_name + "_out.gif")mp42gif(enhance_output, final_output, w, h)else:print(f"文件夹 {cur_dir} 存在 ...")final_output = 'uploaded.gif'return send_file(final_output, mimetype='image/gif')return abort(400, 'The uploaded file is not a GIF')

主函数为 Post 形式,其通过 request.files 接收传入的 gif 图像并对图像进行修复,返回修复后的 gif 图像。下面分步骤对修复过程中的代码进行讲解。

2.文件接收

    if 'gif' not in request.files:return abort(400, 'No gif file part in the request')file = request.files['gif']# 确保文件名安全if file.filename == '':return abort(400, 'No selected file')

首先检查 gif 是否在传入的图像中,随后通过 .files['gif'] 获取传入的 gif 图像,最后检查文件名为空的异常情况。这里只做了简单的异常判断,大家可以根据自己场景进行扩充。

3.专属目录

    if file and file.filename.lower().endswith('.gif'):# 1.创建专属文件夹gif_name = file.filename.split(".")[0]cur_dir = os.path.join(output, gif_name)# 临时测试#shutil.rmtree(cur_dir)if not os.path.isdir(cur_dir):print(f"文件夹 {cur_dir} 不存在,创建中 ...")os.makedirs(cur_dir)

这里通过 file.filename 获取对应 gif 图的名称,并在输出文件中创建该 gif 图的专属文件夹,一方面是可以记录 Post 请求传来的图像以及修复后的状态,另一方面相当于做了一个本地 Cache,如果相同名称的 gif 图像再次 Post 传过来,可以直接在文件夹中找到缓存的返回。

4.图像修复

            #  2.图像转存至本地并切换为 mp4 格式input_path = os.path.join(cur_dir, file.filename)print(f"原始图像保存路径 {input_path}")file.save(input_path)mp4_path, w, h = gif2mp4(input_path, gif_name, cur_dir)print(f"GIF 转 MP4 路径 {mp4_path}")# 3.对图像进行增强行理enhance(mp4_path, cur_dir)enhance_output = os.path.join(cur_dir, gif_name + "_trans_out.mp4")# 4.转换为 gif 并返回final_output = os.path.join(cur_dir, gif_name + "_out.gif")mp42gif(enhance_output, final_output, w, h)

由于原始的 Real-ESRGAN 源码对视频只支持了 flv 和 mp4,因此对于要修复的 gif 我们需要:

◆ gif2mp4

先将其逐帧转换为 mp4 ,这一步由 gif2mp4 函数负责;

◆ enhance

转换为 mp4 后由 enhance 函数进行修复,这里 enhance 函数对应源码中的 inference_realesrgan_video.py ,enhance 函数对应源码中的 main() 函数,只需要修改名称即可;

◆ mp42gif

修复后再将 mp4 转换为 gif,这一步由 mp42gif 负责。

Tips:

如果觉得上述过程比较繁琐,可以直接通过 ffmpeg 在源码中实现对 gif 图像进行转换。

5.gif2mp4

def gif2mp4(file_path, filename, out):# 加载GIF文件clip = VideoFileClip(file_path)# 输出地址output = os.path.join(out, filename + "_trans.mp4")# 将GIF文件写到MP4文件clip.write_videofile(output, fps=clip.fps, codec="libx264", bitrate='8000k')# 关闭clip.close()return output, clip.w, clip.h

通过 moviepy 的 VideoFileClip 函数读取 mp4,随后通过 write_videofile 将 mp4 写出,这里 bitrate 可以控制输出 mp4 的码率,数值越高可以在一定程度提高输出视频的质量。同时为了保证输出的 gif 图像与原始 gif 图像的长宽保持一致,这里我们还返回了 clip.w 和 clip.h。

6.mp42gif

def mp42gif(file_path, out, w, h):# 加载GIF文件clip = VideoFileClip(file_path)# 目标大小resized_clip = clip.resize(width=w).resize(height=h)# 导出GIFresized_clip.write_gif(out, fps=15)  # fps参数可以减少帧数,来进一步降低文件大小# 释放资源clip.close()

还是通过 moviepy 进行 mp4 到 gif 的转换,使用 resize 保证输出的 gif 与原始 gif 尺寸相同,由于增强的缘故,新生成的 gif 会比之前的老图大 5-10 倍,如果有缩减的需要,可以减少 FPS 或者使用 reduction_factor 按百分比减少分辨率。

7.图像返回

        else:print(f"文件夹 {cur_dir} 存在 ...")final_output = 'uploaded.gif'return send_file(final_output, mimetype='image/gif')return abort(400, 'The uploaded file is not a GIF')

else 逻辑其实是该 gif 存在缓存文件夹,直接在文件夹找增强过的图像直接返回就可以了,这里省略了 Cache 的逻辑,有需要的同学也可以自己添加。最后就是通过 send_file 将 final_output 文件写出,作为 Post 的结果回传。

三.服务测试

1.服务启动

if __name__ == '__main__':# 这将允许你在你的开发机上本地运行它ip = "10.196.1.666"app.run(host=ip, port=5000, debug=True)

运行主函数后提示下述信息即代表 Http 服务启动,Running on http: 后面就是对应的 URL。如果显示异常可以尝试切换 port 重新启动: 

2.服务调用

在本地执行下述命令:

#!/bin/bash# gif 路径
gif_path="gif=@/Users/xxx/Desktop/892f4f60de074a7b9c682f744a5cf6f8.gif"
# post 调用 URL
url="http://10.192.1.666:5000/upload-gif"
# 输出地址
out="response.gif"curl -X POST $url -F $gif_path --output $out

◆ 服务端日志

服务端日志会把 Flask 程序里相关的 print 都打印出来,最后 inference 是视频修复的 tqdm 进度条,这里 nb_frames: 12 代表当前 gif 转换的 mp4 共包含 12 帧,程序在单线程的情况下需要逐帧转换,有需要的同学也可以使用多线程实现,分 Frame 处理,最后使用 ffmpeg 进行合并。

◆ 本地日志

本地日志会记录调用的时间以及相关接收数据等信息。 

◆ gif 修复前

 ◆ gif 修复后

四.总结

本文使用 Flask 搭建了轻量级的图像修复服务,可以优化的点还有很多,大家可以多多交流讨论。

相关文章:

Python - 搭建 Flask 服务实现图像、视频修复需求

目录 一.引言 二.服务构建 1.主函数 upload_gif 2.文件接收 3.专属目录 4.图像修复 5.gif2mp4 6.mp42gif 7.图像返回 三.服务测试 1.服务启动 2.服务调用 四.总结 一.引言 前面我们介绍了如何使用 Real-ESRGAN 进行图像增强并在原始格式 jpeg、jpg、mp4 的基础上…...

C#基础——构造函数、析构函数

C#基础——构造函数、析构函数 1、构造函数 构造函数是一种特殊的方法,用于在创建类的实例时进行初始化操作。构造函数与类同名,并且没有返回类型。 构造函数在对象创建时自动调用,可以用来设置对象的初始状态、分配内存、初始化字段等操作…...

jmeter 如何循环使用接口返回的多值?

有同学在用jmeter做接口测试的时候,经常会遇到这样一种情况: 就是一个接口请求返回了多个值,然后下一个接口想循环使用前一个接口的返回值。 这种要怎么做呢? 有一定基础的人,可能第一反应就是先提取前一个接口返回…...

VLAN 详解一(VLAN 基本原理及 VLAN 划分原则)

VLAN 详解一(VLAN 基本原理及 VLAN 划分原则) 在早期的交换网络中,网络中只有 PC、终端和交换机,当某台主机发送一个广播帧或未知单播帧时,该数据帧会被泛洪,甚至传递到整个广播域。而广播域越大&#xff…...

Android - 分区存储 MediaStore、SAF

官方页面 参考文章 一、概念 分区存储(Scoped Storage)的推出是针对 APP 访问外部存储的行为(乱建乱获取文件和文件夹)进行规范和限制,以减少混乱使得用户能更好的控制自己的文件。 公有目录被分为两大类:…...

Shiro框架权限控制

首先去通过配置类的用户认证,在用户认证完成后,进行用户授权,用户通过授权之后再跳转其他的界面时,会进行一个验证,当前账号是否有权限。 前端权限控制显示的原理 在前端中,通常使用用户的角色或权限信息来…...

centOS7 安装tailscale并启用子网路由

1、在centOS7上安装Tailscale客户端 #安装命令所在官网位置:https://tailscale.com/download/linux #具体命令为: curl -fsSL https://tailscale.com/install.sh | sh #命令执行后如下图所示2、设置允许IP转发和IP伪装。 安装后,您可以启动…...

spring 项目中如何处理跨越cors问题

1.使用 CrossOrigin 注解 作用于controller 方法上 示例如下 RestController RequestMapping("/account") public class AccountController {CrossOriginGetMapping("/{id}")public Account retrieve(PathVariable Long id) {// ...}DeleteMapping(&quo…...

importlib --- import 的实现

3.1 新版功能. 源代码 Lib/importlib/__init__.py 概述 importlib 包具有三重目标。 一是在 Python 源代码中提供 import 语句的实现(并且因此而扩展 __import__() 函数)。 这提供了一个可移植到任何 Python 解释器的 import 实现。 与使用 Python 以…...

【PyTorch】现代卷积神经网络

文章目录 1. 理论介绍1.1. 深度卷积神经网络(AlexNet)1.1.1. 概述1.1.2. 模型设计 1.2. 使用块的网络(VGG)1.3. 网络中的网络(NiN)1.4. 含并行连结的网络(GoogLeNet)1.5. 批量规范化…...

用python编写九九乘法表

1 问题 我们在学习一门语言的过程中,都会练习到编写九九乘法表这个代码,下面介绍如何编写九九乘法表的流程。 2 方法 (1)打开pycharm集成开发环境,创建一个python文件,并编写第一行代码,主要构建…...

Google Gemini 模型本地可视化

Google近期发布了Gemini模型,而且开放了Gemini Pro API,Gemini Pro 可免费使用! Gemini Pro支持全球180个国家的38种语言,目前接受文本、图片作为输入并生成文本作为输出。 Gemini Pro的表现超越了其他同类模型,当前版…...

数据修复:.BlackBit勒索病毒来袭,安全应对方法解析

导言: 黑色数字罪犯的新玩具——.BlackBit勒索病毒,近来成为网络安全领域的头号威胁。这种恶意软件以其高度隐秘性和毁灭性而引起广泛关注。下面是关于.BlackBit勒索病毒的详细介绍,如不幸感染这个勒索病毒,您可添加我们的技术服…...

拓扑排序实现循环依赖判断 | 京东云技术团队

本文记录如何通过拓扑排序,实现循环依赖判断 前言 一般提到循环依赖,首先想到的就是Spring框架提供的Bean的循环依赖检测,相关文档可参考: https://blog.csdn.net/cristianoxm/article/details/113246104 本文方案脱离Spring Be…...

Java的NIO工作机制

文章目录 1. 问题引入2. NIO的工作方式3. Buffer的工作方式4. NIO数据访问方式 1. 问题引入 在网络通信中,当连接已经建立成功,服务端和客户端都会拥有一个Socket实例,每个Socket实例都有一个InputStream和OutputStream,并通过这…...

一个简单的光线追踪渲染器

前言 本文参照自raytracing in one weekend教程,地址为:https://raytracing.github.io/books/RayTracingInOneWeekend.html 什么是光线追踪? 光线追踪模拟现实中的成像原理,通过模拟一条条直线在场景内反射折射,最终…...

C++学习笔记(十二)------is_a关系(继承关系)

你好,这里是争做图书馆扫地僧的小白。 个人主页:争做图书馆扫地僧的小白_-CSDN博客 目标:希望通过学习技术,期待着改变世界。 提示:以下是本篇文章正文内容,下面案例可供参考 文章目录 前言 一、继承关系…...

DC电源模块的设计与制造技术创新

BOSHIDA DC电源模块的设计与制造技术创新 DC电源模块的设计与制造技术创新主要涉及以下几个方面: 1. 高效率设计:传统的DC电源模块存在能量转换损耗较大的问题,技术创新可通过采用高效率的电路拓扑结构、使用高性能的功率开关器件和优化控制…...

Sketch for Mac:实现你的创意绘图梦想的矢量绘图软件

随着数字时代的到来,矢量绘图软件成为了广告设计、插画创作和UI设计等领域中必不可少的工具。在众多矢量绘图软件中,Sketch for Mac(矢量绘图软件)以其强大的功能和简洁的界面脱颖而出,成为了众多设计师的首选。 Sket…...

ReactNative0.73发布,架构升级与更好的调试体验

这次更新包含了多种提升开发体验的改进,包括: 更流畅的调试体验: 通过 Hermes 引擎调试支持、控制台日志历史记录和实验性调试器,让调试过程更加高效顺畅。稳定的符号链接支持: 简化您的开发工作流程,轻松将文件或目录链接到其他…...

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

《用户共鸣指数(E)驱动品牌大模型种草:如何抢占大模型搜索结果情感高地》

在注意力分散、内容高度同质化的时代,情感连接已成为品牌破圈的关键通道。我们在服务大量品牌客户的过程中发现,消费者对内容的“有感”程度,正日益成为影响品牌传播效率与转化率的核心变量。在生成式AI驱动的内容生成与推荐环境中&#xff0…...

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面(Target 选项卡)1. IROM1(用于配置 Flash)2. IRAM1(用于配置 RAM)二、链接器设置界面(Linker 选项卡)1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数(如果没有勾选上面…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法(ISWC2024)

笔记整理:刘治强,浙江大学硕士生,研究方向为知识图谱表示学习,大语言模型 论文链接:http://arxiv.org/abs/2407.16127 发表会议:ISWC 2024 1. 动机 传统的知识图谱补全(KGC)模型通过…...

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践

6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...

leetcodeSQL解题:3564. 季节性销售分析

leetcodeSQL解题:3564. 季节性销售分析 题目: 表:sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

AI书签管理工具开发全记录(十九):嵌入资源处理

1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...

AI,如何重构理解、匹配与决策?

AI 时代,我们如何理解消费? 作者|王彬 封面|Unplash 人们通过信息理解世界。 曾几何时,PC 与移动互联网重塑了人们的购物路径:信息变得唾手可得,商品决策变得高度依赖内容。 但 AI 时代的来…...