当前位置：首页 > news >正文

多GPU并行处理[任务分配、进程调度、资源管理、负载均衡]

news 2026/2/8 15:36:14

1. 多GPU并行处理设计
设计思路: 实现基于多GPU的并行任务处理，每个GPU运行独立的任务，以加速整体的处理速度。
实现机制:
进程隔离: 利用multiprocessing.Process为每个GPU创建独立的工作进程。
GPU资源限制: 通过设置CUDA_VISIBLE_DEVICES环境变量，确保每个进程仅能访问其对应的GPU。
任务互斥: 每个GPU拥有一个Lock对象，确保同一时间只有一个任务在特定的GPU上运行。
2. 动态任务分配与负载均衡
设计思路: 通过动态分配任务至队列，实现任务的均匀分布，确保负载均衡。
实现机制:
任务队列: 使用Manager().Queue()创建共享队列，允许多进程安全地存取任务。
设备ID计算: 通过calculate_device_id函数，基于文件路径的哈希值和GPU总数，计算出任务应分配至的GPU，确保任务均匀分配。
3. 进程间通信与同步
设计思路: 确保多进程间的安全通信，避免数据竞争和死锁。
实现机制:
任务获取原子性: 利用Lock对象保护任务获取操作，确保任务获取的原子性。
进程同步: 使用task_queue.join()等待所有任务完成，确保主进程不会在所有子任务完成前退出。
优雅退出: 通过向队列中放置None信号，通知工作进程可以安全退出，实现进程间的优雅终止。
4. 异常处理与资源管理
设计思路: 提供异常处理机制，确保资源的有效管理。
实现机制:
异常捕获: 在worker函数中，使用try-except结构捕获Empty异常，处理队列为空的情况。
资源节约: 通过检查输出文件的存在性，避免重复处理，节省计算资源。
5. 性能优化与监控
设计思路: 优化任务处理流程，提供执行状态的实时反馈。
实现机制:
进度监控: 利用tqdm.write在控制台输出任务执行信息，提供直观的进度反馈。
效率提升: 通过合理的任务分配和进程设计，最大化利用多GPU资源，提升整体处理效率。
总结
该代码的关键设计聚焦于多GPU环境下的并行任务处理，通过精细的进程管理、资源调度、负载均衡策略以及异常处理机制，确保了系统的高效、稳定运行。同时，通过进程间通信和同步机制，以及性能优化措施，进一步提升了系统的整体性能和用户体验。

# 多gpu调度
# python multi_swap_10s_v2.py
import os
import subprocess
from tqdm import tqdm
import hashlib
from multiprocessing import Process, Lock, Manager, Queue
from queue import Empty  # 用于检查队列是否为空# Locks for each GPU to ensure only one task runs at a time per GPU
gpu_locks = [Lock(), Lock()]
# A shared queue for all tasks using Manager's Queue
task_queue = Manager().Queue()def worker(gpu_id, lock):os.environ['CUDA_VISIBLE_DEVICES'] = str(gpu_id)  # Set the CUDA_VISIBLE_DEVICES for this processwhile True:# Try to acquire the lock and get a task atomicallywith lock:try:cmd = task_queue.get_nowait()except Empty:# No more tasks available, exit the workerbreak# Update the progress bar outside the lock to avoid contentiontqdm.write(f"GPU {gpu_id} starting task: {' '.join(cmd)}")# Run the subprocesssubprocess.run(cmd)# Worker finishes when it exits the loopdef calculate_device_id(vid_file, img_file):# Calculate a hash of the file paths to determine the device IDhash_object = hashlib.md5(f"{vid_file}{img_file}".encode())hex_dig = hash_object.hexdigest()return int(hex_dig, 16) % len(gpu_locks)def main():source_videos_dir = "/home/nvidia/data/video/HDTF/10s"source_images_dir = "/home/nvidia/data/image/CelebA-HQ/300/0"output_dir = source_images_dirvideo_files_list = [os.path.join(source_videos_dir, f)for f in os.listdir(source_videos_dir)if os.path.isfile(os.path.join(source_videos_dir, f)) and f.endswith('.mp4') and not any(char.isalpha() for char in f.split('.')[0])]image_files_list = [os.path.join(source_images_dir, f)for f in os.listdir(source_images_dir)if os.path.isfile(os.path.join(source_images_dir, f)) and f.endswith('.jpg')]model_id = 'c'# Fill the task queuefor vid_file in video_files_list:for img_file in image_files_list:output_video = f"{os.path.splitext(os.path.basename(vid_file))[0]}_{os.path.splitext(os.path.basename(img_file))[0]}_{model_id}.mp4"output_video_path = os.path.join(output_dir, output_video)# Check if the output file already existsif not os.path.exists(output_video_path):device_id = calculate_device_id(vid_file, img_file)cmd = ["python", "multi_face_single_source.py","--retina_path", "retinaface/RetinaFace-Res50.h5","--arcface_path", "arcface_model/ArcFace-Res50.h5","--facedancer_path", "model_zoo/FaceDancer_config_c_HQ.h5","--vid_path", vid_file,"--swap_source", img_file,"--output", output_video_path,"--compare", "False","--sample_rate", "1","--length", "1","--align_source", "True","--device_id", str(device_id)]task_queue.put(cmd)# Create worker processes for each GPUworkers = []for gpu_id in range(len(gpu_locks)):  # Assuming you have 2 GPUsp = Process(target=worker, args=(gpu_id, gpu_locks[gpu_id]))p.start()workers.append(p)# Wait for all tasks to be processedtask_queue.join()# Signal workers to exit by adding None to the queue# Ensure enough exit signals for all workersfor _ in workers:task_queue.put(None)# Wait for all workers to finishfor p in workers:p.join()if __name__ == '__main__':main()"""在这个版本中，我引入了一个calculate_device_id函数，它基于视频文件和图像文件的路径计算出一个哈希值，然后取模得到设备ID。这样可以确保任务更均匀地分配到不同的GPU上，而不仅仅依赖于列表的索引。同时，我添加了设置CUDA_VISIBLE_DEVICES的代码到worker函数中，虽然这不是严格必需的，但它强调了每个工作进程将只看到并使用分配给它的GPU。这有助于避免潜在的GPU资源冲突问题。"""

多GPU并行处理[任务分配、进程调度、资源管理、负载均衡]

1. 多GPU并行处理设计设计思路: 实现基于多GPU的并行任务处理，每个GPU运行独立的任务，以加速整体的处理速度。实现机制: 进程隔离: 利用multiprocessing.Process为每个GPU创建独立的工作进程。 GPU资源限制: 通过设置CUDA_VISIBLE_DEVICES环境变量&…...

编程日记 2024/7/26 6:37:52

项目部署到服务器

(相关资源都给出来了) 1 下载MobaXterm,然后打开正常连接输入你的服务器IP，用户名可以起名为root 2 将JDK,Tomcat,mysql安装包布置到服务器中（JDK官网地址：https://www.oracle.com/java/technologies/downloads/#java8 mysql官网地址: …...

编程日记 2024/7/26 6:36:51

Idea2024 创建Meaven项目没有src文件夹

1、直接创建新建maven项目，发现没有src/main/java 直接新建文件夹：右击项目名->new->Directory 可以看到idea给出了快捷创建文件夹的选项，可以根据需要创建，这里点击src/main/java 回车，可以看到文件夹已经创建…...

编程日记 2024/7/26 6:35:50

LeetCode 2766.重新放置石块：哈希表

【LetMeFly】2766.重新放置石块：哈希表力扣题目链接：https://leetcode.cn/problems/relocate-marbles/ 给你一个下标从 0 开始的整数数组 nums ，表示一些石块的初始位置。再给你两个长度相等下标从 0 开始的整数数组 moveFrom 和 moveTo…...

编程日记 2024/7/26 6:34:49

基于STM32的农业大棚温湿度采集控制系统的设计

目录 1、设计要求 2、系统功能 3、演示视频和实物 4、系统设计框图 5、软件设计流程图 6、原理图 7、主程序 8、总结 🤞大家好，这里是5132单片机毕设设计项目分享，今天给大家分享的是智能教室。设备的详细功能见网盘中的文章《8、基…...

编程日记 2024/7/26 6:32:47

go语言的命名规则

身为前端为什么去学go语言呢？我认为go在未来可能会给我带来一些收益。自认为收益是去做一件事情不可缺少的因素，就好像是你努力之后得到回报，努力的欲望会越来越强。《Head First Go》这本书里作者有一句话，如果你已经掌握了一门编…...

编程日记 2024/7/26 6:31:46

新增ClamAV病毒扫描功能、支持Java和Go运行环境，1Panel开源面板v1.10.12版本发布

2024年7月19日，现代化、开源的Linux服务器运维管理面板1Panel正式发布了v1.10.12版本。在这一版本中，1Panel新增了多项实用功能。社区版方面，1Panel新增ClamAV病毒扫描功能、支持Java和Go运行环境，同时1Panel还新增了文件编辑器…...

编程日记 2024/7/26 6:29:44

Windows通过命令查看mac ： getmac

要查看本机网卡mac，可以通过ipconfig /all 显示，但输出内容过多可以通过getmac命令查看示例 C:\Users\Desktop> getmac物理地址传输名称暂缺没有硬件 1C-1B-B5-04-E2-7D \Device\Tcpip_{80096E40-D51D-490C-9AF7-…...

编程日记 2024/7/26 6:28:43

Android笔试面试题AI答之Android系统与综合类（1）

答案仅供参考，来着文心一言、Kimi.ai 目录 1.简述嵌入式实时操作系统，Android 操作系统属于实时操作系统吗?嵌入式实时操作系统简述Android操作系统是否属于实时操作系统 2.简述Android系统的优势和不足？3.简述Android的系统架构 &#xff1…...

编程日记 2024/7/26 6:26:41

【Android】数据存储方案——文件存储、SharedPreferences、SQLite数据库用法总结

文章目录文件存储存储到文件读取文件 SharedPreferences存储存储获取SharedPreferences对象Context 类的 getSharedPreferences() 方法Activity 类的 getPreferences() 方法PreferenceManager 类中的 getDefaultSharedPreferences() 方法示例读取记住密码的功能 SQLite数据库…...

编程日记 2024/7/26 6:25:40

抖音矩阵管理系统功能说明：一站式掌握

在当下这个信息爆炸的时代，抖音作为短视频领域的佼佼者，其用户规模持续扩大，影响力日益增强。对于内容创作者和营销人员来说，如何高效管理抖音账号，实现内容的多平台分发和精准触达，成为了亟待解决的问题。…...

编程日记 2024/7/26 6:24:39

旅游卡使用指南及常见疑问解答

近期，许多朋友对旅游卡的免费旅游政策表示浓厚兴趣，但心中不免存疑：这真的是全程免费，无需自费一分吗？ 在此，我们明确告知：免费旅游确实存在，但享受范围与条件需清晰界定。本文将…...

编程日记 2024/7/26 6:23:38

【MySQL篇】Percona XtraBackup标准化全库完整备份策略（第三篇，总共五篇）

💫《博主介绍》：✨又是一天没白过，我是奈斯，DBA一名✨ 💫《擅长领域》：✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux，也在扩展大数据方向的知识面✌️…...

编程日记 2024/7/26 6:22:37

背单词工具(C++)

功能分析生词本管理： 创建生词本文件：在构造函数中创建了“生词本.txt”“背词历史.log”“历史记录.txt”三个文件。添加单词：用户可以输入单词、词性和解释，将其添加到生词本中。查询所有单词：展示生词本中所有的单…...

编程日记 2024/7/26 6:21:36

面试八股 | 数据库引擎 | InnoDB和myISAM的区别？

⭐️⭐️⭐️InnoDB和MyISAM的区别? InnoDB ： 1、使用的是行锁，操作时候只锁一行数据，不会对其他有影响，适合高并发工作 2、支持事务 3、不仅缓存索引还要缓存真实数据，适合高并发 4、默认安装 5、支持外键 6、…...

编程日记 2024/7/26 6:20:35

GEE计算五种植被指数（NDVI、EVI2、RVI、MTVI2、OSAVI）

目录计算公式源代码计算公式源代码 // 定义感兴趣区域（这里以一个简单的矩形区域为例） var region = ee.FeatureCollection("projects/a-flyllf0313/assets/dachang"); // 定义时间范围 var startDate = 2023-04-18; var endDate &...

编程日记 2024/7/26 6:17:32

C/S架构和B/C架构

C/S架构（Client/Server Architecture）和B/C架构（Browser/Client Architecture）是两种不同的软件架构模型，它们各自有不同的特点和应用场景。一、C/S架构（Client/Server Architecture） 1. 定…...

编程日记 2024/7/26 6:16:31

音乐曲谱软件Guitar Pro 8.2 for Mac 中文破解版

Guitar Pro 8.2 for Mac 中文破解版是一款功能强大的音乐曲谱软件，非常适合学习如何玩，改进技巧，重现喜爱的歌曲或陪伴自己。 Guitar Pro for Mac 是一款功能强大的音乐曲谱软件，非常适合学习如何玩，改进技巧&#xf…...

编程日记 2024/7/26 6:14:28

浅聊Web Storage（localStorage 和 sessionStorage）、cookie的使用场合

Web Storage（localStorage 和 sessionStorage）、cookie 一、Cookie二、Web StoragelocalStoragesessionStorage与 Cookies 的比较一、Cookie Cookies 主要用于以下几种情况： 会话管理（Session Management）: 登录、购…...

编程日记 2024/7/26 6:12:27

C语言输入输出缓冲机制

文章目录输入输出缓冲机制概述为什么要有缓冲区缓冲区的类型引发缓冲区的刷新原理实现输入输出缓冲机制概述缓冲区又称为缓存，它是内存空间的一部分。也就是说，在内存空间中预留了一定的存储空间，这些存储空间用来缓冲输入或者输出的数…...

编程日记 2024/7/26 6:11:26

uniapp 对接腾讯云IM群组成员管理（增删改查）

UniApp 实战：腾讯云IM群组成员管理（增删改查） 一、前言在社交类App开发中，群组成员管理是核心功能之一。本文将基于UniApp框架，结合腾讯云IM SDK，详细讲解如何实现群组成员的增删改查全流程。权限校验…...

编程新知 2026/1/13 9:59:27

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/9/17 7:25:07

简易版抽奖活动的设计技术方案

1.前言本技术方案旨在设计一套完整且可靠的抽奖活动逻辑，确保抽奖活动能够公平、公正、公开地进行，同时满足高并发访问、数据安全存储与高效处理等需求，为用户提供流畅的抽奖体验，助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

编程新知 2026/2/7 17:41:40

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用，可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器，能够帮助开发者更好地管理复杂的依赖关系，而 GraphQL 则是一种用于 API 的查询语言，能够提…...

编程新知 2025/12/31 8:38:23

全球首个30米分辨率湿地数据集(2000—2022)

数据简介今天我们分享的数据是全球30米分辨率湿地数据集，包含8种湿地亚类，该数据以0.5X0.5的瓦片存储，我们整理了所有属于中国的瓦片名称与其对应省份，方便大家研究使用。该数据集作为全球首个30米分辨率、覆盖2000–2022年时间…...

编程新知 2026/1/31 17:15:25

oracle与MySQL数据库之间数据同步的技术要点

Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异，它们的数据同步要求既要保持数据的准确性和一致性，又要处理好性能问题。以下是一些主要的技术要点： 数据结构差异数据类型差异&#xff…...

编程新知 2026/1/11 0:40:53

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

Python爬虫（一）：爬虫伪装

一、网站防爬机制概述在当今互联网环境中，具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类： 身份验证机制：直接将未经授权的爬虫阻挡在外反爬技术体系：通过各种技术手段增加爬虫获取数据的难度…...

编程新知 2026/1/30 20:42:46

PL0语法，分析器实现！

简介 PL/0 是一种简单的编程语言，通常用于教学编译原理。它的语法结构清晰，功能包括常量定义、变量声明、过程（子程序）定义以及基本的控制结构（如条件语句和循环语句）。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言，由 Niklaus Wirth 设计，用于展示编译原理的核…...

编程新知 2026/1/29 17:06:33

优选算法第十二讲：队列 + 宽搜优先级队列

优选算法第十二讲：队列宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...

编程新知 2026/1/20 17:18:59

相关文章：