当前位置：首页 > news >正文

目标检测脚本之mmpose json转yolo txt格式

news 2026/2/8 16:54:46

目标检测脚本之mmpose json转yolo txt格式

一、需求分析

在使用yolopose及yolov8-pose 网络进行人体姿态检测任务时，有时需要标注一些特定场景的中的人型目标数据，用来扩充训练集，提升自己训练模型的效果。因为单纯的人工标注耗时费力，所以可以使用一些开源的大模型如（mmpose）来标注图片。以mmpose为例，对下面图片进行预测后生成的结果图如下所示：

1.预测图片

从预测图片可以看出，预测的结果还是不错的，目标框和关键点的位置预测的还是比较准确的。

mmpose 预测结果图

2. json 文件

从json 文件中可以看出，包含4个字段：Keyponts、keypoints_score、bbox、bbox_score，注意其中keypoints只包含关键点的(x,y）坐标值，并没有yolo格式中的v值。keypoints_score表示每个关键点的得分，bbox表示目标框的左上角和右下角坐标，bbox_score表示目标框的得分。

在这里插入图片描述

二、需求实现

1. 预计结果

如下图所示，希望通过脚本文件可以批量将mmpose生成的json文件转为yolo的txt标签格式

在这里插入图片描述

2. 源码实现：

# 处理 mmpose 推理后的json文件，生成coco格式关键点的标签文件
import json
import os
import cv2# 目标检测框 x1y1x2y2 转 为 cls,x_center,y_center,w,h
def convert_xywh(box,image_width,image_height):x1,y1 = box[0],box[1]x2,y2 = box[2],box[3]x = (x2 + x1) /(2*image_width)y = (y2 + y1) /(2*image_height)width = (x2-x1) / image_widthheight = (y2-y1) / image_heightclass_id = 0return [class_id,round(x,4),round(y,4),round(width,4),round(height,4)]#  判断目标的尺寸是否太小，这里设置了5以下返回True，可以自行根据实际情况更改
def is_too_small(label,image_width,image_height):if label[4] * image_width < 5 or label[3] * image_height< 5:return Truedef json2txt(json_dir,image_dir,save_label_dir):"""根据输入的json文件夹，图像文件夹，和保存标签的文件夹，生成coco格式的标签文件。Args:json_dir (str): 存放json文件的文件夹路径。image_dir (str): 存放图像文件的文件夹路径。save_label_dir (str): 保存标签文件的文件夹路径。Returns:None"""print(save_label_dir)if not os.path.exists(save_label_dir):os.makedirs(save_label_dir)json_list = os.listdir(json_dir)for json_file in json_list:image_file = os.path.join(image_dir,json_file.split('.')[0]+'.jpg')img = cv2.imread(image_file)if img is None:continuewidth,height = img.shape[1],img.shape[0]json_path = os.path.join(json_dir,json_file)label_path = os.path.join(save_label_dir,json_file.split('.')[0]+'.txt')with open(json_path,'r',encoding='utf-8') as f:result = json.load(f)  # 读取json文件kepoints = []kepoints_scores = []boxes = []for item in result:kepoints.append(item.get("keypoints"))kepoints_scores.append(item.get("keypoint_scores"))boxes.append(item.get("bbox"))# print(len(boxes))coco_model_kepoints = []coco_boxes = []# 共有多少个目标，也相当于多少组关键点评分for i in range(len(kepoints_scores)):coco_model_kepoints_temp = []#每组关键点有17个，每个关键点有2个值，需要将每个关键点都转换成coco格式，补充为3个值for j in range(len(kepoints_scores[i])):                   if kepoints_scores[i][j] >= 0.45:x = kepoints[i][j][0]/width if kepoints[i][j][0]/width > 0 else 0y = kepoints[i][j][1]/height if kepoints[i][j][1]/height > 0 else 0v = 2else:x = 0y = 0v = 0if x > 1:x = 1if y > 1:y = 1x = round(x,4)y = round(y,4)coco_model_kepoints_temp.append(x)coco_model_kepoints_temp.append(y)coco_model_kepoints_temp.append(v)if all(v == 0 for v in coco_model_kepoints_temp) is False:coco_boxes.append(convert_xywh(boxes[i][0],width,height))coco_model_kepoints.append(coco_model_kepoints_temp)final_label = []   for k in range(len(coco_model_kepoints)):temp_label = []for item1 in coco_boxes[k]:temp_label.append(item1)for item2 in coco_model_kepoints[k]:temp_label.append(item2)final_label.append(temp_label)with open(label_path,'w',encoding='utf-8') as f1:for label in final_label:if is_too_small(label,width,height):continuefor item in label:f1.write(str(item)+' ')f1.write('\n')if __name__ == '__main__':json_dir = '' # 放置使用mmpose 预测出来的图片的json 文件路径image_dir = '' # 放置用于预测的图片路径save_label_dir = '' # 用来保存最终label文件的路径json2txt(json_dir,image_dir,save_label_dir)

目标检测脚本之mmpose json转yolo txt格式

目标检测脚本之mmpose json转yolo txt格式一、需求分析在使用yolopose及yolov8-pose 网络进行人体姿态检测任务时，有时需要标注一些特定场景的中的人型目标数据，用来扩充训练集，提升自己训练模型的效果。因为单纯的人工标注耗时费力&…...

编程日记 2024/1/9 8:04:28

大数据技术在民生资金专项审计中的应用

一、应用背景目前，针对审计行业，关于大数据技术的相关研究与应用一般包括大数据智能采集数据技术、大数据智能分析技术、大数据可视化分析技术以及大数据多数据源综合分析技术。其中，大数据智能采集数据技术是通过网络爬虫或者WebService接口实现跨部门在线数据交互；大数…...

编程日记 2024/1/9 8:02:26

视觉SLAM十四讲|【四】误差Jacobian推导预积分误差递推公式 ω 1 2 ( ( ω b k n k g − b k g ) ( w b k 1 n k 1 g − b k 1 g ) ) \omega \frac{1}{2}((\omega_b^kn_k^g-b_k^g)(w_b^{k1}n_{k1}^g-b_{k1}^g)) ω21((ωbknkg−bkg)(wbk1nk1g−bk1g)) …...

编程日记 2024/1/9 8:01:25

「实战应用」如何用DHTMLX Gantt构建类似JIRA式的项目路线图（一）

DHTMLX Gantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表。可满足项目管理应用程序的所有需求，是最完善的甘特图图表库。在web项目中使用DHTMLX Gantt时，开发人员经常需要满足与UI外观相关的各种需求。因此他们必须确定JavaScript甘特图库的…...

编程日记 2024/1/9 8:00:24

【习题】应用程序框架

判断题 1. 一个应用只能有一个UIAbility。错误(False) 正确(True)错误(False) 2. 创建的Empty Ability模板工程，初始会生成一个UIAbility文件。正确(True) 正确(True)错误(False) 3. 每调用一次router.pushUrl()方法，页面路由栈数量均会加1。错误(Fal…...

编程日记 2024/1/9 7:58:22

java基于ssm的线上选课系统的设计与实现论文

摘要在如今社会上，关于信息上面的处理，没有任何一个企业或者个人会忽视，如何让信息急速传递，并且归档储存查询，采用之前的纸张记录模式已经不符合当前使用要求了。所以，对学生选课信息管理的提升&#x…...

编程日记 2024/1/9 7:54:17

汽车雷达：实时SAR成像的实现

摘要：众所周知，点云成像是目前实现汽车雷达感知最流行的方案，尤其是采用多级联实现的4D点云成像雷达，这是目前最有希望实现产品落地的技术方案之一。今天重点分享关于汽车雷达SAR成像相关技术内容，这也证实了4D点云成像雷达并不一定就是汽车雷达成像唯一的方案，在业内…...

编程日记 2024/1/9 7:53:16

《C++语言程序设计（第5版）》（清华大学出版社，郑莉董渊编著）习题——第2章 C++语言简单程序设计

2-15 编写一个程序，运行时提示输入一个数字，再把这个数字显示出来。 #include <iostream>using namespace std;int main() {// 提示用户输入数字cout << "请输入一个数字: ";// 用于存储用户输入的数字的变量double number;// 从…...

编程日记 2024/1/9 7:50:11

2023年生成式AI全球使用报告

生成式人工智能工具正在迅速改变多个领域，从营销和新闻到教育和艺术。这些工具使用算法从大量培训材料中获取新的文本、音频或图像。虽然 ChatGPT 和 Midjourney 之类的工具可以用来实现超出人类能力或想象力的艺术效果，但目前它们最常用于比人类更轻松…...

编程日记 2024/1/9 7:48:10

安全防御之漏洞扫描技术

每年都有数以千计的网络安全漏洞被发现和公布，加上攻击者手段的不断变化，网络安全状况也在随着安全漏洞的增加变得日益严峻。寻根溯源，绝大多数用户缺乏一套完整、有效的漏洞管理工作流程，未能落实定期评估与漏洞修补工作。只有比…...

编程日记 2024/1/9 7:47:09

SPON世邦 IP网络对讲广播系统多处文件上传漏洞复现

0x01 产品简介 SPON世邦IP网络对讲广播系统是一种先进的通信解决方案，旨在提供高效的网络对讲和广播功能。 0x02 漏洞概述 SPON世邦IP网络对讲广播系统 addscenedata.php、uploadjson.php、my_parser.php等接口处存在任意文件上传漏洞，未经身份验证的攻击者可利用此漏洞上…...

编程日记 2024/1/9 7:46:08

Python综合数据分析_RFM用户分层模型

文章目录 1.数据加载2.查看数据情况3.数据合并及填充4.查看特征字段之间相关性5.聚合操作6.时间维度上看销售额7.计算用户RFM8.数据保存存储(1).to_csv(1).to_pickle 1.数据加载 import pandas as pd dataset pd.read_csv(SupplyChain.csv, encodingunicode_escape) dataset2…...

编程日记 2024/1/9 7:44:06

【C++进阶04】STL中map、set、multimap、multiset的介绍及使用

一、关联式容器 vector/list/deque… 这些容器统称为序列式容器因为其底层为线性序列的数据结构里面存储的是元素本身 map/set… 这些容器统称为关联式容器关联式容器也是用来存储数据的与序列式容器不同的是其里面存储的是<key, value>结构的键值对在数据检索时…...

编程日记 2024/1/9 7:43:05

在 Linux 中开启 Flask 项目持续运行

在 Linux 中开启 Flask 项目持续运行在部署 Flask 项目时，情况往往并不是那么理想。默认情况下，关闭 SSH 终端后，Flask 服务就停止了。这时，您需要找到一种方法在 Linux 服务器上实现持续运行 Flask 项目，并在服务器…...

编程日记 2024/1/9 7:40:03

考研个人经验总结【心理向】

客官你好首先，不管你是以何种原因来到这篇博客，以下内容或多或少可能带给你一些启发。如果你还是大二or大三学生，有考研的打算，不妨提前了解一些考研必备的心理战术，有时候并不是你知识学得不好，而是思维…...

编程日记 2024/1/9 7:38:01

如何在CentOS安装SQL Server数据库并通过内网穿透工具实现公网访问

文章目录前言1. 安装sql server2. 局域网测试连接3. 安装cpolar内网穿透4. 将sqlserver映射到公网5. 公网远程连接6.固定连接公网地址7.使用固定公网地址连接前言简单几步实现在Linux centos环境下安装部署sql server数据库，并结合cpolar内网穿透工具&#xff0…...

编程日记 2024/1/9 7:37:01

jupyter内核错误

1、在dos窗口输入以下命令激活环境：anaconda activate 【py环境名，比如py37】（目的是新家你一个虚拟环境） 2、在虚拟环境py37下安装jupyter notebook，命令：pip install jupyter notebook 3、安装ipykerne…...

编程日记 2024/1/9 7:36:00

设计模式的艺术P1基础—2.3 类之间的关系

设计模式的艺术P1基础—2.3 类之间的关系在软件系统中，类并不是孤立存在的，类与类之间存在各种关系。对于不同类型的关系，UML提供了不同的表示方式 1．关联关系关联（Association）关系是类与类之间最常用…...

编程日记 2024/1/9 7:32:56

工业无人机行业研究：预计2025年将达到108.2亿美元

近年来，在技术进步和各行各业对无人驾驶飞行器 (UAV) 不断增长的需求的推动下，工业无人机市场一直在快速增长。该市场有望在未来几年继续其增长轨迹，许多关键趋势和因素推动其发展。在全球范围内，工业无人机市场预计到 2025 年将…...

编程日记 2024/1/9 7:30:55

PCA主成分分析算法

在数据分析中，如果特征太多，或者特征之间的相关性太高，通常可以用PCA来进行降维。比如通过对原有10个特征的线性组合, 我们找出3个主成分，就足以解释绝大多数的方差，该算法在高维数据集中被广泛应用。算法&#xff08…...

编程日记 2024/1/9 7:25:51

leetcodeSQL解题：3564. 季节性销售分析

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2025/10/5 19:58:27

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

JVM暂停（Stop-The-World，STW）的完整原因分类及对应排查方案，结合JVM运行机制和常见故障场景整理而成：一、GC相关暂停 1. 安全点（Safepoint）阻塞现象：JVM暂停但无GC日志，日志显示No GCs detected。原因：JVM等待所有线程进入安全点（如…...

编程新知 2026/2/7 11:25:15

C#学习第29天：表达式树（Expression Trees）

目录什么是表达式树？ 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持： 3.性能优化 4.元数据处理 5.代码转换和重写适用场景代码复杂性…...

编程新知 2025/10/20 9:03:01

比较数据迁移后MySQL数据库和OceanBase数据仓库中的表

设计一个MySQL数据库和OceanBase数据仓库的表数据比较的详细程序流程，两张表是相同的结构，都有整型主键id字段，需要每次从数据库分批取得2000条数据，用于比较，比较操作的同时可以再取2000条数据，等上一次比较完成之后，开始比较，直到比较完所有的数据。比较操作需要比较…...

编程新知 2025/9/14 5:35:46

【 java 虚拟机知识第一篇】

目录 1.内存模型 1.1.JVM内存模型的介绍 1.2.堆和栈的区别 1.3.栈的存储细节 1.4.堆的部分 1.5.程序计数器的作用 1.6.方法区的内容 1.7.字符串池 1.8.引用类型 1.9.内存泄漏与内存溢出 1.10.会出现内存溢出的结构 1.内存模型 1.1.JVM内存模型的介绍内存模型主要分…...

编程新知 2026/1/31 8:12:12

给网站添加live2d看板娘

给网站添加live2d看板娘参考文献： stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言网站环境如下，文章也主…...

编程新知 2026/2/1 4:23:19

【Elasticsearch】Elasticsearch 在大数据生态圈的地位实践经验

Elasticsearch 在大数据生态圈的地位 & 实践经验 1.Elasticsearch 的优势1.1 Elasticsearch 解决的核心问题1.1.1 传统方案的短板1.1.2 Elasticsearch 的解决方案 1.2 与大数据组件的对比优势1.3 关键优势技术支撑1.4 Elasticsearch 的竞品1.4.1 全文搜索领域1.4.2 日志分析…...

编程新知 2025/11/9 21:54:26