当前位置：首页 > news >正文

Python移动未标注的图片数据集

news 文章来源：https://blog.csdn.net/FriendshipTang/article/details/135021344 2025/4/26 19:34:18

Python移动未标注的图片数据集

前言
前提条件
相关介绍
实验环境
Python移动未标注的图片数据集
- 情况一：有图，无标注文件
- - 代码实现
  - 输出结果
- 情况二：有图，有标注文件，但标注信息为空
- - 代码实现
  - 输出结果
- 情况一与情况二同时都考虑
- - 代码实现
  - 输出结果
- 拓展：移动有标注文件却无对应图片的标注文件
- - 代码实现
  - 输出结果

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

熟悉Python

实验环境

Python 3.x （面向对象的高级语言）

Python移动未标注的图片数据集

情况一：有图，无标注文件

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'# 情况一：有图，无标注文件if not os.path.exists(in_json_path):move_img_no_json(in_img_path,output_dir)

输出结果

在这里插入图片描述

情况二：有图，有标注文件，但标注信息为空

在这里插入图片描述

{"version": "5.2.0.post4","flags": {},"shapes": [],"imagePath": "flower.png","imageData": null,"imageHeight": 394,"imageWidth": 850
}

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'if not os.path.exists(in_json_path):passelse:# 情况二：有图，有标注文件，但标注信息为空if is_null_info_in_json(in_json_path):move_img_and_json(in_img_path,in_json_path,output_dir)

输出结果

在这里插入图片描述

情况一与情况二同时都考虑

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'# 情况一：有图，无标注文件if not os.path.exists(in_json_path):move_img_no_json(in_img_path,output_dir)else:# 情况二：有图，有标注文件，但标注信息为空if is_null_info_in_json(in_json_path):move_img_and_json(in_img_path,in_json_path,output_dir)

输出结果

在这里插入图片描述

拓展：移动有标注文件却无对应图片的标注文件

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)def move_json_no_img(in_json_path,output_dir):'''移动有标注文件却无对应图片的标注文件'''shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for json_name in json_name_list:in_img_path = in_img_dir + json_name[:-5] + '.png'in_json_path = in_json_dir + json_name# 移动有标注文件却无对应图片的标注文件if not os.path.exists(in_img_path):move_json_no_img(in_json_path,output_dir)

输出结果

在这里插入图片描述

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

Python移动未标注的图片数据集

Python移动未标注的图片数据集前言前提条件相关介绍实验环境Python移动未标注的图片数据集情况一：有图，无标注文件代码实现输出结果情况二：有图，有标注文件，但标注信息为空代码实现输出结果情况一与情况二同时都考虑…...

编程日记 2023/12/16 0:34:04

判断css文字发生了截断，增加悬浮提示

示例： 固定显示宽度，溢出显示...，利用了css的属性，想要实现成下面这样： 针对溢出的文字，hover显示全部。提示很好加，使用tooltip组件就行了，难点是如何判断是否发生了文字溢出。…...

编程日记 2023/12/16 0:33:03

day33-37-SpringBootV12(整合Spring,SpringMVC,Mybatis,日志,api测试等框架)

ssm spring --> applicationContext.xml配置文件 springmvc --> springmvc.xml配置文件 mybatis —> mybatis-config.xml配置文件 —> springboot优化了之前的框架配置,思想是约定大于配置一、引言 1.1 初始化配置为了使用SSM框架去开发，准备SSM…...

编程日记 2023/12/16 0:32:02

如何处理好面试中的“压力测试”？

作为一名求职者，在面试时有时遇到的是压力测试，有时则遇到的是一些无良企业单位，究竟如何把握忍耐的限度，才合格当一个能经受压力的员工，才能避免对无良单位的一味隐忍! 压力面试是指有意制造紧张，以了解求…...

编程日记 2023/12/16 0:28:58

大数据----31.hbase安装启动

二.Hbase安装先前安装： Zookeeper 正常部署首先保证 Zookeeper 集群的正常部署，并启动之。三台机器都执行：zkServer.sh startHadoop 正常部署 Hadoop 集群的正常部署并启动。主节点上进行 ：start-all.sh 1.HBase 的获取一定…...

编程日记 2023/12/16 0:27:57

ChatGPT Plus重新开启订阅

12月14日凌晨，OpenAI首席执行官Sam Altman在社交平台宣布，终于找到了更多的GPU算力，重新开启订阅ChatGPT Plus。上个月15日，OpenAI就因为算力不足，以及用户激增等原因暂停了ChatGPT Plus订阅。 Sam表示，在…...

编程日记 2023/12/16 0:26:57

C#科学绘图之scottPlot绘制多个图像

文章目录示例移除图像图例信号图 scott系列：绘图初步示例从名字就能看出，ScottPlot的绘图函数AddScatter的作用是为图窗添加数据点，换言之，每调用一次AddScatter，就可以在图窗中添加一组图像。下面添加两个按钮&a…...

编程日记 2023/12/16 0:25:56

二百一十五、Flume——Flume拓扑结构之复制和多路复用的开发案例（亲测，附截图）

一、目的对于Flume的复制和多路复用拓扑结构，进行一个小的开发测试二、复制和多路复用拓扑结构 （一）结构含义 Flume 支持将事件流向一个或者多个目的地。 （二）结构特征这种模式可以将相同数据复制到多个channe…...

编程日记 2023/12/16 0:21:52

Leetcode—2962.统计最大元素出现至少 K 次的子数组【中等】

2023每日刷题（五十六） Leetcode—2962.统计最大元素出现至少 K 次的子数组滑动窗口算法思想参考的灵神思路实现代码 class Solution { public:long long countSubarrays(vector<int>& nums, int k) {int n nums.size();long long ans…...

编程日记 2023/12/16 0:16:48

MapReduce模拟统计每日车流量-解决方案

MapReduce模拟统计每日车流量-解决方案 1.Map阶段：将原始数据分割成若干个小块，每个小块由一个Map任务处理。Map任务将小块中的每个数据项映射成为一个键值对，其中键为时间戳，值为车流量。2.Shuffle阶段：将Map任务输出…...

编程日记 2023/12/16 0:12:44

【深度学习】强化学习（二）马尔可夫决策过程

文章目录一、强化学习问题1、交互的对象2、强化学习的基本要素3、策略（Policy）4、马尔可夫决策过程1. 基本元素2. 交互过程的表示3. 马尔可夫过程（Markov Process）4. 马尔可夫决策过程（MDP）5. 轨迹的概率计…...

编程日记 2023/12/16 0:11:44

Vue.js 使用基础知识

Vue.js 是一款用于构建用户界面的渐进式框架，它专注于视图层。Vue.js 不同于传统的 JavaScript 框架，它采用了组件化的开发方式，使得开发者可以更加高效和灵活地构建交互式的 Web 应用程序。目录什么是 Vue.js安装 Vue.jsVue 实例模板语法插…...

编程日记 2023/12/16 0:05:38

Linux---计划任务

本章主要介绍如何创建计划任务使用 at 创建计划任务使用 crontab 创建计划任务有时需要在某个指定的时间执行一个操作，此时就要使用计划任务了。计划任务有两种： 一个是at计划任务，另一个是 crontab计划任务。下面我们分别来看这两种计划…...

编程日记 2023/12/16 0:03:36

.NET微信网页开发之通过UnionID机制解决多应用用户帐号统一问题

背景随着公司微信相关业务场景的不断拓展，从最初的一个微信移动应用、然后发展成微信公众号应用、然后又有了微信小程序应用。但是随着应用的拓展，如何保证相同用户的微信用户在不同应用中登录的同一个账号呢？今天的主题就来了.NET微信网页…...

编程日记 2023/12/16 0:02:36

【docker】docker入门与安装

Docker 一、入门 Docker的主要目标是：Build, Ship and Run Any App, Anywhere，也就是通过对应用组件的封装、分发、部署、运行等生命周期的管理，使用户的APP及其运行环境能做到一次镜像,处处运行。 Docker运行速度快的原因 Docker有比虚拟…...

编程日记 2023/12/15 23:59:33

视觉学习笔记12——百度飞浆框架的PaddleOCR 安装、标注、训练以及测试

系列文章目录虚拟环境部署参考博客1 参考博客2 参考博客3 参考博客4 文章目录系列文章目录一、简单介绍1.OCR介绍2.PaddleOCR介绍二、安装1.anaconda基础环境1）anaconda的基本操作2）搭建飞浆的基础环境 2.安装paddlepaddle-gpu版本1）安装…...

编程日记 2023/12/15 23:56:31

深入分析ClassLocader工作机制

文章目录一、ClassLoader简介1. 概念2. ClassLoader类结构分析二、ClassLoader的双亲委派机制三、Class文件的加载流程1. 简介2. 加载字节码到内存3. 验证与解析4. 初始化Class对象四、常见加载类错误分析1. ClassNotFoundException2. NoClassDefFoundError3. UnsatisfiledL…...

编程日记 2023/12/15 23:52:27

算法通关村第十二关—字符串转换(青铜)

一、转换成小写字母 LeetCode709.给你一个字符串s，将该字符串中的大写字母转换成相同的小写字母，返回新的字符串。示例1： 输入：s"Hello" 输出："hello" 示例2： 输入：s&qu…...

编程日记 2023/12/15 23:49:25

C#基础与进阶扩展合集-基础篇（持续更新）

目录本文分两篇，进阶篇点击：C#基础与进阶扩展合集-进阶篇一、基础入门 Ⅰ 关键字 Ⅱ 特性 Ⅲ 常见异常 Ⅳ 基础扩展 1、哈希表 2、扩展方法 3、自定义集合与索引器 4、迭代器与分部类 5、yield return 6、注册表 7、不安全代码 8、方法…...

编程日记 2023/12/15 23:47:23

ReactJs笔记摘录

文章目录前言目录结构组件动态组件高阶组件 Hook函数useStateuseEffectuseContextuseReduceruseCallbackuseMemo JSX语法根元素与斜杠使用变量推荐使用className替代class属性写法三元表达式 vs &&antd和tailwindcss 组件通信父传子：props和自定义函数事件…...

编程日记 2023/12/15 23:44:19

2023 re:Invent使用 PartyRock 和 Amazon Bedrock 安全高效构建 AI 应用程序

前言本篇文章授权活动官方亚马逊云科技文章转发、改写权，包括不限于在亚马逊云科技开发者社区, 知乎，自媒体平台，第三方开发者媒体等亚马逊云科技官方渠道 “Your Data, Your AI, Your Future.（你的数据，你的AI&…...

编程日记 2023/12/15 23:43:19

Mac 打不开github解决方案

序言 github 时有打不开的情况，为此很是烦恼，这里分享一下如何解决这种问题，其实问题的本质是在访问github网页时无法通过github.com的二级域名进行动态域名解析。解决方案手动配置静态文件hosts，将该域名和IP的映射关系添加…...

编程日记 2023/12/15 23:42:17

十五动手学深度学习v2计算机视觉 ——全连接神经网络FCN

文章目录 FCN FCN 全卷积网络先使用卷积神经网络抽取图像特征，然后通过卷积层将通道数变换为类别个数，最后通过转置卷积层将特征图的高和宽变换为输入图像的尺寸。因此，模型输出与输入图像的高和宽相同，且最终输出通道包含了该空…...

编程日记 2023/12/15 23:40:15

elementUI中的 “this.$confirm“ 基本用法，“this.$confirm“ 调换 “确认“、“取消“ 按钮的位置

文章目录前言具体操作总结前言 elementUI中的 "this.$confirm" 基本用法，"this.$confirm" 调换 "确认"、"取消" 按钮的位置具体操作基本用法 <script> this.$confirm(这是数据（res.data&#xff0…...

编程日记 2023/12/15 23:38:13

K8S 常用命令

获取所有的pod资源： kubectl get pod 获取所有的命名空间： kubectl get namespace 获取所有的Deployment资源： kubectl get deployment 删除指定的deploy: kubectl delete deploy nginx 获取所有的服务： kubectl get serv…...

编程日记 2023/12/15 23:36:11

12.使用 Redis 优化登陆模块

目录 1. 使用 Redis 优化登陆模块 1.1 使用 Redis 存储验证码 1.2 使用 Redis 存储登录凭证 1.3 使用 Redis 缓存用户信息 1. 使用 Redis 优化登陆模块使用 Redis 存储验证码：验证码需要频繁的访问与刷新，对性能要求较高；验证码不需要永…...

编程日记 2023/12/15 23:34:09

Nacos-NacosRule 负载均衡—设置集群使本地服务优先访问

userservice: ribbon: NFLoadBalancerRuleClassName: com.alibaba.cloud.nacos.ribbon.NacosRule # 负载均衡规则 NacosRule 权重计算方法目录一、介绍二、示例（案例截图） 三、总结一、介绍 NacosRule是AlibabaNacos自己实现的一个负载均衡策略&…...

编程日记 2023/12/15 23:32:07

软件设计师——信息安全（二）

📑前言本文主要是【信息安全】——软件设计师——信息安全的文章，如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介：大家好，我是听风与他🥇 ☁️博客首页：CSDN主页听风与他 &#x1f304…...

编程日记 2023/12/15 23:30:05

Unity中实现ShaderToy卡通火（原理实现篇）

文章目录前言一、我们在片元着色器中，实现卡通火的大体框架1、使用 noise 和 _CUTOFF 判断作为显示火焰的区域2、_CUTOFF ： 用于裁剪噪波范围的三角形3、noise getNoise(uv, t); : 噪波函数二、顺着大体框架依次解析具体实现的功能1、 uv.x * 4.0; : …...

编程日记 2023/12/15 23:29:04

引迈信息-JNPF平台怎么样？值得入手吗？

目录 1.前言 2.引迈低代码怎么样？ 3.平台亮点展示 4.引迈产品特点 5.引迈产品技术栈： 1.前言低代码是近几年比较火的一种应用程序快速开发方式，它能帮助用户在开发软件的过程中大幅减少手工编码量，并通过可视化组件加速应用…...

编程日记 2023/12/15 23:28:03

Python移动未标注的图片数据集

前言

前提条件

相关介绍

实验环境

Python移动未标注的图片数据集

情况一：有图，无标注文件

代码实现

输出结果

情况二：有图，有标注文件，但标注信息为空

代码实现

输出结果

情况一与情况二同时都考虑

代码实现

输出结果

拓展：移动有标注文件却无对应图片的标注文件

代码实现

输出结果

相关文章：