当前位置：首页 > news >正文

生活垃圾数据集（YOLO版）

news 2025/7/13 15:31:40

文章目录

1、数据集介绍
- 1.1、数据集图片组成
- 2.1、获取数据集方式
2、扩展代码
- 2.1、文件结构树
- 2.2、划分数据集
- 2.3、获取数据集文件名字
- 2.4、文件成功对应检测
3、其他文章

1、数据集介绍

1.1、数据集图片组成

【有害垃圾】：电池（1 号、2 号、5 号）、过期药品或内包装等；
【可回收垃圾】：易拉罐、小号矿泉水瓶；
【厨余垃圾】：小土豆、切过的白萝卜、胡萝卜，尺寸为电池大小；
【其他垃圾】：瓷片、鹅卵石（小土豆大小）、砖块等。

部分类别图片展示：

文件结构：

----ImageSet\|----classes.txt  # 标签种类|----data-txt\  # 数据集文件集合|    |----test.txt|    |----train.txt|    |----val.txt|----images\ # 数据集图片|    |----test\|    |    |----fimg_23.jpg|    |    |----fimg_38.jpg|    |    |----.....|    |----train\|    |    |----fimg_1.jpg|    |    |----fimg_2.jpg|    |    |----.....|    |----val\|    |    |----fimg_4.jpg|    |    |----fimg_6.jpg|    |    |----.....|----labels\  # yolo标签|    |----test\|    |    |----fimg_23.txt|    |    |----fimg_38.txt|    |    |----.....|    |----train\|    |    |----fimg_1.txt|    |    |----fimg_2.txt|    |    |----.....|    |----val\|    |    |----fimg_4.txt|    |    |----fimg_6.txt|    |    |----.....

2.1、获取数据集方式

点击这里：下载本文生活垃圾数据集

2、扩展代码

2.1、文件结构树

draw-tree.py

from pathlib import Path
import ostree_str = ''
def generate_tree(pathname, n=0):global tree_strif pathname.is_file():tree_str += '    |' * n + '-' * 4 + pathname.name + '\n'elif pathname.is_dir():tree_str += '    |' * n + '-' * 4 + \str(pathname.relative_to(pathname.parent)) + '\\' + '\n'for cp in pathname.iterdir():generate_tree(cp, n + 1)if __name__ == '__main__':path=os.getcwd()+'/ImageSet'  # 查看当前ImageSet目录下的文件树generate_tree(Path(path), 0)print(tree_str)

2.2、划分数据集

split-data.py

import os, shutil, random
from tqdm import tqdm"""
标注文件是yolo格式（txt文件）
训练集：验证集：测试集 （7：2：1） 
"""def split_img(current_path,img_path, label_path, split_list):try:Data = current_path+'/ImageSets'# Data是你要将要创建的文件夹路径（路径一定是相对于你当前的这个脚本而言的）# os.mkdir(Data)train_img_dir = Data + '/images/train'val_img_dir = Data + '/images/val'test_img_dir = Data + '/images/test'train_label_dir = Data + '/labels/train'val_label_dir = Data + '/labels/val'test_label_dir = Data + '/labels/test'# 创建文件夹os.makedirs(train_img_dir)os.makedirs(train_label_dir)os.makedirs(val_img_dir)os.makedirs(val_label_dir)os.makedirs(test_img_dir)os.makedirs(test_label_dir)except:print('文件目录已存在')train, val, test = split_listall_img = os.listdir(img_path)all_img_path = [os.path.join(img_path, img) for img in all_img]train_img = random.sample(all_img_path, int(train * len(all_img_path)))train_img_copy = [os.path.join(train_img_dir, img.split('\\')[-1]) for img in train_img]train_label = [toLabelPath(img, label_path) for img in train_img]train_label_copy = [os.path.join(train_label_dir, label.split('\\')[-1]) for label in train_label]for i in tqdm(range(len(train_img)), desc='train ', ncols=80, unit='img'):_copy(train_img[i], train_img_dir)_copy(train_label[i], train_label_dir)all_img_path.remove(train_img[i])val_img = random.sample(all_img_path, int(val / (val + test) * len(all_img_path)))val_label = [toLabelPath(img, label_path) for img in val_img]for i in tqdm(range(len(val_img)), desc='val ', ncols=80, unit='img'):_copy(val_img[i], val_img_dir)_copy(val_label[i], val_label_dir)all_img_path.remove(val_img[i])test_img = all_img_pathtest_label = [toLabelPath(img, label_path) for img in test_img]for i in tqdm(range(len(test_img)), desc='test ', ncols=80, unit='img'):_copy(test_img[i], test_img_dir)_copy(test_label[i], test_label_dir)def _copy(from_path, to_path):shutil.copy(from_path, to_path)def toLabelPath(img_path, label_path):img = img_path.split('\\')[-1]label = img.split('.jpg')[0] + '.txt'return os.path.join(label_path, label)if __name__ == '__main__':current_path=os.current_path()img_path = current_path+'/images'  # 你的图片存放的路径（路径一定是相对于你当前的这个脚本文件而言的）label_path = current_path+'/labels'  # 你的txt文件存放的路径（路径一定是相对于你当前的这个脚本文件而言的）split_list = [0.7, 0.2, 0.1]  # 数据集划分比例[train:val:test]split_img(current_path,img_path, label_path, split_list)

2.3、获取数据集文件名字

list_name.py

import os"""
整体目录
----ImageSets\|----images\    |    |----test\ |    |----train\|    |----val\  |----labels\    |    |----test\ |    |----train\|    |----val\ 
"""def generate(current_path):# 存放图片的路径 这里images下面分别有train,test和val文件夹for item in os.listdir(current_path):files_path=current_path+'/'+itemfiles = os.listdir(files_path) # 全部的图片名称files.sort()print'****************'print'input :', itemprint'start...'# 打开train.txtitem_txt='ImageSets/data-txt/'+item+'.txt'listText = open(item_txt, 'a')for file in files:# 具体图片存放路径,如 data/images/train/1.jpgname = 'data/images/'+item+'/'+file + '\n'listText.write(name)listText.close()print'down!'print'****************'if __name__ == '__main__':current_path=os.getcwd()+'/ImageSets/images' # # 查看当前ImageSet\images目录下各个文件的名字generate(current_path)

2.4、文件成功对应检测

del-error-files.py用于获取数据集文件后，检测images文件和labels文件是否都一一对应上。

创建.py文件放在mages文件和labels同目录下运行

import oscurrentPath=os.getcwd()
currentPath=currentPath
print(currentPath)
labelArray=[]
imagesArray=[]def split_extension(fileName):return fileName.split('.')[0]print('自检程序启动！查找到labels目录下异常文件：')
error_label_names = []
for la_name in os.listdir('labels'):la_name = split_extension(la_name)is_exists = Falsefor im_name in os.listdir('images'):im_name = split_extension(im_name)if la_name == im_name:is_exists = Trueif not is_exists:error_la_name = la_name + '.txt'error_label_names.append(error_la_name)labelArray.append(error_la_name)print(error_la_name)print('自检程序启动！查找到images目录下异常文件：')
error_image_names = []
for im_name in os.listdir('images'):im_name = split_extension(im_name)is_exists = Falsefor la_name in os.listdir('labels'):la_name = split_extension(la_name)if la_name == im_name:is_exists = Trueif not is_exists:error_im_name = im_name + '.jpg'error_image_names.append(error_im_name)print(error_im_name)imagesArray.append(error_im_name)# 自动删除文件
def delLabels():for item in labelArray:labelPath=currentPath+'/labels/'+itemos.remove(labelPath)print(labelPath+'\t'+'删除成功')def delImages():for item in imagesArray:imagesPath=currentPath+'/images/'+itemos.remove(imagesPath)print(imagesPath+'\t'+'删除成功') if __name__ == '__main__':delLabels()delImages()

3、其他文章

双向控制舵机（树莓派版）
YOLOv5s网络模型讲解(一看就会)

参考文献

【yolo训练数据集】标注好的垃圾分类数据集共享
基于YOLOv8分割模型实现垃圾识别
TACO垃圾图像数据集

生活垃圾数据集（YOLO版）

文章目录 1、数据集介绍1.1、数据集图片组成2.1、获取数据集方式 2、扩展代码2.1、文件结构树2.2、划分数据集2.3、获取数据集文件名字2.4、文件成功对应检测 3、其他文章 1、数据集介绍 1.1、数据集图片组成【有害垃圾】：电池（1 号、2 号、5 号&…...

编程日记 2023/9/23 18:16:36

操作系统篇之虚拟内存

虚拟内存是什么? 虚拟内存是计算机操作系统中的一种技术，它将每个进程的内存空间划分成若干个固定大小的页，并通过页面映射技术将这些页与物理内存或磁盘上的页面文件进行交换虚拟内存能干什么? 扩展了实际物理内存容量：虚拟内存使得每个…...

编程日记 2023/9/23 18:14:34

浅谈SpringMVC的请求流程

目录标题浅谈SpringMVC的请求流程SpringMVC的介绍SpringMVC的逻辑概念运行图解知识总结浅谈SpringMVC的请求流程对于SpringMVC而言重点是了解它的底层运行逻辑，从而可以根据其逻辑来进行实际业务的操作或者是利用原理增强业务的功能性，最终达到项目预…...

编程日记 2023/9/23 18:13:33

2309json.nlohmann数格示例1

参考示例下面是一些示例,可让你了解如何使用该类. 除了以下示例之外,你可能还需要: ->检查文档 ->浏览独立示例文件每个API函数(记录在API文档中)都有相应独立示例文件.如,emplace()函数有一个匹配的emplace.cpp示例文件. 从文件中读取JSON json类提供了操作JSON…...

编程日记 2023/9/23 18:11:31

你知道 delete 删除属性时的一些细节吗？

探究 delete 的一些细节，起源于刚刚做过的一道笔试，原题如下： a 1; const b 2; console.log(delete a); console.log(delete b); // 输出结果是？ // 答：true false我可从来没用过 delete 的返回值，但凡…...

编程日记 2023/9/23 18:09:28

Blender入门——快捷键

视角控制旋转视角：鼠标中键摁住即可旋转平移视角：shift中远近视角：中键滚动物体控制移动物体：G旋转物体:R缩放物体：S回复变换：AltG,R,S新建物体：shiftA复制物体：shiftD删除物体&a…...

编程日记 2023/9/23 18:08:27

实例讲解Spring boot动态切换数据源

前言在公司的系统里，由于数据量较大，所以配置了多个数据源，它会根据用户所在的地区去查询那一个数据库，这样就产生了动态切换数据源的场景。今天，就模拟一下在主库查询订单信息查询不到的时候，切换数据…...

编程日记 2023/9/23 18:05:22

调整网络时需要注意的事项

这段时间调整网络，涉及的计算机多，Vlan也多，不小心的动作会给自己造成很大的麻烦，因为毕竟我也只是一个网络的初学者，平时虽然是网管，只是作为一项普通的工作。准备工作做得不细致，可能出现的问…...

编程日记 2023/9/23 17:59:14

OpenCV自学笔记二十二：绘图及交互

一、绘图基础下面是关于OpenCV绘图基础函数的说明和举例： 1. cv2.line()：绘制直线 cv2.line(img, pt1, pt2, color, thickness, lineType) - img: 需要绘制直线的图像。 - pt1: 直线起始点坐标。 - pt2: 直线结束点坐标。 - color: 直线颜色&…...

编程日记 2023/9/23 17:53:08

【自学开发之旅】Flask-会话保持-API授权-注册登录

http - 无状态-无法记录是否已经登陆过 #会话保持 – session cookie session – 保存一些在服务端 cookie – 保存一些数据在客户端 session在单独服务器D上保存，前面数个服务器A,B,C上去取就好了，业务解耦。—》》现在都是基于token的验证。以上是基…...

编程日记 2023/9/23 17:52:07

数据结构与算法--排序算法复习

目录 1.三种常见的简单排序： 1.1冒泡排序 1.2 选择排序 1.3 插⼊排序 2 常见高级排序算法 2.1 希尔排序 2.2 快速排序 2.3 归并排序 2.4计数排序先上结论： 1.三种常见的简单排序： 1.1冒泡排序 1.⾸先在未排序数组的⾸位开始&#…...

编程日记 2023/9/23 17:49:04

python随手小练1

题目： 使用python做一个简单的英雄联盟商城登录界面具体操作： print("英雄联盟商城登录界面") print("~ * "*15 "~") #找其规律 a "1、用户登录" b "2、新用户注册" c "3、退出系统&quo…...

编程日记 2023/9/23 17:48:04

gym_unity学习笔记

最近学了一段时间gym_unity，把一些资料留在这里实例实例gym_unity训练RollerBall：https://blog.csdn.net/alibutter/article/details/120908687实例gyn_unity训练3DBall：https://zhuanlan.zhihu.com/p/554927641?utm_id0 源码&#xff1…...

编程日记 2023/9/23 17:47:03

（三十）大数据实战——HBase集成部署安装Phoenix

前言 Phoenix 是一个开源的分布式关系型数据库查询引擎，它基于 Apache HBase构建。它提供了在 Hadoop 生态系统中使用 SQL查询和事务处理的能力。本节内容我们主要介绍一下Hbase如何集成部署安装Phoenix服务工具，并集成hive框架，能够快速、灵…...

编程日记 2023/9/23 17:45:01

【Python基础】S01E03 元组

P01S03 元组定义元组元组无法修改定义一个元素的元素修改元组变量方案一：关联新元组方案二：转换为列表列表是可修改的，对于处理网站的用户列表或游戏中的角色列表至关重要。然而我们有时候需要创建一系列不可修改的元素，元组可…...

编程日记 2023/9/23 17:44:00

【算法-双指针思想】

双指针思想双指针法（快慢指针法）： 通过一个快指针和慢指针在一个for循环下完成两个for循环的工作。定义快慢指针快指针： 寻找新数组的元素 ，新数组就是不含有目标元素的数组慢指针： 指向更新新数组下…...

编程日记 2023/9/23 17:42:58

uni-app实现点击复制按钮复制内容

注意:uni.setClipboardData({})里面的data参数必须是字符串类型这个是大坑第一种 <view>{{orderId}}</view> //复制的内容 <button click"copy(orderId)">复制</button>copy(value) {uni.setClipboardData({data: value , // 这里是个坑接…...

编程日记 2023/9/23 17:38:53

Qt5开发及实例V2.0-第十四章-Qt多国语言国际化

Qt5开发及实例V2.0-第十四章-Qt多国语言国际化第14章 Qt 5多国语言国际化14.1 基本概念14.1.1 国际化支持的实现14.1.2 翻译工作：“*.qm”文件的生成 14.2 【实例】14.2.1 简单测试14.2.2 选择语言翻译文字本章相关例程源码下载1.Qt5开发及实例_CH1401.rar 下载2.…...

编程日记 2023/9/23 17:35:48

嵌入式网络接口之MAC芯片与PHY芯片

目录 0. 参考文档 1.嵌入式网络接口简介 2.嵌入式网络硬件架构方案 2.1 SOC内未集成MAC芯片 2.2 SOC内集成MAC芯片 2.3 主流方案总结 2.3 参照实际网卡的说明 3.MII/RMII及MDIO接口 3.1 MII 3.2 RMII 3.3 MDIO 0. 参考文档网卡构造：MAC与PHY的关系&…...

编程日记 2023/9/23 17:32:43

在华为云服务器上CentOS 7安装单机版Redis

https://redis.io/是官网地址。点击右上角的Download。可以进入https://redis.io/download/——Redis官网下载最新版的网址。然后在https://redis.io/download/页面往下拉，点击下图超链接这里。进入https://download.redis.io/releases/下载自己需要的安装…...

编程日记 2023/9/23 17:31:42

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2025/7/13 11:48:47

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/7/5 18:26:46

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章参考资料源码： https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

编程新知 2025/7/13 5:17:50

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2025/7/12 22:29:30

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2025/7/11 23:03:05

Hive 存储格式深度解析：从 TextFile 到 ORC，如何选对数据存储方案？

在大数据处理领域，Hive 作为 Hadoop 生态中重要的数据仓库工具，其存储格式的选择直接影响数据存储成本、查询效率和计算资源消耗。面对 TextFile、SequenceFile、Parquet、RCFile、ORC 等多种存储格式，很多开发者常常陷入选择困境。本文将从底…...

编程新知 2025/6/23 2:50:47

【Java学习笔记】BigInteger 和 BigDecimal 类

BigInteger 和 BigDecimal 类二者共有的常见方法方法功能add加subtract减multiply乘divide除注意点：传参类型必须是类对象一、BigInteger 1. 作用：适合保存比较大的整型数 2. 使用说明创建BigInteger对象传入字符串 3. 代码示例 import j…...

编程新知 2025/6/21 16:56:20