当前位置: 首页 > news >正文

苹果瑕疵数据集苹果质量数据集YOLO格式VOC格式 深度学习 目标检测 数据集

 一、数据集概述

数据集名称:2类苹果图像数据集

   数据集包含两类样本:正常苹果和有瑕疵的苹果。正常苹果样本代表完好的苹果,而有瑕疵的苹果样本代表苹果表面可能存在的损伤、瑕疵或病害。每个样本都经过详细标记和描述,以便训练模型或算法来识别和分类这些不同状态的苹果。

1.1可能应用的领域

  • 农业生产: 农民和果园管理者可以利用这个数据集开发苹果瑕疵检测系统,帮助他们及时发现和处理有瑕疵的苹果,提高果品质量和产量。

  • 食品加工: 食品加工企业可以利用这一数据集中的技术,对苹果进行自动检测和筛选,确保生产过程中使用的苹果符合质量标准。

  • 质量控制: 这个数据集可以用于苹果质量控制领域,帮助企业监测生产线上的苹果瑕疵情况,确保产品质量符合标准。

 1.2数据采集

  • 确定苹果分类数据集的范围和目标,包含多样的目标类别、尺寸和姿态变化,丰富的背景变化,标注精准度,数据平衡性,多样性的数据增强,数据质量控制。
  • 准备采集设备,包括相机、照明设备和标注工具。确保图像清晰度高,苹果特征准确可见。

1.3数据集包含的分类

    包含697张苹果图片,数据集中包含以下几种类别

  • 正常苹果:用于模型学习识别和分类健康的苹果。
  • 有瑕疵的苹果:用于模型学习识别苹果表面的损坏、瑕疵或其他质量问题。

二、数据标注

  2.1手动标注数据集  

  构建苹果瑕疵识别分类数据集是一项繁重而复杂的任务,涉及苹果和受损苹果两种分类的标注。受损苹果可能包括各种瑕疵,如划痕、碰伤等,这些细微差别增加了标注工作的复杂度和工作量。标注人员需要投入大量时间和精力,精确标注每个苹果的状态和类别,以捕捉瑕疵的特征和准确位置。通过使用 LabelImg 逐一标注图像,确保每个苹果和瑕疵都被准确标注,以保证数据集的准确性和完整性,为苹果瑕疵识别算法的训练和改进奠定基础。

2.2 数据集结构

  在使用深度学习进行训练任务时,通常需要将数据集划分为训练集、验证集和测试集。这种划分是为了评估模型的性能并确保模型的泛化能力。数据集划分为训练集、验证集和测试集的比例。常见的比例为 70% 训练集、20% 验证集和 10% 测试集,也就是7:2:1。数据集已经按照标准比例进行划分。

标注格式:

  • VOC格式 (XML)
  • YOLO格式 (TXT)
yolo_dataset/
│
├── train/
│   ├── images/
│   │   ├── image1.jpg
│   │   ├── image2.jpg
│   │   ├── ...
│   │
│   └── labels/
│       ├── image1.txt
│       ├── image2.txt
│       ├── ...
│
└── test...
└── valid...voc_dataset/
│
├── train/
│   ├───├
│   │   ├── image1.xml
│   │   ├── image2.xml
│   │   ├── ...
│   │
│   └───├
│       ├── image1.jpg
│       ├── image2.jpg
│       ├── ...
│
└── test...
└── valid...

三、使用指南

步骤介绍

  • 数据预处理

    • 加载瑕疵苹果数据集,包括图像和相应的标注信息(瑕疵苹果的类别和边界框信息)。对图像数据进行预处理,如调整大小、归一化、数据增强等操作。
import os
import cv2def load_dataset(data_dir):images = []annotations = []for file in os.listdir(data_dir):if file.endswith('.jpg'):image_path = os.path.join(data_dir, file)annotation_path = os.path.join(data_dir, file.replace('.jpg', '.txt'))if os.path.exists(annotation_path):# 读取图像image = cv2.imread(image_path)images.append(image)# 读取标注文件with open(annotation_path, 'r') as f:lines = f.readlines()annotation = []for line in lines:# 假设标注文件格式为:类别 x_min y_min x_max y_maxparts = line.strip().split(' ')category = parts[0]bbox = [int(parts[i]) for i in range(1, 5)]annotation.append((category, bbox))annotations.append(annotation)return images, annotations# 加载训练集数据
train_images, train_annotations = load_dataset('path_to_train_dataset_directory')# 加载测试集数据
test_images, test_annotations = load_dataset('path_to_test_dataset_directory')
  • 模型训练

    • 使用数据集对模型进行训练,通过反向传播算法更新模型参数。
    • 监控训练过程的指标,如损失值、准确率等,以便调整训练策略。
  • 模型评估

    • 使用验证集或测试集对训练好的模型进行评估,计算准确率、召回率、mAP 等指标。
  • 模型部署

    • 部署训练好的模型到生产环境中,可以使用工具如 OpenCV 或 TensorFlow Serving 进行部署。
# 模型部署代码示例
# 加载模型
model = tf.keras.models.load_model('path_to_your_trained_model')# 预处理图像
def preprocess_image(image):image = cv2.resize(image, (416, 416))  # 调整大小image = image / 255.0  # 归一化image = np.expand_dims(image, axis=0)  # 添加批次维度return image# 目标检测 API
@app.route('/detect_defective_apples', methods=['POST'])
def detect_defective_apples():if 'image' not in request.files:return jsonify({'error': 'No image uploaded'})file = request.files['image']image = cv2.imdecode(np.fromstring(file.read(), np.uint8), cv2.IMREAD_COLOR)processed_image = preprocess_image(image)# 模型推理predictions = model.predict(processed_image)# 处理模型输出# 这里假设模型输出为类别和边界框信息detected_classes = predictions['classes']detected_boxes = predictions['boxes']return jsonify({'detected_classes': detected_classes, 'detected_boxes': detected_boxes})if __name__ == '__main__':app.run(host='0.0.0.0', port=5000)  # 在 localhost 的 5000 端口运行 Flask 应用
  • 结果可视化

    • 可视化模型在测试集上的检测结果,可以将检测结果叠加在原始图像上显示。

相关文章:

苹果瑕疵数据集苹果质量数据集YOLO格式VOC格式 深度学习 目标检测 数据集

一、数据集概述 数据集名称:2类苹果图像数据集 数据集包含两类样本:正常苹果和有瑕疵的苹果。正常苹果样本代表完好的苹果,而有瑕疵的苹果样本代表苹果表面可能存在的损伤、瑕疵或病害。每个样本都经过详细标记和描述,以便训练模…...

旧电脑安装Win11提示“这台电脑当前不满足windows11系统要求”,安装中断。怎么办?

前言 最近有很多小伙伴也获取了LTSC版本的Win11镜像,很大一部分小伙伴安装这个系统也是比较顺利的。 有顺利安装完成的,肯定也有安装不顺利的。这都是很正常的事情,毕竟这个镜像对电脑硬件要求还是挺高的。 有一部分小伙伴在安装Windows11 …...

深入理解QT多线程编程

文章目录 多线程用法QThread类QtConcurrent类QFutureSynchronizer类获取线程信息线程优先级获取线程状态线程局部存储使用线程池监听线程事件Qt是一个跨平台的应用程序开发框架,广泛应用于图形用户界面(GUI)开发。它提供了强大的多线程支持,允许开发者在应用程序中创建和管理…...

React四官方文档总结一UI与交互

代码下载 React官网已经都是函数式组件文档,没有类组件文档,但是还是支持类组件这种写法。 UI 描述 组件 组件 是 React 的核心概念之一,它们是构建用户界面(UI)的基础。React 允许你将标签、CSS 和 JavaScript 组…...

如何理解 HTTP 是无状态的,以及它与 Cookie 和 Session 之间的联系

文章目录 一、什么是 HTTP?无状态的含义 二、为什么 HTTP 是无状态的?三、Cookie 和 Session 的引入1. Cookie特点:示例: 2. Session特点:示例(Java Servlet): 四、HTTP、Cookie 和 …...

OpenCV视觉分析之运动分析(2)背景减除类:BackgroundSubtractorKNN的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 K-最近邻(K-nearest neighbours, KNN)基于的背景/前景分割算法。 该类实现了如 319中所述的 K-最近邻背景减除。如果前景…...

android黑屏问题记录

近期出现了一个黑屏问题: 仪表显示,主副屏黑的 :原因背光开启太晚,导致拍照时候是黑的,太晚的原因是绘制进程出现异常导致重启延后了时间,绘制进程crash原因是hwc调用底层库卡住,需更新hwc对应的…...

SIP 业务举例之 Call Forwarding - No Answer(无应答呼叫转移)

目录 1. Call Forwarding - No Answer 简介 2. RFC5359 的 Call Forwarding - No Answer 信令流程 呼转开始 呼转完成 3. Call Forwording - No Answer 过程总结 博主wx:yuanlai45_csdn 博主qq:2777137742 想要 深入学习 5GC IMS 等通信知识(加入 51学通信),或者想要 …...

EFCore pgsql Join 查询

安装包 > Microsoft.EntityFrameworkCore 6.0.35 6.0.35> Microsoft.EntityFrameworkCore.Tools 6.0.35 6.0.35> Npgsql.EntityFrameworkCore.PostgreSQL 6.0.29 6.0.29定义实体等 using Microsoft.EntityFrameworkCore; using Micros…...

力扣80:删除有序数组中重复项

给你一个有序数组 nums ,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。 示例 1&a…...

等保测评:安全计算环境的详细讲解

安全计算环境是信息安全领域中的一个重要概念,旨在确保在计算过程中数据的机密性、完整性和可用性。随着信息技术的迅猛发展和网络攻击的日益频繁,构建安全计算环境显得尤为重要。本文将详细探讨安全计算环境的主要组成部分、特性及其在信息安全中的作用…...

[Java基础] Lambda 表达式

往期回顾 [Java基础] 基本数据类型 [Java基础] 运算符 [Java基础] 流程控制 [Java基础] 面向对象编程 [Java基础] 集合框架 [Java基础] 输入输出流 [Java基础] 异常处理机制 [Java基础] Lambda 表达式 目录 概述 Lambda 表达式的基本语法 应用场景 并发编程 集合…...

《深入掌握高德地图 API:全面调用指南与最佳实践》

本文 高德地图 API 调用指南引言高德 API 的基础设置注册和获取 API Key 基本 API 调用结构地理编码与逆地理编码地理编码(Geocoding)逆地理编码(Reverse Geocoding)注意事项 路径规划(Direction API)驾车路…...

【功能安全】系统架构设计

目录 01 系统架构介绍 02 投票逻辑架构介绍 03 SIS架构 04 ADS域控制器架构设计 01 系统架构介绍 法规GBT 34590 Part4 part10定义的软件要求、设计和测试子阶段之间的关系(其中的3-7个人建议翻译为初始架构设计更合理 ) 系统架构的作用&#xf…...

FPGA实现PCIE视频采集转USB3.0输出,基于XDMA+FT601架构,提供3套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐本博已有的PCIE方案本博已有的USB通信方案 3、PCIE基础知识扫描4、工程详细设计方案工程设计原理框图电脑端视频PCIE视频采集QT上位机XDMA配置及使用XDMA中断模块FDMA图像缓存FT601功能和硬件电路FT601读时序解读FT601写时序解读U…...

基于docker-compose编排部署微服务快速开发框架

1. 规划节点 节点规划,见表1。 表1 节点规划 IP主机名节点10.24.2.10masterdocker-compose节点 2. 基础准备 Docker和Docker Compose已安装完成,将提供的软件包Pig.tar.gz上传至master节点/root目录下并解压。 案例实施 1. 基础环境准备 &#x…...

【Java面试——并发编程——相关类和关键字——Day6】

1. Future 1.1 Future类 Future 类是异步思想的典型运用,主要用在一些需要执行耗时任务的场景,避免程序一直原地等待耗时任务执行完成,执行效率太低。具体来说是这样的:当我们执行某一耗时的任务时,可以将这个耗时任…...

Android 两种方式实现类似水波扩散效果

两种方式实现类似水波扩散效果,(相比较而言,自定义view的效果更好点,动画实现起来更方便点。) 自定义view实现动画实现 自定义view实现 思路分析:通过canvas画圆,每次改变圆半径和透明度&…...

基于SSM+小程序的垃圾分类管理系统(垃圾2)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍 基于SSM小程序的垃圾分类管理系统实现了管理员及用户。 1、管理员功能结构图,管理员功能有个人中心,管理员管理,基础数据管理、论坛管理、垃圾信息管理…...

微服务网格Istio介绍

微服务网格Istio 介绍服务注册和发现服务度量灰度发布 Istio核心特性断路器互动1:举个生活中的例子解释断路器互动2:服务降级(提高用户体验效果) 超时重试多路由规则 Istio架构istio组件详解PilotEnvoyCitadelGalleyIngressgatewa…...

Python|GIF 解析与构建(5):手搓截屏和帧率控制

目录 Python|GIF 解析与构建(5):手搓截屏和帧率控制 一、引言 二、技术实现:手搓截屏模块 2.1 核心原理 2.2 代码解析:ScreenshotData类 2.2.1 截图函数:capture_screen 三、技术实现&…...

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...

JavaScript 中的 ES|QL:利用 Apache Arrow 工具

作者:来自 Elastic Jeffrey Rengifo 学习如何将 ES|QL 与 JavaScript 的 Apache Arrow 客户端工具一起使用。 想获得 Elastic 认证吗?了解下一期 Elasticsearch Engineer 培训的时间吧! Elasticsearch 拥有众多新功能,助你为自己…...

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中,我们会遇到使用 java 调用 dll文件 的情况,此时大概率出现UnsatisfiedLinkError链接错误,原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用,结果 dll 未实现 JNI 协…...

c++ 面试题(1)-----深度优先搜索(DFS)实现

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...

【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)

升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求&#xff…...

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

回溯算法学习

一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...

华为OD机试-最短木板长度-二分法(A卷,100分)

此题是一个最大化最小值的典型例题, 因为搜索范围是有界的,上界最大木板长度补充的全部木料长度,下界最小木板长度; 即left0,right10^6; 我们可以设置一个候选值x(mid),将木板的长度全部都补充到x,如果成功…...

Python网页自动化Selenium中文文档

1. 安装 1.1. 安装 Selenium Python bindings 提供了一个简单的API,让你使用Selenium WebDriver来编写功能/校验测试。 通过Selenium Python的API,你可以非常直观的使用Selenium WebDriver的所有功能。 Selenium Python bindings 使用非常简洁方便的A…...