当前位置：首页 > news >正文

[深度学习]--分类问题的排查错误的流程

news 文章来源：https://blog.csdn.net/weixin_40293999/article/details/139740577 2025/2/6 10:39:41

原因复现：
原生的.pt 好使，转化后的 CoreML不好使，分类有问题。

yolov8 格式的支持情况

                   Format     Argument           Suffix    CPU    GPU
0                 PyTorch            -              .pt   True   True
1             TorchScript  torchscript     .torchscript   True   True
2                    ONNX         onnx            .onnx   True   True
3                OpenVINO     openvino  _openvino_model   True  False
4                TensorRT       engine          .engine  False   True
5                  CoreML       coreml       .mlpackage   True  False
6   TensorFlow SavedModel  saved_model     _saved_model   True   True
7     TensorFlow GraphDef           pb              .pb   True   True
8         TensorFlow Lite       tflite          .tflite   True  False
9     TensorFlow Edge TPU      edgetpu  _edgetpu.tflite   True  False
10          TensorFlow.js         tfjs       _web_model   True  False
11           PaddlePaddle       paddle    _paddle_model   True   True
12                   NCNN         ncnn      _ncnn_model   True   True

这里可以看到CoreML 只支持cpu，尼玛tflite也是只支持cpu的

def test_coreml():detect_weight = '/home/justin/Desktop/code/python_project/Jersey-Number/runs/detect/train64/weights/best.pt'model_detect = YOLO(detect_weight)results = model_detect(source="/home/justin/Desktop/code/python_project/Jersey-Number/zr_yz.MP4",stream=True,classes=[3])class_weight = '/home/justin/Desktop/code/python_project/Jersey-Number/runs/classify/train7/weights/best.mlpackage'class_weight = '/home/justin/Desktop/code/python_project/Jersey-Number/runs/classify/train7/weights/best.mlpackage'model_class = YOLO(class_weight)# 要使用的字体fontFace = cv2.FONT_HERSHEY_SIMPLEXfontScale = 3thickness = 1img_count = 0for result in results:img_count+=1if img_count == 6:a = 1boxes = result.boxes  # Boxes object for bounding box outputsfor box in boxes:cls = box.cls.item()conf = box.conf.item()if conf > 0.5:x1,y1,x2,y2 = box.xyxy.tolist()[0]x1,y1,x2,y2 = int(x1),int(y1),int(x2),int(y2)orig_img = result.orig_img# H,W = orig_img.orig_shapecv2.imwrite("/home/justin/Desktop/code/python_project/Jersey-Number/runs/imgs"+"{:06d}-raw.jpg".format(img_count),orig_img)cropped_image = orig_img[y1:y2,x1:x2]# res_number_class = model_class(cropped_image,save_txt=True,save=True)res_number_class = model_class(cropped_image, device = "cpu")cv2.rectangle(orig_img, (int(x1), int(y1)), (int(x2), int(y2)), (255, 0, 0), 2) for r in res_number_class:if hasattr(r,"probs"):if r.probs.top1conf.item() > 0.2:class_name = r.names[r.probs.top1](width, height), bottom = cv2.getTextSize(class_name, fontFace, fontScale=fontScale, thickness=thickness)cv2.putText(orig_img, class_name+" conf:"+str(r.probs.top1conf.item()), (x1 - width, y1-height), fontFace, fontScale, color=(0, 0, 255), thickness=thickness,lineType=cv2.LINE_AA)cv2.imwrite("/home/justin/Desktop/code/python_project/Jersey-Number/runs/imgs"+"{:06d}.jpg".format(img_count),orig_img)

报错的这句话值得看一眼：
sklearn不支持，tensorflow和torch没测试过，可能会有问题。先跑跑再说吧

Loading /home/justin/Desktop/code/python_project/Jersey-Number/runs/classify/train7/weights/best.mlpackage for CoreML inference...
scikit-learn version 1.4.2 is not supported. Minimum required version: 0.17. Maximum required version: 1.1.2. Disabling scikit-learn conversion API.
TensorFlow version 2.13.1 has not been tested with coremltools. You may run into unexpected errors. TensorFlow 2.12.0 is the most recent version that has been tested.
Torch version 2.3.0+cu121 has not been tested with coremltools. You may run into unexpected errors. Torch 2.1.0 is the most recent version that has been tested.

所以还要降级，真是麻烦，tensorflow是因为要转android侧的模型。
这里要给个参数，来指定cpu复现
res_number_class = model_class(cropped_image, device = “cpu”)

这意思是不能用pytorch 跑了吗？ @todo，然后用pytorch 2.0的环境试一下看看怎么样？@todo,
核心诉求是要把coreml的模型加载起来，看看是不是存在一样的错误

Exception has occurred: Exception
Model prediction is only supported on macOS version 10.13 or later.File "/home/justin/Desktop/code/python_project/Jersey-Number/zr_yz.py", line 76, in test_coremlres_number_class = model_class(cropped_image, device = "cpu")^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/home/justin/Desktop/code/python_project/Jersey-Number/zr_yz.py", line 88, in <module>test_coreml()
Exception: Model prediction is only supported on macOS version 10.13 or later.

detect 参数
detect_conf = 0.5172230005264282
切割位置： x1,y1,x2,y2
1. 原始位置：[1648.0953369140625, 882.2176513671875, 1682.9732666015625, 980.842041015625]
2.强制转成int 为后面切出这个区域做准备(1648, 882, 1682, 980)分类输出结果：top1:64top1conf:tensor(0.9994, device='cuda:0')top5:[64, 53, 10, 0, 20]top5conf:tensor([9.9943e-01, 4.8942e-04, 1.9284e-05, 1.8095e-05, 8.8464e-06], device='cuda:0')

垃圾

shit CoreML模型只能在mac 上跑，而且只能用CoreMl 跑么？？？ @todo???

确实只能在mac上跑
ref：
coreml的文档：
https://developer.apple.com/documentation/coreml
coremltool的文档：
https://apple.github.io/coremltools/docs-guides/
一段python代码：

import coremltools as ct
import PIL
import torch
import numpy as npdef get_x1y1x2y2(coordinate,img):width,height = img.size()center_x = int(coordinate[0] * width)center_y = int(coordinate[1] * height)img_w = int(coordinate[2]*width)img_h = int(coordinate[3]*height)return center_x, center_y, img_w, img_hdef ml_test_detect():mlmodel = ct.models.MLModel('/Users/smkj/Desktop/Code/justin/head_person_hoop_number_v8n.mlpackage')print(mlmodel)img = PIL.Image.open("/Users/smkj/Desktop/Code/justin/imgs000006-raw.jpg").resize((640,384))res = mlmodel.predict({"image":img})confidence_max_list = list(np.array(res['confidence']).argmax(axis=1))# array([0.86775684, 0.8630705 , 0.01861118, 0.09405255], dtype=float32)for row_index, class_id in enumerate(confidence_max_list):if class_id == 3:coordinate = res['coordinates'][row_index]x1,y1,x2,y2 = 555 - 12 / 2, 333  - 36 / 2, 555 + 12/2, 333 + 36/2im=img.crop((x1, y1, x2, y2))im.save("bbb.jpg")print(res)
# print(img)
def ml_test_classify():img = PIL.Image.open("/Users/smkj/Desktop/Code/justin/bbb.jpg").resize((64,64))mlmodel = ct.models.MLModel('/Users/smkj/Desktop/Code/justin/classification.mlpackage')res = mlmodel.predict({"image":img})max_key = max(res['classLabel_probs'], key=res['classLabel_probs'].get)print("class_name:",max_key, "confidence:",res['classLabel_probs'].get(max_key))a = 1
ml_test_classify()

在mac上安装opencv实在是太费劲了，各位自求多福吧！
用这个可以替代opencv： pip install pillow

在这里插入图片描述

置信度也是99.99

coreml不爽的点是必须要固定尺寸??? @todo 也许是我用惯了动态尺寸的原因。 anyway，今天调试了一天，在两个电脑上装了环境，算是搞定了。！！！

[深度学习]--分类问题的排查错误的流程

原因复现： 原生的.pt 好使， 转化后的 CoreML不好使， 分类有问题。 yolov8 格式的支持情况 Format Argument Suffix CPU GPU 0 PyTorch - .pt True True 1 Tor…...

编程日记 2024/6/21 13:40:35

微信小程序简易录音机

首先先创建一个项目（想必大家都会啦那就直接开干） 首先上html结构 <view class"wx-container"><view id"title">录音机</view><view id"time">{{hours}}:{{minute}}:{{second}}</view>&l…...

编程日记 2024/6/21 13:38:32

Ollama深度探索：AI大模型本地部署的全面教程

目录引言一、Ollama概述1、定义与定位2、核心功能3、技术优势4、应用场景二、安装与配置1、系统要求2、安装方法3、配置指南4、启动Ollama服务四、快速开始1、启动Ollama2、部署运行模型3、REEST API 五、自定义模型1、定制化的必要性2、使用Modelfile定制模型3、参数调整4、…...

编程日记 2024/6/21 13:35:29

文心一言 VS 讯飞星火 VS chatgpt （285）-- 算法导论21.2 4题

四、请给出图 21-3 所示操作序列的一个运行时间的渐近紧确界，假定使用链表表示和加权合并启发式策略。如果要写代码，请用go语言。文心一言： 图 21-3 没有直接给出，但通常这种操作序列可能与某种数据结构（如并查集或…...

编程日记 2024/6/21 13:34:28

基于springboot实现影院订票系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现影院订票系统演示摘要现代经济快节奏发展以及不断完善升级的信息化技术，让传统数据信息的管理升级为软件存储，归纳，集中处理数据信息的管理方式。本影院订票系统就是在这样的大环境下诞生，其可以帮助管理者在…...

编程日记 2024/6/21 13:31:24

Linux 常用命令合集

进入root模式 su -> 回车 -> 输入root用户密码关闭系统方法1： shutdown -h now 方法2： init 0 方法3： telinit 0按预定时间关闭系统 shutdown -h hours:minutes &取消按预定时间关闭系统 shutdown -c重启 shutdown -r now重启…...

编程日记 2024/6/21 13:30:22

Vue3插件安装

一、volar插件安装 volar：Vue文件的语法提示和高亮提醒。volar已经更名为Vue - Official，其安装步骤如下。 (1)打开vscode，点击扩展面板，在搜索窗口中输入volar，选择Vue - Official进行安装。 （2&#xff0…...

编程日记 2024/6/21 13:29:21

Redis精要

一、什么是缓存击穿、缓存穿透、缓存雪崩？ 缓存穿透【针对大量非法访问的请求，缓存中没有，直接访问DB】缓存穿透指的查询缓存和数据库中都不存在的数据，这样每次请求直接打到数据库，就好像缓存不存在一样。对于系…...

编程日记 2024/6/21 13:26:17

国产24位I2S输入+192kHz立体声DAC音频数模转换器CJC4344

CJC4344是一款立体声数模转换芯片，内含插值滤波器、multi bit数模转换器、输出模拟滤波器。CJC4344系列支持大部分的音频数据格式。CJC4344基于一个带线性模拟低通滤波器的四阶multi-bitΔ-Σ调制器，而且本芯片可以通过检测信号频率和主时钟频率&#xf…...

编程日记 2024/6/21 13:24:15

UniApp 开发微信小程序教程（一）：准备工作和环境搭建，项目结构和配置

文章目录一、准备工作和环境搭建1. 安装 HBuilderX步骤： 2. 注册微信开发者账号步骤： 3. 创建 UniApp 项目步骤： 二、项目结构和配置1. UniApp 项目结构2. 配置微信小程序修改 manifest.json修改 pages.json 3. 添加首页文件index.vue 示例&…...

编程日记 2024/6/21 13:22:12

[WTL/Win32]_[中级]_[MVP架构在实际项目中的应用]

场景在开发Windows和macOS的界面软件时，Windows用的是WTL/Win32技术，而macOS用的是Cocoa技术。而两种技术的本地语言一个主打是C,另一个却是Object-c。界面软件的源码随着项目功能增多而增多，这就会给同步Windows和macOS的功能造成很大负担…...

编程日记 2024/6/21 13:18:07

《Windows API每日一练》5.2 按键消息

上一节中我们得知，Windows系统的按键消息有很多类型，大部分按键消息都是由Windows系统的默认窗口过程处理的，我们自己只需要处理少数几个按键消息。这一节我们将详细讲述Windows系统的所有按键消息及其处理方式。本节必须掌握的知识点&…...

编程日记 2024/6/21 13:17:06

adb 截屏和录屏命令

adb 录屏命令 screenrecord 简介 screenrecord 是一个 shell 命令支持 Android 4.4(API level 19)以上支持视频格式: mp4 一些限制某些设备可能无法直接录制,原因是分辨率太高,如果遇到此类问题，请试着指定较低的分辨率不支持录制过程中屏幕旋转,如果录制…...

编程日记 2024/6/21 13:13:02

springboot相关的一些知识

SpringBoot可以同时处理多少请求 SpringBoot默认的内嵌容器是Tomcat，所以SpringBoot可以同时处理多少请求取决于Tomcat。 SpringBoot中处理请求数量相关的参数有四个： server.tomcat.thread.min-spare：最少的工作线程数，默认大小…...

编程日记 2024/6/21 13:12:01

DP：完全背包+多重背包问题

完全背包和01背包的区别就是：可以多次选一、完全背包（模版） 【模板】完全背包_牛客题霸_牛客网 #include <iostream> #include<string.h> using namespace std; const int N1001; int n,V,w[N],v[N],dp[N][N]; //dp[i][j]表示…...

编程日记 2024/6/21 13:08:58

购物返利系统的安全性：防范欺诈与数据保护

购物返利系统的安全性：防范欺诈与数据保护大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！ 购物返利系统作为一种电子商务模式，通过向消…...

编程日记 2024/6/21 13:07:56

从WebM到MP3：利用Python和wxPython提取音乐的魔法

前言有没有遇到过这样的问题：你有一个包含多首歌曲的WebM视频文件，但你只想提取其中的每一首歌曲，并将它们保存为单独的MP3文件？这听起来可能有些复杂，但借助Python和几个强大的库，这个任务变得异常简单。…...

编程日记 2024/6/21 13:06:54

图片转pdf，图片转pdf在线转换，在线图片转pdf

图片转PDF，听起来似乎是一个简单的操作，但实际上，它涉及到许多细节和技巧。有时候我们需要将图片转换为PDF格式，以便于分享、打印或保存。那么，如何将图片转换成PDF呢？接下来，我将为您详细介绍几…...

编程日记 2024/6/21 13:05:53

SpringBoot3使用Swagger3

SpringBoot3使用Swagger3 项目中的后端接口进行简单的前端展示一、依赖引入二、快速启动1.在application.yml中配置2.或者properties文件,则配置3.启动项目访问swagger 三、使用注解标注接口Swagger配置文件Swagger 注解迁移举例五种常用ApiApiOperationApiImplicitParamApiMod…...

编程日记 2024/6/21 13:04:51

【51单片机基础教程】点亮led

文章目录前言51单片机点亮LED的原理硬件部分软件部分51单片机的寄存器编程步骤proteus仿真点亮一个led 点亮多个ledproteus仿真代码流水灯总结前言单片机（Microcontroller Unit, MCU）是一种集成电路，广泛应用于各种电子产品中。作为嵌入…...

编程日记 2024/6/21 13:03:50

Docker之overlay2的迁移

原因 docker默认将文件及其容器放置在了系统盘的挂载区内，如果长期使用会发现系统挂载区被overlay2挤爆了,因此在一开始我们将其迁移在大容量外挂磁盘上,就可以避免系统盘被挤爆,放心使用. 具体操作 # 停止容器 systemctl stop docker# 修改容器配置&#xff0c…...

编程日记 2024/6/21 13:00:47

CentOS中的rename命令

目录 CentOS中的rename命令基本语法使用示例注意事项安装prename CentOS中的rename命令在CentOS系统中，rename命令通常是指util-linux包中提供的版本，它用于批量重命名文件，但与Perl版本的rename命令相比，功能较为简单&#xff…...

编程日记 2024/6/21 12:59:46

redis.conf 参数详解，方便进行性能优化配置

以下是redis.conf中一些常见参数的详细说明： daemonize：是否以后台进程运行，默认为no； pidfile：如以后台进程运行，则需指定一个pid，默认为/var/run/redis.pid；bind：绑定主…...

编程日记 2024/6/21 12:58:45

微信小程序登录流程详情及Java代码

一、流程图说明： 调用 wx.login() 获取临时登录凭证code ，并回传到开发者服务器。调用 auth.code2Session 接口，换取用户唯一标识 OpenID 和会话密钥 session_key。获取手机号，调用wx.getPhoneNumber() ，获取加密…...

编程日记 2024/6/21 12:57:44

c++qt合并两张灰度图像

需求：将两张尺寸相同的灰度图像进行合并，合并后的图像，每个像素点灰度值为两张原图对应像素点灰度值之和。若超过255，则最大为255。方法一： 将图像读取为cv::Mat，再调用opencv的cv::add方法，进…...

编程日记 2024/6/21 12:56:42

Uniapp通过年月日时间转变星期格式

效果图参靠微信小程序：日常记一记代码 <view v-for"(d,index) in dataList" >{{getWeekDay(d.ctime)}} //时间格式：2024-06-21</view> js export default {data(){return {dataList:[],//时间数组}},onLoad() {this.loadList…...

编程日记 2024/6/21 12:54:40

如何编写和执行高效的测试计划

如何编写和执行高效的测试计划 1. 测试计划概述2. 测试阶段详解3. 测试计划模板4. 关键注意事项总结 1. 测试计划概述测试计划是指导整个测试过程的重要文档，其中包含了测试策略、资源分配、进度安排以及风险评估等内容。一个完善的测试计划应当包括以下几个主要…...

编程日记 2024/6/21 12:50:36

【MySQL连接器(Python)指南】03-MySQL连接器(Python)安装

文章目录前言1. 从二进制发行版中安装连接器1.1 使用pip安装MySQL连接器1.2 使用MySQL Yum Repository安装1.3 使用Debian软件包安装连接器2. 从源代码发行版安装连接器2.1 在Windows上源码安装2.2 在类Unix系统上源码安装3. 验证连接器安装总结前言 MySQL连接器(Python)，用于…...

编程日记 2024/6/21 12:48:34

Spring Boot组件化与参数校验

Spring Boot组件化与参数校验 Spring Boot版本选择 2.3.x版本 2.6.x版本 Spring Boot核心思想约定大于配置，简化繁琐的配置 Spring Boot自动配置原理 SpringBootApplication: Spring Boot应用标注在某个类上说明这个类是SpringBoot的主配置类，Spr…...

编程日记 2024/6/21 12:47:32

实现可扩展的电商返利平台：技术选型与挑战

实现可扩展的电商返利平台：技术选型与挑战大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！ 在当今数字化和电商兴盛的时代，返利平台成为…...

编程日记 2024/6/21 12:46:32

wordpress多国语言版本/亚马逊关键词排名提升

整合谷粒在线教育登录注册前后端一、在nuxt环境中安装插件 1、安装element-ui 和 vue-qriously （1）执行命令安装npm install element-uinpm install vue-qriously2、修改配置文件 nuxt-swiper-plugin.js，使用插件 nuxt-swiper-plugin.jsimp…...

编程日记 2025/2/6 7:01:22

郑州网站托管公司哪家好/免费网站流量

关于vsftpd的原理这里就不多说了，下面红色部分有单独标出，突出显示，意思是这里的东西有额外的配置，全文的配置一定要跟着第二步的配置来，不要过程中随便改变参数，除非你看得懂，好了直接上配置过…...

编程日记 2025/2/6 1:45:40

网页设计建立站点实验报告/seo学院培训班

之前使用Hexo的时候，都是在本地进行编译和部署的，平时使用的时候觉得没什么，只需要 hexo ghexo d 两步就可以把博客更新的内容推到GitHub Pages上。但是某些时候可能会遇到你的文件夹中存在一些其他编辑到一半的文章——这时候想要更新博客中…...

编程日记 2025/2/6 0:30:10

重庆市建设施工安全网站/bt磁力链好用的引擎

下列属于阑尾炎术后并发症的是()下列可以用来描述交通流形态的分布有哪些？()文件夹名词解释一夫法是()寸。高压操作应实行()，一人()，一人()。高选择性蛋白尿中不存在的物质是()。建设项日策划的过程和方法的特点有()。各有关单位在进入防寒期…...

编程日记 2025/2/5 20:15:28

做免费网站推广开头语/单页应用seo如何解决

以下转载自安富莱电子： http://forum.armfly.com/forum.php NVIC 的全称是 Nested vectored interrupt controller，即嵌套向量中断控制器。对于 M3 和 M4 内核的 MCU，每个中断的优先级都是用寄存器中的 8 位来设置的。 8 位的话就可以设置 2^…...

编程日记 2025/2/5 17:56:21

建站合同模板/成都黑帽seo

Print也许是Python中使用频率最高的一个函数。很多小白都是从Hello World程序开始认识Python，而Python的Hello World程序只有一行，那就是调用内置的Print函数，向控制台输出字符串“Hello World”。不仅小白，哪怕是Python开发者&a…...

编程日记 2025/2/5 17:25:55

垃圾

相关文章：