9.1.tensorRT高级(4)封装系列-自动驾驶案例项目self-driving-道路分割分析
目录
- 前言
- 1. 道路分割
- 总结
前言
杜老师推出的 tensorRT从零起步高性能部署 课程,之前有看过一遍,但是没有做笔记,很多东西也忘了。这次重新撸一遍,顺便记记笔记。
本次课程学习 tensorRT 高级-自动驾驶案例项目self-driving-道路分割分析
课程大纲可看下面的思维导图

1. 道路分割
这节我们学习自动驾驶场景中的模型案例
1. 这个案例中存在 4 个模型,分别是:车辆检测 YoloX、车道线检测、道路分割、深度估计
2. 学习把该案例的模型跑起来,对不同任务进行了解
项目地址:https://github.com/iwatake2222/self-driving-ish_computer_vision_system

我们只需要拿到项目提供的模型并导出 ONNX 就行了,至于其它的环境配置等我们就不用关注了
那在案例中提供了下载好的模型,因此我们可以直接看案例代码
我们先来看道路分割模型,我们的目的是找到道路分割的 onnx,分析其 onnx 的大致使用逻辑,然后写出最简洁版本的 predict.py,大体可以分为以下三步:
1. 打开道路分割的 onnx,查看其输入与输出
2. 查看代码,找到 onnx 的预处理,分析得到预处理的逻辑
3. 针对获得的信息,编写 predict.py,尝试写出来
我们来观察下其 onnx 模型,如下图所示:

从导出的 onnx 我们可以了解并猜测:
- 输入是 1x3x512x896
- 输出是 1x512x896x4,并且是概率值,0~1,仅仅是不确定 4 通道代表什么
- 可能代表:可行驶区域、车道线、不可行驶区域、马路牙子
我们通过分析项目中的 image_processor/semantic_segmentation_engine.cpp 文件可以得出具体的预处理所做的工作:(详细分析请参照视频)
- normalize → \rightarrow → mean = 0, norm = 1.0
- 对输入图像直接 resize 到 height=512,width=896
- 确定输入的图像就是 BGR 图像
- normalize = (src_image - normalize.mean) * normalize.norm
我们可以简单的写个预处理程序来验证下,代码如下:
import onnxruntime
import cv2
import numpy as npsession = onnxruntime.InferenceSession("workspace/road-segmentation-adas.onnx", provider_options=["CPUExecutionProvider"])image = cv2.imread("workspace/imgs/dashcam_00.jpg")
image = cv2.resize(image, (896, 512))
image_tensor = image.astype(np.float32)
image_tensor = image_tensor.transpose(2, 0, 1)[None]prob = session.run(["tf.identity"], {"data": image_tensor})[0]print(prob.shape)cv2.imwrite("prob0.jpg", prob[0, :, :, 1] * 255)
输出如下图:

可以看到输出符合我们的预期,输出的概率图如下所示:

总结
本次课程学习了开源项目中的道路分割案例,主要是对道路分割模型的 onnx 进行了简单分析,并通过对项目代码的分析将预处理部分理清楚,然后通过 onnxruntime 进行了简单验证。
次课程学习了开源项目中的道路分割案例,主要是对道路分割模型的 onnx 进行了简单分析,并通过对项目代码的分析将预处理部分理清楚,然后通过 onnxruntime 进行了简单验证。
相关文章:
9.1.tensorRT高级(4)封装系列-自动驾驶案例项目self-driving-道路分割分析
目录 前言1. 道路分割总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程,之前有看过一遍,但是没有做笔记,很多东西也忘了。这次重新撸一遍,顺便记记笔记。 本次课程学习 tensorRT 高级-自动驾驶案例项目self-driving-道路分…...
稳定的 Glance 来了,安卓小部件有救了!
稳定的 Glance 来了,安卓小部件有救了! 稳定版本的 Glance 终于发布了,来一起看看吧,看看这一路的旅程,看看好用么,再看看如何使用! 前世今生 故事发生在两年的一天吧,其实夸张了…...
用友U8与MES系统API接口对接案例分析
企业数字化转型:轻易云数据集成平台助力 U8 ERPMES 系统集成 为什么选择数字化转型? 领导层对企业资源规划(ERP)的深刻理解促使了数字化转型的启动。采用精确的“N5”滚动计划,为供应商提供充分的预期信息,…...
web UI自动化介绍
文章目录 一、web UI自动化介绍1.1 执行UI自动化测试前提1.2 Selenium介绍以及知识点梳理 二、Selenium 学习2.1 基础2.1.1 环境安装与基础使用2.1.2 web浏览器控制2.1.3 常见控件的八大定位方式2.1.3.1 八大定位方式介绍2.1.3.2 NAME、ID定位2.1.3.3 css_selector定位2.1.3.4 …...
小米13Pro/13Ultra刷面具ROOT后激活LSPosed框架微X模块详细教程
喜欢买小米手机,很多是因为小米手机的开放,支持root权限,而ROOT对普通用户来说更多的是刷入DIY模块功能,今天ROM乐园小编就教大家如何使用面具ROOT,实现大家日常情况下非常依赖的微X模块功能,体验微X模块的…...
文盘Rust -- 给程序加个日志 | 京东云技术团队
日志是应用程序的重要组成部分。无论是服务端程序还是客户端程序都需要日志做为错误输出或者业务记录。在这篇文章中,我们结合log4rs聊聊rust 程序中如何使用日志。 log4rs类似java生态中的log4j,使用方式也很相似 log4rs中的基本概念 log4rs 的功能组件也由 appe…...
C语言深入理解指针(非常详细)(五)
目录 回调函数qsort使用举例qsort函数的模拟实现sizeof和strlen的对比sizeofstrlensizeof和strlen的对比一道关于sizeof的题 回调函数 回调函数就是一个通过函数指针调用的函数 如果你把函数的指针(地址)作为参数传递给另一个函数,当这个指…...
[docker]笔记-portainer的安装
1、portainer是一款可视化的容器管理软件,利用portainer可以轻松方便的管理和创建容器。portainer本身是一个容器,完全免费并且具有汉化版。本文介绍portainer的安装和使用。 2、安装好容器并配置好容器环境,可参照https://blog.csdn.net/bl…...
详解TCP/IP的三次握手和四次挥手
文章目录 前言一、TCP/IP协议的三次握手1.1 三次握手流程 二、TCP/IP的四次挥手2.1 四次挥手流程 三、主要字段3.1、标志位(Flags)3.2、序号(sequence number)3.3、确认号(acknowledgement number) 四、状态…...
YOLOv5算法改进(16)— 增加小目标检测层
前言:Hello大家好,我是小哥谈。小目标检测层是指在目标检测任务中用于检测小尺寸目标的特定网络层。由于小目标具有较小的尺寸和低分辨率,它们往往更加难以检测和定位。YOLOv5算法的检测速度与精度较为平衡,但是对于小目标的检测效…...
蓝桥杯官网练习题(图像模糊)
题目描述 小蓝有一张黑白图像,由 nm 个像素组成,其中从上到下共 n 行,每行从左到右 �m 列。每个像素由一个 0 到 255 之间的灰度值表示。 现在,小蓝准备对图像进行模糊操作,操作的方法为: 对…...
使用鳄鱼指标和ADX开立空头的条件,3秒讲清楚
使用鳄鱼指标和ADX开立空头的条件其实很简单,anzo capital昂首资本3秒钟讲清楚。 首先,市场行情需呈水平状态。再者,均线体系开始向上发散,给出明确的信号。最后,ADX确认该信号,要求指数上涨20%以上&#…...
RabbitMQ死信队列与延迟队列
目录 死信队列 死信队列的定义 死信队列的应用场景 死信队列的作用 死信队列架构图 死信队列代码实现 延迟队列 延迟队列的定义 延迟队列的应用场景 延迟队列的作用 延迟队列架构图 延迟队列的代码实现 死信队列 死信队列的定义 死信队列(Dead Letter …...
存储管理呀
世界太吵,别听,别看,别管,别怕,向前走 一. 存储管理 初识硬盘 机械 HDD 固态 SSDSSD的优势 SSD采用电子存储介质进行数据存储和读取的一种技术,拥有极高的存储性能,被认为是存储技术发展的未来…...
学习 BeautifulSoup 库从入门到精通
可以按照以下步骤进行: 1. 安装 BeautifulSoup: 首先,确保你已经安装了 Python。然后可以使用 pip 命令来安装 BeautifulSoup 库。在命令行中输入以下命令: pip install beautifulsoup42. 导入 BeautifulSoup: 在 …...
JavaScript基础知识总结
目录 一、js代码位置 二、变量与数据类型 1、声明变量 2、基本类型(7种基本类型) 1、undefined和null 2、String ⭐ 模板字符串(Template strings) 3、number和bigint ⭐ 4、boolean ⭐ 5、symbol 3、对象类型 1、Fun…...
技术面试与HR面:两者之间的关联与区别
🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…...
【Redis】为什么要学 Redis
文章目录 前言一、Redis 为什么快二、Redis 的特性2.1 将数据储存到内存中2.2 可编程性2.3 可扩展性2.4 持久性2.5 支持集群2.6 高可用性 三、Redis 的应用场景四、不能使用 Redis 的场景 前言 关于为什么要学 Redis 这个问题,一个字就可以回答,那就是&…...
动静态库生成使用
🔥🔥 欢迎来到小林的博客!! 🛰️博客主页:✈️林 子 🛰️博客专栏:✈️ Linux 🛰️社区 :✈️ 进步学堂 🛰…...
LLVM编译安装
LLVM编译安装 #全量下载 git clone https://github.com/llvm/llvm-project.git #只下载最新commit版本 git clone --depth 1 https://github.com/llvm/llvm-project.git#配置 #!/bin/bash set -ex cmake -S llvm -B build -DCMAKE_INSTALL_PREFIX/data0/huozai/software/insta…...
Qwen3-14b_int4_awq入门必看:基于AngelSlim压缩的轻量级文本生成模型
Qwen3-14b_int4_awq入门必看:基于AngelSlim压缩的轻量级文本生成模型 1. 模型简介 Qwen3-14b_int4_awq是基于Qwen3-14b模型的int4量化版本,采用AngelSlim压缩技术优化后的轻量级文本生成模型。这个版本在保持原模型核心能力的同时,显著减少…...
避开这3个坑!数字孪生原型设计中最容易被忽略的交互细节(Axure案例)
避开这3个坑!数字孪生原型设计中最容易被忽略的交互细节(Axure案例) 在智慧园区数字孪生项目中,一个看似完美的原型设计可能在开发阶段暴露出致命缺陷——某能源管理系统的动态数据看板,因原型阶段未考虑API返回空值情…...
(优选算法)斐波那契数列模型
动态规划解题步骤:首先,动态规划的题目主要的目的是为了填写表dp中的空缺部分。1. 状态表示:就是要填写到qp表中那个值的涵义。2. 状态转移方程:就是dp[i]值怎么得到的。3. 初始化:初始化一些值防止,在执行状态方程的时…...
百川2-13B-4bits量化版惊艳效果:冒泡排序/装饰器讲解/错误诊断三重能力验证
百川2-13B-4bits量化版惊艳效果:冒泡排序/装饰器讲解/错误诊断三重能力验证 1. 引言:当大模型遇上量化,消费级显卡也能起飞 最近在折腾大语言模型的时候,我发现了一个挺有意思的现象:很多朋友一听到“13B参数”的模型&…...
Gemma-3-12b-it部署教程:Kubernetes集群中Gemma-3-12b-it多实例编排
Gemma-3-12b-it部署教程:Kubernetes集群中Gemma-3-12b-it多实例编排 1. 项目概述 Gemma-3-12b-it是基于Google Gemma-3-12b-it大模型开发的多模态交互工具,专为本地化部署优化设计。该工具支持图片上传与文本提问的流式生成回答,采用极简UI…...
Linux服务器外网访问失败的5个常见坑点(附详细排查命令)
Linux服务器外网访问失败的5个系统性排查指南 刚部署完项目却发现外网无法访问?这可能是每个Linux运维新手都会遇到的"成人礼"。不同于零散的问题解决,本文将用系统化的排查思路,带你从底层网络原理到实操命令,彻底掌握…...
COMSOL流沙层注浆数值模拟研究案例
COMSOL流沙层注浆数值模拟研究 案例本模型来源于文献复现,该文献分析了流沙层地质结构特点,应用有限元分析软件COMSOL Multiphysics对流沙层渗透注浆进行稳态与瞬态的数值模拟研究,分别计算了静水条件下和动水条件下注浆浆液扩散过程…...
MNIST手写数字分类实战:从数据加载到模型评估的完整流程(附代码)
MNIST手写数字分类实战:从数据加载到模型评估的完整流程(附代码) 在机器学习领域,MNIST数据集堪称经典中的经典。这个包含7万张手写数字图片的数据集,已经成为无数数据科学家和机器学习工程师的"入门必修课"…...
Qwen2-VL-2B-Instruct与Matlab联动:科学计算可视化结果的自动解读
Qwen2-VL-2B-Instruct与Matlab联动:科学计算可视化结果的自动解读 每次做完仿真,看着屏幕上密密麻麻的曲线和三维图,你是不是也头疼怎么把它们变成报告里的文字?频谱图上的峰值、曲面图的拐点、时域波形的异常,这些关…...
OFA图像英文描述模型在Linux环境下的高效部署方案
OFA图像英文描述模型在Linux环境下的高效部署方案 如果你手头有一台Linux服务器,想在上面部署一个能看懂图片并生成英文描述的AI模型,那么OFA(One-For-All)模型会是一个很棒的选择。它就像一个多面手,不仅能做图像描述…...
