当前位置：首页 > news >正文

Paddle Inference部署推理（十）

news 文章来源：https://blog.csdn.net/weixin_46319994/article/details/144041093 2025/4/27 5:46:45

十：Paddle Inference推理（python）API详解

9. 启用内存优化

API定义如下：

# 开启内存 / 显存复用，具体降低内存效果取决于模型结构
# 参数：None
# 返回：None
paddle.inference.Config.enable_memory_optim()

代码示例：

# 引用 paddle inference 预测库
import paddle.inference as paddle_infer# 创建 config
config = paddle_infer.Config("./mobilenet_v1.pdmodel", "./mobilenet_v1.pdiparams")# 开启 CPU 显存优化
config.enable_memory_optim()# 启用 GPU 进行预测
config.enable_use_gpu(100, 0)# 开启 GPU 显存优化
config.enable_memory_optim()

10. 设置缓存路径

注意：如果当前使用的为 TensorRT INT8 且设置从内存中加载模型，则必须通过 set_optim_cache_dir 来设置缓存路径。

API定义如下：

# 设置缓存路径
# 参数：opt_cache_dir - 缓存路径
# 返回：None
paddle.inference.Config.set_optim_cache_dir(opt_cache_dir: str)

代码示例：

# 引用 paddle inference 预测库
import paddle.inference as paddle_infer# 创建 config
config = paddle_infer.Config("./mobilenet_v1.pdmodel", "./mobilenet_v1.pdiparams")# 设置缓存路径
config.set_optim_cache_dir("./OptimCacheDir")

11. Profile 设置

API定义如下：

# 打开 Profile，运行结束后会打印所有 OP 的耗时占比
# 参数：None
# 返回：None
paddle.inference.Config.enable_profile()

代码示例：

# 引用 paddle inference 预测库
import paddle.inference as paddle_infer# 创建 config
config = paddle_infer.Config("./mobilenet_v1.pdmodel", "./mobilenet_v1.pdiparams")# 打开 Profile
config.enable_profile()

执行预测之后输出的 Profile 的结果如下：

------------------------->     Profiling Report     <-------------------------Place: CPU
Time unit: ms
Sorted by total time in descending order in the same thread-------------------------     Overhead Summary      -------------------------Total time: 1085.33Computation time       Total: 1066.24     Ratio: 98.2411%Framework overhead     Total: 19.0902     Ratio: 1.75893%-------------------------     GpuMemCpy Summary     -------------------------GpuMemcpy                Calls: 0           Total: 0           Ratio: 0%-------------------------       Event Summary       -------------------------Event                            Calls       Total       Min.        Max.        Ave.        Ratio.
thread0::conv2d                  210         319.734     0.815591    6.51648     1.52254     0.294595
thread0::load                    137         284.596     0.114216    258.715     2.07735     0.26222
thread0::depthwise_conv2d        195         266.241     0.955945    2.47858     1.36534     0.245308
thread0::elementwise_add         210         122.969     0.133106    2.15806     0.585568    0.113301
thread0::relu                    405         56.1807     0.021081    0.585079    0.138718    0.0517635
thread0::batch_norm              195         25.8073     0.044304    0.33896     0.132345    0.0237783
thread0::fc                      15          7.13856     0.451674    0.714895    0.475904    0.0065773
thread0::pool2d                  15          1.48296     0.09054     0.145702    0.0988637   0.00136636
thread0::softmax                 15          0.941837    0.032175    0.460156    0.0627891   0.000867786
thread0::scale                   15          0.240771    0.013394    0.030727    0.0160514   0.000221841

12. Log 设置

API定义如下：

# 去除 Paddle Inference 运行中的 LOG
# 参数：None
# 返回：None
paddle.inference.Config.disable_glog_info()# 判断是否禁用 LOG
# 参数：None
# 返回：bool - 是否禁用 LOG
paddle.inference.Config.glog_info_disabled()

代码示例：

# 引用 paddle inference 预测库
import paddle.inference as paddle_infer# 创建 config
config = paddle_infer.Config("./mobilenet_v1.pdmodel", "./mobilenet_v1.pdiparams")# 去除 Paddle Inference 运行中的 LOG
config.disable_glog_info()# 判断是否禁用 LOG - true
print("GLOG INFO is: {}".format(config.glog_info_disabled()))

13. 查看config配置

API定义如下：

# 返回 config 的配置信息
# 参数：None
# 返回：string - config 配置信息
paddle.inference.Config.summary()

调用summary()的输出如下所示：

+-------------------------------+----------------------------------+
| Option                        | Value                            |
+-------------------------------+----------------------------------+
| model_dir                     | ./inference_pass/TRTFlattenTest/ |
+-------------------------------+----------------------------------+
| cpu_math_thread               | 1                                |
| enable_mkldnn                 | false                            |
| mkldnn_cache_capacity         | 10                               |
+-------------------------------+----------------------------------+
| use_gpu                       | true                             |
| gpu_device_id                 | 0                                |
| memory_pool_init_size         | 100MB                            |
| thread_local_stream           | false                            |
| use_tensorrt                  | true                             |
| tensorrt_precision_mode       | fp32                             |
| tensorrt_workspace_size       | 1073741824                       |
| tensorrt_max_batch_size       | 32                               |
| tensorrt_min_subgraph_size    | 0                                |
| tensorrt_use_static_engine    | false                            |
| tensorrt_use_calib_mode       | false                            |
| tensorrt_enable_dynamic_shape | false                            |
| tensorrt_use_oss              | true                             |
| tensorrt_use_dla              | false                            |
+-------------------------------+----------------------------------+
| use_xpu                       | false                            |
+-------------------------------+----------------------------------+
| ir_optim                      | true                             |
| ir_debug                      | false                            |
| memory_optim                  | false                            |
| enable_profile                | false                            |
| enable_log                    | true                             |
+-------------------------------+----------------------------------+

Paddle Inference部署推理（十）

十：Paddle Inference推理 （python）API详解 9. 启用内存优化 API定义如下： # 开启内存 / 显存复用，具体降低内存效果取决于模型结构 # 参数：None # 返回：None paddle.inference.Config.enable…...

编程日记 2024/11/29 23:47:49

万能门店小程序管理系统 doPageGetFormList SQL注入漏洞复现

0x01 产品简介万能门店小程序管理系统是一款功能强大的工具，旨在为各行业商家提供线上线下融合的全方位解决方案。是一个集成了会员管理和会员营销两大核心功能的综合性平台。它支持多行业使用，通过后台一键切换版本，满足不同行业商家的个性化需求。该系统采用轻量后台，搭…...

编程日记 2024/11/29 23:45:46

全面＋彻底解决VMware安装后没有VMnet1和VMnet8的问题

目录 1、摘要 （1）问题 （2）所用工具 ① Everything软件 ② CCleaner软件 2、问题的检查与确认 3、解决过程 （1）卸载已经安装的VMware （2）设置services.mcs：服务自…...

编程日记 2024/11/29 23:42:43

什么是堆？

堆（Heap）：堆可以看做是一颗用数组实现的二叉树，所以它没有使用父指针或者子指针。堆根据“堆属性”来排序，“堆属性”决定了树中节点的位置。堆的特性 1.堆是完全二叉树，除了树的最后一层节点不需要是满的…...

编程日记 2024/11/29 23:41:42

微距动物和植物摄影后期森系风格Lr调色教程，手机滤镜PS+Lightroom预设下载！

调色教程微距动物和植物摄影后期采用森系风格的 Lightroom 调色，将微距下的动植物世界打造成充满自然气息和梦幻感的画面。这种调色风格旨在突出动植物的细腻之美，同时营造出宁静、清新的森林氛围。预设信息调色风格：森系风格预设适合类…...

编程日记 2024/11/29 23:39:40

Qt6.8安卓Android开发环境配置

时隔多年，重拾QtCreator下Android开发。发现Qt6下安卓开发环境配置变简单不少！只需三步即可在QtCreator下进行Android开发： 一、使用Qt Mantenance Tool进行Android模块的安装： 如果感觉安装网速较慢，可以查看本人另外…...

编程日记 2024/11/29 23:38:39

RK3568部署yolo8记录

本教程记录自己一下在RK3568上部署yolo8的步骤板端驱动在板端，首先查看rknpu驱动是否安装、存在。若键入下面的命令有返回则，证明驱动已安装。 dmesg | grep -i rknpu 瑞芯微官方说，驱动版本最好大于0.9.2。但是我看有的博主说&#xff…...

编程日记 2024/11/29 23:37:38

数据可视化复习2-绘制折线图+条形图（叠加条形图，并列条形图，水平条形图）+ 饼状图 + 直方图

目录目录一、绘制折线图 1.使用pyplot 2.使用numpy 编辑 3.使用DataFrame 编辑二、绘制条形图（柱状图） 1.简单条形图 2.绘制叠加条形图 3.绘制并列条形图 4.水平条形图编辑三、绘制饼状图四、绘制散点图和直方图 1.散点图 2…...

编程日记 2024/11/29 23:33:32

JavaScript原生深拷贝方法 structuredClone使用

structuredClone 简介 structuredClone 是现代浏览器提供的原生 JavaScript 方法，用于深拷贝对象。它可以处理各种复杂数据结构，包括嵌套对象、数组、Date、Map、Set 等，且支持循环引用。语法 const clone structuredClone(value);value:…...

编程日记 2024/11/29 23:32:31

SpringBoot无法使用jkd8问题

1. 解决SpringBoot无法使用jdk8问题创建一个高 jkd 版本，如 jkd21 在创建项目后，将 pom.xml中的 jdk 版本改为8，找到下图所在位置修改即可。此外将 SpringBoot 的版本修改为 2 开头的如2.7.4 ，然后刷新 Maven 项目即可。在 …...

编程日记 2024/11/29 23:31:29

使用 Jina Embeddings v2 在 Elasticsearch 中进行后期分块

作者：来自 Elastic Gustavo Llermaly 在 Elasticsearch 中使用 Jina Embeddings v2 模型并探索长上下文嵌入模型的优缺点。在本文中，我们将配置和使用 jina-embeddings-v2，这是第一个开源 8K 上下文长度嵌入模型，首先使用 semant…...

编程日记 2024/11/29 23:28:27

QT简易项目数据库可视化界面数据库编程SQLITE QT5.12.3环境 C++实现

案例需求： 完成数据库插入，删除，修改，查看操作。分为插入，删除，修改，查看，查询几个模块。代码： widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget…...

编程日记 2024/11/29 23:25:24

python json.dump()和json.dumps()的区别

用人话总结一下 json.dump()是针对文件的json和python的转换 json.dumps()主要是针对内容数据 json.dumps(obj, skipkeysFalse, ensure_asciiTrue, check_circularTrue, allow_nanTrue, clsNone, indentNone, separatorsNone, encoding“utf-8”, defaultNone, sort_keysFalse…...

编程日记 2024/11/29 23:19:20

网络流学习笔记

注：笔者是蒟蒻，所以本文几乎是干货，枯燥无味甚至可能会引人不适，请读者谨慎阅读。为了笔者快爆掉的肝点个赞好吗？？？ Part.1 网络流基础定义一个有向带权图 G ( V , E ) G(V,E) G(V,E) 是…...

编程日记 2024/11/29 23:18:19

Mybatis PLUS查询对List使用OR模糊查询

Mybatis PLUS查询对List使用OR模糊查询 1、版本2、代码3、效果 1、版本 Mybatis PLUS版本：3.5.7 注意：版本3.1.2及以下是需要return的因当前为高版本，代码中已将 return 注释。 2、代码 QueryWrapper<Object> queryWrapper new Que…...

编程日记 2024/11/29 23:16:17

Debezium日常分享系列之：Debezium Engine

Debezium日常分享系列之：Debezium Engine 依赖打包项目在代码中输出消息格式消息转换消息转换谓词高级记录使用引擎属性异步引擎属性数据库模式历史属性处理故障 Debezium连接器通常通过部署到Kafka Connect服务来运行，并配置一个或多个连接器来监视上游…...

编程日记 2024/11/29 23:12:13

I.MX6U 裸机开发20. DDR3 内存知识

I.MX6U 裸机开发20. DDR3 内存知识一、DDR3内存简介1. DDR发展历程SRAMSDRAMDDR1DDR2DDR3DDR4DDR5 2. 开发板资源3. DDR3的时间参数1. 传输速率2. tRCD3. CL 参数作用取值范围工作原理4. tRC参数原理单位与取值5. tRAS重要性及作用二、I.MX6U MMDC 控制器1. MMDC简介&#xf…...

编程日记 2024/11/29 23:11:09

【R安装】VSCODE安装及R语言环境配置

目录 VSCODE下载及安装VSCODE上配置R语言环境参考 Visual Studio Code（简称“VSCode” ）是Microsoft在2015年4月30日Build开发者大会上正式宣布一个运行于 Mac OS X、Windows和 Linux 之上的，针对于编写现代Web和云应用的跨平台源代码编辑器&…...

编程日记 2024/11/29 23:09:07

ES更新问题 Failed to close the XContentBuilder异常

问题描述使用RestHighLevelClient对文档进行局部更新的时候报错如下： Suppressed: java.lang.IllegalStateException: Failed to close the XContentBuilderat org.elasticsearch.common.xcontent.XContentBuilder.close(XContentBuilder.java:1011)at org.elast…...

编程日记 2024/11/29 23:08:06

svn-git下载

windows： svn 客户端：-------------- TortoiseSVN 安装下载地址：https://tortoisesvn.net/downloads.html, 页面里有语言包补丁的下载链接。目前最新版为 1.11.0 下载地址： https://osdn.net/projects/tortoisesvn/storage/1.…...

编程日记 2024/11/29 23:06:04

10个Word自动化办公脚本

在日常工作和学习中，我们常常需要处理Word文档（.docx）。 Python提供了强大的库，如python-docx，使我们能够轻松地进行文档创建、编辑和格式化等操作。本文将分享10个使用Python编写的Word自动化脚本，帮助新…...

编程日记 2024/11/29 23:04:03

Paddle Inference部署推理（十八）

十八：Paddle Inference推理 （C）API详解 3. 使用 CPU 进行预测注意： 在 CPU 型号允许的情况下，进行预测库下载或编译试尽量使用带 AVX 和 MKL 的版本可以尝试使用 Intel 的 MKLDNN 进行 CPU 预测加速，默…...

编程日记 2024/11/29 23:03:02

Redis开发02：redis.windows-service.conf 默认配置文件解析与注解

文件位置：redis安装目录下的 redis.windows-service.conf ，存放了redis服务的相关配置，下面列举出默认配置的含义： 配置项含义bind 127.0.0.1限制 Redis 只监听本地回环地址，意味着只能从本地连接 Redis。protected-m…...

编程日记 2024/11/29 23:00:59

redis大key和热key

redis中大key、热key 什么是大key大key可能产生的原因大key可能会造成什么影响如何检测大key如何优化删除大key时可能的问题删除大key的策略热key热key可能导致的问题解决热key的方法什么是大key 大key通常是指占用内存空间过大或包含大量元素的键值对。数据量大&#xff…...

编程日记 2024/11/29 22:58:58

Dubbo 最基础的 RPC 应用(使用 ZooKeeper)

看国内的一些项目时 Dubbo 这个词经常闪现，一直也不以为然，未作搜索，当然也不知道它是做什么用的。直到最近阅读关于大型网站架构相关的书中反复提到 Dubbo 后，觉得不能再对它视而不见。Google 了一下，它是在阿里巴巴创…...

编程日记 2024/11/29 22:54:53

科技赋能：企业如何通过新技术提升竞争力的策略与实践

引言在当今瞬息万变的商业环境中，科技的迅猛发展正在重新定义行业的游戏规则。无论是小型企业还是跨国巨头，都感受到数字化转型的迫切需求。过去，企业竞争力更多依赖于成本控制、资源调配或市场覆盖，而如今，新技术的引…...

编程日记 2024/11/29 22:53:51

从0开始深度学习（33）——循环神经网络的简洁实现

本章使用Pytorch的API实现RNN上的语言模型训练 0 导入库 import torch import torch.nn as nn import torch.nn.functional as F from torch.utils.data import Dataset, DataLoader from collections import Counter import re import math from tqdm import tqdm1 准备数据 …...

编程日记 2024/11/29 22:51:49

【FAQ】HarmonyOS SDK 闭源开放能力 — 公共模块

1.问题描述： 文档哪里能找到所有的权限查看该权限是用户级的还是系统级的。解决方案： 您好，可以看一下下方链接是否可以解决问题： https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V5/permissions-for-all-V…...

编程日记 2024/11/29 22:50:46

百度文心一言 vs 阿里通义千问哪个好？

背景介绍： 在当前的人工智能领域，随着大模型技术的快速发展，市场上涌现出了众多的大规模语言模型。然而，由于缺乏统一且权威的评估标准，很多关于这些模型能力的文章往往基于主观测试或自行设定的排行榜来评价模型性能…...

编程日记 2024/11/29 22:48:43

内网不出网上线cs

一:本地正向代理目标如下，本地(10.211.55.2)挂好了基于 reGeorg 的 http 正向代理。代理为: Socks5 10.211.55.2 1080python2 reGeorgSocksProxy.py -l 0.0.0.0 -p 1080 -u http://10.211.55.3:8080/shiro/tunnel.jsp 二：虚拟机配置proxifer 我们是…...

编程日记 2024/11/29 22:47:41

十：Paddle Inference推理 （python）API详解

9. 启用内存优化

10. 设置缓存路径

11. Profile 设置

12. Log 设置

13. 查看config配置

相关文章：

十：Paddle Inference推理（python）API详解