当前位置：首页 > news >正文

pytorch网络模型构建中的注意点

news 2025/7/2 23:32:17

记录使用pytorch构建网络模型过程遇到的点

1. 网络模型构建中的问题

1.1　输入变量是Tensor张量

各个模块和网络模型的输入，　一定要是tensor 张量；

可以用一个列表存放多个张量。
如果是张量维度不够，需要升维度，
可以先使用 torch.unsqueeze(dim = expected)
然后再使用torch.cat(dim ) 进行拼接；

需要传递梯度的数据，禁止使用numpy，也禁止先使用numpy，然后再转换成张量的这种情况出现；

这是因为pytorch的机制是只有是 Tensor　张量的类型，才会有梯度等属性值，如果是numpy这些类别，这些变量并会丢失其梯度值。

1.2 `init()` 方法使用

class ex:def __init__(self):pass

__init__方法必须接受至少一个参数即self，

Python中，self是指向该对象本身的一个引用，

通过在类的内部使用self变量，

类中的方法可以访问自己的成员变量，简单来说，self.varname的意义为”访问该对象的varname属性“

当然，__init__()中可以封装任意的程序逻辑，这是允许的，init()方法还接受任意多个其他参数，允许在初始化时提供一些数据，例如，对于刚刚的worker类，可以这样写：

class worker:def __init__(self,name,pay):self.name=nameself.pay=pay

这样，在创建worker类的对象时，必须提供name和pay两个参数：

b=worker('Jim',5000)

Python会自动调用worker.init()方法，并传递参数。

细节参考这里init方法

1.3　内置函数 `setattr()`

此时，可以使用python自带的内置函数 setattr(),　和对应的getattr()

setattr(object, name, value)

object – 对象。
name – 字符串，对象属性。
value – 属性值。

对已存在的属性进行赋值：
>>>class A(object):
...     bar = 1
... 
>>> a = A()
>>> getattr(a, 'bar')          # 获取属性 bar 值
1
>>> setattr(a, 'bar', 5)       # 设置属性 bar 值
>>> a.bar
5如果属性不存在会创建一个新的对象属性，并对属性赋值:>>>class A():
...     name = "runoob"
... 
>>> a = A()
>>> setattr(a, "age", 28)
>>> print(a.age)
28
>>>

setattr() 语法

setattr(object, name, value)

object – 对象。
name – 字符串，对象属性。
value – 属性值。

1.4　网络模型的构建

注意到，　在python的 __init__() 函数中，　self 本身就是该类的对象的一个引用，即self是指向该对象本身的一个引用，

利用上述这一点，当在神经网络中，

需要给多个属性进行实例化时，
且这多个属性使用的是同一个类进行实例化.

1.4.1 使用 `setattr(self, string, object1)` 添加属性；

注意到，下面这种方式，由于
Basic_slide_conv() 只经过了一次实例化，　
所以在内存空间中，只会分配一个地址空间给该对象；

虽然后面使用 35 group，　　
但这35组本质上使用的同一个对象，即conv_block　该对象；

class Temporal_GroupTrans(nn.Module):def __init__(self,   num_classes=10,num_groups=35, drop_prob=0.5, pretrained= True):super(Temporal_GroupTrans, self).__init__()conv_block = Basic_slide_conv()for i in range( num_groups):setattr(self, "group" + str(i), conv_block)# 自定义transformer模型的初始化， CustomTransformerModel() 在该类中传入初始化模型的参数,# nip:512　输入序列中，每个列向量的编码维度，　16:　注意力头的个数# 600:　中间mlp 隐藏层的维数,  6: 堆叠transforEncode　编码模块的个数；self.trans_model = CustomTransformerModel(512,16,600, 6,droupout=0.5,nclass=4)

如果想要分配35个不同的对象，　即需要分配出35个不同的地址空间用来存储，
那么需要将　Basic_slide_conv() 经过了35次实例化，　
所以需要将　类Basic_slide_conv() 　实例化的过程放在循环当中实现；

class Temporal_GroupTrans(nn.Module):def __init__(self,   num_classes=10,num_groups=35, drop_prob=0.5, pretrained= True):super(Temporal_GroupTrans, self).__init__()# conv_block = Basic_slide_conv()for i in range( num_groups):setattr(self, "group" + str(i), Basil_slide_conv() )# 自定义transformer模型的初始化， CustomTransformerModel() 在该类中传入初始化模型的参数,# nip:512　输入序列中，每个列向量的编码维度，　16:　注意力头的个数# 600:　中间mlp 隐藏层的维数,  6: 堆叠transforEncode　编码模块的个数；self.trans_model = CustomTransformerModel(512,16,600, 6,droupout=0.5,nclass=4)

1.4.2 使用 `getattr(self, string, object1)` 获取属性；

        trans_input_sequence = []for i in range(0, num_groups, ):#  　每组语谱图的大小是一个 (bt, ch,96,12)的矩阵,组与组之间没有重叠；cur_group = x[:, :, :, 12 * i:12 * (i + 1)]# VARIABLE_fun = "self.group"   # 每一组，与之对应的卷积模块；# cur_fun = eval(VARIABLE_fun + str(i ))cur_fun = getattr(self, 'group'+str(i))cur_group_out = cur_fun(cur_group).unsqueeze(dim=1)  # [bt,1, 512]trans_input_sequence.append(cur_group_out)

pytorch网络模型构建中的注意点

记录使用pytorch构建网络模型过程遇到的点 1. 网络模型构建中的问题 1.1　输入变量是Tensor张量各个模块和网络模型的输入，　一定要是tensor 张量； 可以用一个列表存放多个张量。如果是张量维度不够，需要升维度， 可以先使用 …...

编程日记 2023/3/11 11:56:56

面试时候这样介绍redis，redis经典面试题

为什么要用redis做缓存使用Redis缓存有以下几个优点： 1. 提高系统性能：缓存可以将数据存储在内存中，加快数据的访问速度，减少对数据库的读写次数，从而提高系统的性能。 2. 减轻后端压力：使用缓存可以减…...

编程日记 2023/3/11 11:55:55

机械学习 - scikit-learn - 数据预处理 - 2

目录关于 scikit-learn 实现规范化的方法详解一、fit_transform 方法1. 最大最小归一化手动化与自动化代码对比演示 1：2. 均值归一化手动化代码演示：3. 小数定标归一化手动化代码演示：4. 零-均值标准化(均值移除)手动与自动化代码演示&#x…...

编程日记 2023/3/11 11:54:52

华为OD机试题 - 最长连续交替方波信号（JavaScript）| 机考必刷

更多题库，搜索引擎搜梦想橡皮擦华为OD 👑👑👑 更多华为OD题库，搜梦想橡皮擦华为OD 👑👑👑 更多华为机考题库，搜梦想橡皮擦华为OD 👑👑👑 华为OD机试题最近更新的博客使用说明本篇题解：最长连续交替方波信号题目输入输出示例一输入输出Code解题思路版…...

编程日记 2023/3/11 11:53:50

0、前言参数名和默认值spark.default.parallelismDefault number of partitions in RDDsspark.executor.cores1 in YARN mode 一般默认值spark.files.maxPartitionBytes134217728(128M)spark.files.openCostInBytes4194304 (4 MiB)spark.hadoop.mapreduce.fileoutputcommitte…...

编程日记 2023/3/11 11:52:41

双通道5.2GSPS（或单通道10.4GSPS）射频采样FMC+模块

概述 FMC140是一款具有缓冲模拟输入的低功耗、12位、双通道（5.2GSPS/通道）、单通道10.4GSPS、射频采样ADC模块，该板卡为FMC标准，符合VITA57.1规范，该模块可以作为一个理想的IO单元耦合至FPGA前端，8通道的JE…...

编程日记 2023/3/11 11:51:37

理解java反射

是什么Java反射是Java编程语言的一个功能，它允许程序在运行时（而不是编译时）检查、访问和修改类、对象和方法的属性和行为。使用反射创建对象相比直接创建对象有什么优点使用反射创建对象相比直接创建对象的主要优点是灵活性和可扩展性。当我…...

编程日记 2023/3/11 11:50:34

EasyRcovery16免费的电脑照片数据恢复软件

电脑作为一种重要的数据储存设备，其中保存着大量的文档，邮件，视频，音频和照片。那么，如果电脑照片被删除了怎么办？今天小编给大家介绍，误删除的照片从哪里可以找回来，误删除的照片如…...

编程日记 2023/3/11 11:49:30

若依微服务版在定时任务里面跨模块调用服务

第一步在被调用的模块中添加代理 RemoteTaskFallbackFactory.java: package com.ruoyi.rpa.api.factory;import com.ruoyi.common.core.domain.R; import com.ruoyi.rpa.api.RemoteTaskService; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springf…...

编程日记 2023/3/11 11:48:29

SpringMVC简单配置

1、pom.xml配置 <dependencies><dependency><groupId>org.springframework</groupId><artifactId>spring-webmvc</artifactId><version>5.1.12.RELEASE</version></dependency></dependencies><build><…...

编程日记 2023/3/11 11:47:26

xcat快速入门工作流程指南

目录一、快速入门指南一、先决条件二、准备管理节点xcatmn.mydomain.com三、第1阶段：添加你的第一个节点并且用带外BMC接口控制它四、第 2 阶段预配节点并使用并行 shell 对其进行管理二：工作流程指南1. 查找 xCAT 管理节点的服务器2. 在所选服务器上安…...

编程日记 2023/3/11 11:46:21

C++回顾（十九）—— 容器string

19.1 string概述 1、string是STL的字符串类型，通常用来表示字符串。而在使用string之前，字符串通常是用char * 表示的。string 与char * 都可以用来表示字符串，那么二者有什么区别呢。 2、string和 char * 的比较 （1&#xff09…...

编程日记 2023/3/11 11:45:19

Hadoop入门

数据分析与企业数据分析方向数据是什么数据是指对可观事件进行记录并可以鉴别的符号，是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合，它是可以识别的、抽象的符号。他不仅指狭义上的数字，还可以是具有一…...

编程日记 2023/3/11 11:44:16

高校如何通过校企合作/实验室建设来提高大数据人工智能学生就业质量

高校人才培养应该如何结合市场需求进行相关专业设置和就业引导，一直是高校就业工作的讨论热点。亘古不变的原则是，高校设置不能脱离市场需求太远，最佳的结合方式是，高校具有前瞻性，能领先市场一步，培养未来…...

编程日记 2023/3/11 11:43:10

提升学习 Prompt 总结

NLP现有的四个阶段： 完全有监督机器学习完全有监督深度学习预训练：预训练 -> 微调 -> 预测提示学习：预训练 -> 提示 -> 预测阶段1，word的本质是特征，即特征的选取、衍生、侧重上的针对性工程。阶段2&…...

编程日记 2023/3/11 11:42:06

JavaScript学习笔记（2.0）

BOM--（browser object model） 获取浏览器窗口尺寸获取可视窗口高度：window.innerWidth 获取可视窗口高度:window.innerHeight 浏览器弹出层提示框：window.alert(提示信息) 询问框：window.confirm(提示信息) 输…...

编程日记 2023/3/11 11:41:04

直击2023云南移动生态合作伙伴大会，聚焦云南移动的“价值裂变”

作者 | 曾响铃文 | 响铃说 2023年3月2日下午，云南移动生态合作伙伴大会在昆明召开。云南移动党委书记，总经理葛松海在大会上提到“2023年，云南移动将重点在‘做大平台及生态级新产品，做优渠道转型新动能，做强合作新…...

编程日记 2023/3/11 11:40:00

STM32F1开发实例-振动传感器(机械)

振动(敲击)传感器振动无处不在，有声音就有振动，哒哒的脚步是匆匆的过客，沙沙的夜雨是暗夜的忧伤。那你知道理科工程男是如何理解振动的吗？今天我们就来讲一讲本节的主角：最简单的机械式振动传感器。下图即为振动传…...

编程日记 2023/3/11 11:38:56

2023最新ELK日志平台（elasticsearch+logstash+kibana）搭建

去年公司由于不断发展，内部自研系统越来越多，所以后来搭建了一个日志收集平台，并将日志收集功能以二方包形式引入自研系统，避免每个自研系统都要建立一套自己的日志模块，节约了开发时间，管理起来也更加容易…...

编程日记 2023/3/11 11:37:48

2023-3-10 刷题情况

打家劫舍 IV 题目描述沿街有一排连续的房屋。每间房屋内都藏有一定的现金。现在有一位小偷计划从这些房屋中窃取现金。由于相邻的房屋装有相互连通的防盗系统，所以小偷不会窃取相邻的房屋。小偷的窃取能力定义为他在窃取过程中能从单间房屋中窃取的最大…...

编程日记 2023/3/11 11:36:46

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制，因此这个了16进制的数据既可以翻译成为这个机器码，也可以翻译成为这个国标码，所以这个时候很容易会出现这个歧义的情况； 因此，我们的这个国…...

编程新知 2025/6/26 13:46:06

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法配置通过调谐文件来调整相机行为使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包文章来源： http://raspberry.dns8844.cn/documentation 原文网址配置大多数用例自动工作，无需更改相机配置。但是，一…...

编程新知 2025/6/28 8:53:11

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2025/7/2 8:21:19

ESP32读取DHT11温湿度数据

芯片：ESP32 环境：Arduino 一、安装DHT11传感器库红框的库，别安装错了二、代码注意，DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

编程新知 2025/6/26 11:24:52

C++.OpenGL （10/64）基础光照（Basic Lighting）

基础光照（Basic Lighting）冯氏光照模型（Phong Lighting Model） #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...

编程新知 2025/6/25 15:26:59

今日科技热点速览

🔥 今日科技热点速览 🎮 任天堂Switch 2 正式发售任天堂新一代游戏主机 Switch 2 今日正式上线发售，主打更强图形性能与沉浸式体验，支持多模态交互，受到全球玩家热捧。 🤖 人工智能持续突破 DeepSeek-R1&…...

编程新知 2025/6/20 19:12:10

Linux --进程控制

本文从以下五个方面来初步认识进程控制： 目录进程创建进程终止进程等待进程替换模拟实现一个微型shell 进程创建在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程，创建出来的进程就是子进程，原来的进程为父进程。…...

编程新知 2025/6/25 3:59:28

听写流程自动化实践，轻量级教育辅助

随着智能教育工具的发展，越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式，也迎来了更高效的解决方案。这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建，…...

编程新知 2025/6/24 6:55:24

android13 app的触摸问题定位分析流程

一、知识点一般来说，触摸问题都是app层面出问题，我们可以在ViewRootImpl.java添加log的方式定位；如果是touchableRegion的计算问题，就会相对比较麻烦了，需要通过adb shell dumpsys input > input.log指令，且通过打印堆栈的方式，逐步定位问题，并找到修改方案。问题…...

编程新知 2025/7/2 8:50:20

python爬虫——气象数据爬取

一、导入库与全局配置 python 运行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用： 引入数据解析、网络请求、时间处理、数据库操作等所需库。requests：发送 …...

编程新知 2025/6/26 13:40:12

pytorch网络模型构建中的注意点

1. 网络模型构建中的问题

1.1　输入变量是Tensor张量

1.2 `init()` 方法使用

1.3　内置函数 `setattr()`

1.4　网络模型的构建

1.4.1 使用 `setattr(self, string, object1)` 添加属性；

1.4.2 使用 `getattr(self, string, object1)` 获取属性；

相关文章：

pytorch网络模型构建中的注意点

面试时候这样介绍redis，redis经典面试题

机械学习 - scikit-learn - 数据预处理 - 2

华为OD机试题 - 最长连续交替方波信号（JavaScript）| 机考必刷

executor行为相关Spark sql参数源码分析

双通道5.2GSPS（或单通道10.4GSPS）射频采样FMC+模块

理解java反射

EasyRcovery16免费的电脑照片数据恢复软件

若依微服务版在定时任务里面跨模块调用服务

SpringMVC简单配置

xcat快速入门工作流程指南

C++回顾（十九）—— 容器string

Hadoop入门

高校如何通过校企合作/实验室建设来提高大数据人工智能学生就业质量

提升学习 Prompt 总结

JavaScript学习笔记（2.0）

直击2023云南移动生态合作伙伴大会，聚焦云南移动的“价值裂变”

STM32F1开发实例-振动传感器(机械)

2023最新ELK日志平台（elasticsearch+logstash+kibana）搭建

2023-3-10 刷题情况

国防科技大学计算机基础课程笔记02信息编码

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

ESP32读取DHT11温湿度数据

C++.OpenGL （10/64）基础光照（Basic Lighting）

今日科技热点速览

Linux --进程控制

听写流程自动化实践，轻量级教育辅助

android13 app的触摸问题定位分析流程

python爬虫——气象数据爬取

1. 网络模型构建中的问题

1.1 输入变量是Tensor张量

1.2 __init__() 方法使用

1.3 内置函数 setattr()

1.4 网络模型的构建

1.4.1 使用 setattr(self, string, object1) 添加属性；

1.4.2 使用 getattr(self, string, object1) 获取属性；

相关文章：

1.1　输入变量是Tensor张量

1.2 `init()` 方法使用

1.3　内置函数 `setattr()`

1.4　网络模型的构建

1.4.1 使用 `setattr(self, string, object1)` 添加属性；

1.4.2 使用 `getattr(self, string, object1)` 获取属性；