当前位置：首页 > news >正文

【深度学习基础】`view` 和 `reshape` 的参数详解

news 2025/7/11 15:08:11

示例

假设有一个张量 tensor，形状为 [batch_size, seq_len, num_labels]。

import torchtensor = torch.randn(4, 3, 5)  # 示例张量，形状为 (4, 3, 5)

要将其形状调整为 [12, 5]，可以使用 view 或 reshape。

# 使用 view
reshaped_tensor_view = tensor.view(-1, 5)
print("View tensor shape:", reshaped_tensor_view.shape)  # 输出: torch.Size([12, 5])# 使用 reshape
reshaped_tensor_reshape = tensor.reshape(-1, 5)
print("Reshape tensor shape:", reshaped_tensor_reshape.shape)  # 输出: torch.Size([12, 5])

`view` 和 `reshape` 在具体应用中的参数解释

在序列标记分类任务中，我们通常需要将 logits 和标签调整为适合计算损失的形状。

假设 logits 的形状为 [batch_size, seq_len, num_labels]，我们希望将其调整为 [batch_size * seq_len, num_labels]，以便与标签 [batch_size * seq_len] 对应。

以下是使用 view 和 reshape 的示例：

import torch
import torch.nn as nn
from transformers import BertTokenizer, BertForTokenClassification# 初始化模型和tokenizer
model_name = 'bert-base-uncased'
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertForTokenClassification.from_pretrained(model_name, num_labels=5)  # 假设有5个分类# 假设输入文本
text = "I love natural language processing."
inputs = tokenizer(text, return_tensors="pt")# 获取模型输出
outputs = model(**inputs)
seq_logits = outputs.logits# 假设标签映射
tags_to_idx = {'O': 0, 'B-PER': 1, 'I-PER': 2, 'B-LOC': 3, 'I-LOC': 4}
tags = torch.tensor([[0, 0, 0, 0, 1, 2, 3, 4]])  # 示例标签，形状为 (batch_size, seq_len)# 使用 reshape 调整形状
pred = seq_logits.reshape([-1, len(tags_to_idx)])
label = tags.reshape([-1])
ignore_index = tags_to_idx["O"]# 计算损失
criterion = nn.CrossEntropyLoss(ignore_index=ignore_index)
loss = criterion(pred, label)
print("Loss with reshape:", loss.item())# 使用 view 调整形状
pred_view = seq_logits.view(-1, len(tags_to_idx))
label_view = tags.view(-1)# 计算损失
loss_view = criterion(pred_view, label_view)
print("Loss with view:", loss_view.item())

参数解释

seq_logits.reshape([-1, len(tags_to_idx)]) 和 seq_logits.view(-1, len(tags_to_idx)])：
- -1：表示这个维度的大小由其他维度自动推断。这里是将 [batch_size, seq_len, num_labels] 调整为 [batch_size * seq_len, num_labels]。
- len(tags_to_idx)：表示 num_labels，即分类的数量。

总结

view 和 reshape 参数：
- 参数是一个 tuple 或者 list，定义新的形状。
- -1 表示该维度的大小由其他维度自动推断。
view 的限制：要求输入张量是连续的。
reshape 的灵活性：可以处理非连续内存的张量。

通过这些详细的例子和解释，你可以更好地理解如何使用 view 和 reshape 来调整张量的形状。

【深度学习基础】`view` 和 `reshape` 的参数详解

目录基本概念参数详解示例view 和 reshape 在具体应用中的参数解释参数解释更多示例高维张量示例非连续内存示例总结基本概念 view 和 reshape 都用于调整张量的形状，它们的参数是新的形状，每个维度的大小可以指定为具体的数值或者 -1。-1 表示这个…...

编程日记 2024/6/29 6:52:10

【笔记】Spring Cloud Gateway 实现 gRPC 代理

Spring Cloud Gateway 在 3.1.x 版本中增加了针对 gRPC 的网关代理功能支持,本片文章描述一下如何实现相关支持.本文主要基于 Spring Cloud Gateway 的官方文档进行一个实践练习。有兴趣的可以翻看官方文档。由于 Grpc 是基于 HTTP2 协议进行传输的，因此 Srping …...

编程日记 2024/6/29 6:50:08

云顶之弈数据网站

摘要：随着云顶之弈游戏的广泛流行，玩家对于游戏数据的查询和最新资讯的获取需求呈现出显著增长的趋势。设计一款云顶之弈数据网站，为玩家提供便捷、高效的数据查询和资讯浏览服务，能满足玩家对于游戏数据的快速查询和实时资讯获取…...

编程日记 2024/6/29 6:49:06

Linux(Ubuntu)下源码开发整个流程完成版本(下载-＞编译-＞模拟器运行)

写这篇文章没别的意思, 年纪大了记性不好, 这次工作中下载,编译遇到了一些之前没遇到的问题,所以就所幸记录一下, 以便日后能快速查阅好了, 正题开始首先我们下载AOSP源代码开始 AOSP源代码下载首先找到官网https://source.android.google.cn/ 进入后最上面点击获取源代…...

编程日记 2024/6/29 6:47:05

el-form表单实现校验

前端表单实现， rules 属性传入约定的验证规则，并将 form-Item 的 prop 属性设置为需要验证的特殊键值即可。 <el-form ref"ruleFormRef" :model"interviewForm" label-position"left" require-asterisk-position"…...

编程日记 2024/6/29 6:45:02

一台TrinityCore服务器客户端连接网速慢（未解决）

在FreeBSD开bhyve安装Ubuntu，然后安装了TrinityCore服务器，在只是经过一层NAT，两边都是局域网的情况下，连接速度竟然很慢，慢到600ms。服务器安装见：尝试在FreeBSD 的jail、bhyve里安装TrinityCore-CSDN博…...

编程日记 2024/6/29 6:44:01

[系统运维|Xshell]宿主机无法连接上NAT网络下的虚拟机进行维护？主机ping不通NAT网络下的虚拟机，虚拟机ping的通主机！解决办法

遇到的问题：主机ping不通NAT网络下的虚拟机，虚拟机ping的通主机服务器：Linux（虚拟机） 主机PC：Windows 虚拟机：vb，vm测试过没问题，vnc没测试不清楚虚拟机网络&#xff1…...

编程日记 2024/6/29 6:41:59

查找数组中最大的元素值。实例 1 #include <stdio.h>int main() {int array[10] {1, 2, 3, 4, 5, 6, 7, 8, 9, 0};int loop, largest;largest array[0];for(loop 1; loop < 10; loop) {if( largest < array[loop] ) largest array[loop];}printf("最大…...

编程日记 2024/6/29 6:40:57

MySQL之可扩展性(七)

可扩展性通过集群扩展理想的扩展方案时单一逻辑数据库能够存储尽可能多的数据，处理尽可能多的查询，并如期望的那样增长。许多人的第一想法就是建立一个"集群"或者"网格"来无缝处理这些事情，这样应用就无须去做太多工…...

编程日记 2024/6/29 6:39:56

微服务框架中Nacos的个人学习心得

微服务框架需要学习的东西很多，基本上我把它分为了五个模块： 第一：微服务技术模块分为三个常用小模块： 1.微服务治理： 注册发现远程调用配置管理网关路由 2.微服务保护： 流量控制系统保护熔断降级服…...

编程日记 2024/6/29 6:38:53

Unity Animator 运行时修改某个动画状态的播放速度

1.添加动画参数，选择需要动态修改速度的动画状态 2.在属性面板种设置速度倍速参数...

编程日记 2024/6/29 6:37:52

阿里云常用的操作

阿里云常见的产品和服务容器服务可以查看容器日志、监控容器cpu和内存， 日志服务 SLS 可以查看所有服务的日志， Web应用防火墙 WAF 可以查看 QPS. 阿里云查看集群： 点击 “产品和服务” 中的容器服务，可以查看集群列表&…...

编程日记 2024/6/29 6:36:51

【MATLAB源码-第231期】基于matlab的polar码编码译码仿真，对比SC,SCL,BP,SCAN,SSC等译码算法误码率。

操作环境： MATLAB 2022a 1、算法描述极化码（Polar Code） 极化码（Polar Code）是一种新型的信道编码技术，由土耳其裔教授Erdal Arıkan在2008年提出。极化码在理论上被证明能够在信道容量上达到香农极限…...

编程日记 2024/6/29 6:35:50

创新实训(十三) 项目开发——实现用户终止对话功能

思路分析： 如何实现用户终止AI正在进行的回答？ 分析实现思路如下： 首先是在用户点击发送后，切换终止对话，点击后大模型终止对话，停止sse，不再接收后端的消息。同时因为对话记录存入数据库是后…...

编程日记 2024/6/29 6:34:49

基于Java+MySQL停车场车位管理系统详细设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍：✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者，博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟 感兴趣的可以先收藏起来，…...

编程日记 2024/6/29 6:33:48

LeetCode 53.最大子数组和（dp）

给你一个整数数组 nums ，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例 1： 输入：nums [-2,1,-3,4,-1,2,1,-5,4] 输出：…...

编程日记 2024/6/29 6:30:44

IOS17闪退问题Assertion failure in void _UIGraphicsBeginImageContextWithOptions

最近项目更新到最新版本IOS17，发现一个以前的页面突然闪退了。原来是IOS17下，这个方法 UIGraphicsBeginImageContext(CGSize size) 已经被移除，原参数如果size为0的话，会出现闪退现象。根据说明，上述方法已经被替换…...

编程日记 2024/6/29 6:29:42

float8格式

产生背景在人工智能神经元网络中，一个参数用1字节表示即可，或者说，这是个猜想：因为图像的颜色用8比特表示就够了，所以说，猜想神经元的区分度应该小于256。数字的分配 8比特有256个码位，分为…...

编程日记 2024/6/29 6:27:40

云效BizDevOps上手亲测

云效BizDevOps上手亲测什么是云效项目协作Projex配置2023业务空间原始诉求字段原始诉求工作流创建原始诉求配置2023产品空间创建主题业务原始诉求关联主题配置2023研发空间新建需求需求关联主题与传统区别云效开发流程传统开发流程云效BizDevOps 操作体验什么是云效在说到…...

编程日记 2024/6/29 6:26:39

亚太杯赛题思路发布（中文版）

导读： 本文将继续修炼回归模型算法，并总结了一些常用的除线性回归模型之外的模型，其中包括一些单模型及集成学习器。保序回归、多项式回归、多输出回归、多输出K近邻回归、决策树回归、多输出决策树回归、AdaBoost回归、梯度提升决策树回归…...

编程日记 2024/6/29 6:25:38

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章传送阵>> 点我查看说明：假设每台服务器已…...

编程新知 2025/7/8 22:15:29

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API，用于在函数组件中使用 state 和其他 React 特性（例如生命周期方法、context 等）。Hooks 通过简洁的函数接口，解决了状态与 UI 的高度解耦，通过函数式编程范式实现更灵活 Rea…...

编程新知 2025/7/7 6:59:35

在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module

1、为什么要修改 CONNECT 报文？ 多租户隔离：自动为接入设备追加租户前缀，后端按 ClientID 拆分队列。零代码鉴权：将入站用户名替换为 OAuth Access-Token，后端 Broker 统一校验。灰度发布：根据 IP/地理位写…...

编程新知 2025/6/27 14:22:50

Axios请求超时重发机制

Axios 超时重新请求实现方案在 Axios 中实现超时重新请求可以通过以下几种方式： 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

编程新知 2025/6/21 10:09:08

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别直接训练提示词嵌入向量的核心区别您提到的代码： prompt_embedding = initial_embedding.clone().requires_grad_(True) optimizer = torch.optim.Adam([prompt_embedding...

编程新知 2025/7/4 0:50:01