当前位置：首页 > news >正文

Pytorch-Transformer轴承故障一维信号分类(三)

news 2026/2/8 17:36:32

前言

1 数据集制作与加载

1.1 导入数据

第一步，导入十分类数据

第二步，读取MAT文件驱动端数据

第三步，制作数据集

第四步，制作训练集和标签

1.2 数据加载，训练数据、测试数据分组，数据分batch

2 Transformer分类模型和超参数选取

2.1 定义Transformer分类模型，采用Transformer架构中的编码器：

2.2 定义模型参数

2.3 模型结构

3 Transformer模型训练与评估

3.1 模型训练

3.2 模型评估

往期精彩内容：

Python-凯斯西储大学（CWRU）轴承数据解读与分类处理

Python轴承故障诊断 (一)短时傅里叶变换STFT

Python轴承故障诊断 (二)连续小波变换CWT

Python轴承故障诊断 (三)经验模态分解EMD

Python轴承故障诊断 (四)基于EMD-CNN的故障分类

Python轴承故障诊断 (五)基于EMD-LSTM的故障分类

Pytorch-LSTM轴承故障一维信号分类(一)

Pytorch-CNN轴承故障一维信号分类(二)

前言

本文基于凯斯西储大学（CWRU）轴承数据，先经过数据预处理进行数据集的制作和加载，最后通过Pytorch实现Transformer模型对故障数据的分类，并介绍Transformer模型的超参数。凯斯西储大学轴承数据的详细介绍可以参考下文：

Python-凯斯西储大学（CWRU）轴承数据解读与分类处理

1 数据集制作与加载

1.1 导入数据

参考之前的文章，进行故障10分类的预处理，凯斯西储大学轴承数据10分类数据集：

第一步，导入十分类数据

import numpy as np
import pandas as pd
from scipy.io import loadmatfile_names = ['0_0.mat','7_1.mat','7_2.mat','7_3.mat','14_1.mat','14_2.mat','14_3.mat','21_1.mat','21_2.mat','21_3.mat']for file in file_names:# 读取MAT文件data = loadmat(f'matfiles\\{file}')print(list(data.keys()))

第二步，读取MAT文件驱动端数据

# 采用驱动端数据
data_columns = ['X097_DE_time', 'X105_DE_time', 'X118_DE_time', 'X130_DE_time', 'X169_DE_time','X185_DE_time','X197_DE_time','X209_DE_time','X222_DE_time','X234_DE_time']
columns_name = ['de_normal','de_7_inner','de_7_ball','de_7_outer','de_14_inner','de_14_ball','de_14_outer','de_21_inner','de_21_ball','de_21_outer']
data_12k_10c = pd.DataFrame()
for index in range(10):# 读取MAT文件data = loadmat(f'matfiles\\{file_names[index]}')dataList = data[data_columns[index]].reshape(-1)data_12k_10c[columns_name[index]] = dataList[:119808]  # 121048  min: 121265
print(data_12k_10c.shape)
data_12k_10c

第三步，制作数据集

train_set、val_set、test_set 均为按照7：2：1划分训练集、验证集、测试集，最后保存数据

第四步，制作训练集和标签

# 制作数据集和标签
import torch# 这些转换是为了将数据和标签从Pandas数据结构转换为PyTorch可以处理的张量，
# 以便在神经网络中进行训练和预测。def make_data_labels(dataframe):'''参数 dataframe: 数据框返回 x_data: 数据集     torch.tensory_label: 对应标签值  torch.tensor'''# 信号值x_data = dataframe.iloc[:,0:-1]# 标签值y_label = dataframe.iloc[:,-1]x_data = torch.tensor(x_data.values).float()y_label = torch.tensor(y_label.values.astype('int64')) # 指定了这些张量的数据类型为64位整数，通常用于分类任务的类别标签return x_data, y_label# 加载数据
train_set = load('train_set')
val_set = load('val_set')
test_set = load('test_set')# 制作标签
train_xdata, train_ylabel = make_data_labels(train_set)
val_xdata, val_ylabel = make_data_labels(val_set)
test_xdata, test_ylabel = make_data_labels(test_set)
# 保存数据
dump(train_xdata, 'trainX_1024_10c')
dump(val_xdata, 'valX_1024_10c')
dump(test_xdata, 'testX_1024_10c')
dump(train_ylabel, 'trainY_1024_10c')
dump(val_ylabel, 'valY_1024_10c')
dump(test_ylabel, 'testY_1024_10c')

1.2 数据加载，训练数据、测试数据分组，数据分batch

import torch
from joblib import dump, load
import torch.utils.data as Data
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
# 参数与配置
torch.manual_seed(100)  # 设置随机种子，以使实验结果具有可重复性
device = torch.device("cuda" if torch.cuda.is_available() else "cpu") # 有GPU先用GPU训练# 加载数据集
def dataloader(batch_size, workers=2):# 训练集train_xdata = load('trainX_1024_10c')train_ylabel = load('trainY_1024_10c')# 验证集val_xdata = load('valX_1024_10c')val_ylabel = load('valY_1024_10c')# 测试集test_xdata = load('testX_1024_10c')test_ylabel = load('testY_1024_10c')# 加载数据train_loader = Data.DataLoader(dataset=Data.TensorDataset(train_xdata, train_ylabel),batch_size=batch_size, shuffle=True, num_workers=workers, drop_last=True)val_loader = Data.DataLoader(dataset=Data.TensorDataset(val_xdata, val_ylabel),batch_size=batch_size, shuffle=True, num_workers=workers, drop_last=True)test_loader = Data.DataLoader(dataset=Data.TensorDataset(test_xdata, test_ylabel),batch_size=batch_size, shuffle=True, num_workers=workers, drop_last=True)return train_loader, val_loader, test_loaderbatch_size = 32
# 加载数据
train_loader, val_loader, test_loader = dataloader(batch_size)

2 Transformer分类模型和超参数选取

2.1 定义Transformer分类模型，采用Transformer架构中的编码器：

注意：输入数据进行了堆叠，把一个1*1024 的序列进行划分堆叠成形状为 32 * 32，就使输入序列的长度降下来了

2.2 定义模型参数

# 模型参数
input_dim = 32 # 输入维度
hidden_dim = 512  # 注意力维度
output_dim  = 10  # 输出维度
num_layers = 4   # 编码器层数
num_heads = 8    # 多头注意力头数
batch_size = 32
# 模型
model = TransformerModel(input_dim, output_dim, hidden_dim, num_layers, num_heads, batch_size)  
model = model.to(device)
loss_function = nn.CrossEntropyLoss(reduction='sum')  # loss
learn_rate = 0.0003
optimizer = torch.optim.Adam(model.parameters(), lr=learn_rate)  # 优化器

2.3 模型结构

3 Transformer模型训练与评估

3.1 模型训练

训练结果

100个epoch，准确率将近90%，Transformer模型分类效果良好，参数过拟合了，适当调整模型参数，降低模型复杂度，还可以进一步提高分类准确率。

注意调整参数：

可以适当增加 Transforme编码器层数和隐藏层的维度，微调学习率；
调整多头注意力的头数，增加更多的 epoch （注意防止过拟合）
可以改变一维信号堆叠的形状（设置合适的长度和维度）

3.2 模型评估

# 模型 测试集 验证  
import torch.nn.functional as F# 加载模型
model =torch.load('best_model_transformer.pt')
# model = torch.load('best_model_cnn2d.pt', map_location=torch.device('cpu'))# 将模型设置为评估模式
model.eval()
# 使用测试集数据进行推断
with torch.no_grad():correct_test = 0test_loss = 0for test_data, test_label in test_loader:test_data, test_label = test_data.to(device), test_label.to(device)test_output = model(test_data)probabilities = F.softmax(test_output, dim=1)predicted_labels = torch.argmax(probabilities, dim=1)correct_test += (predicted_labels == test_label).sum().item()loss = loss_function(test_output, test_label)test_loss += loss.item()test_accuracy = correct_test / len(test_loader.dataset)
test_loss = test_loss / len(test_loader.dataset)
print(f'Test Accuracy: {test_accuracy:4.4f}  Test Loss: {test_loss:10.8f}')Test Accuracy: 0.9570  Test Loss: 0.12100271

Pytorch-Transformer轴承故障一维信号分类(三)

目录前言 1 数据集制作与加载 1.1 导入数据第一步，导入十分类数据第二步，读取MAT文件驱动端数据第三步，制作数据集第四步，制作训练集和标签 1.2 数据加载，训练数据、测试数据分组，数据分batch…...

编程日记 2023/12/12 9:47:38

pycharm多线程报错的问题（未解决）

暂未解决！ 看了一下可能是这里的问题： 根据建议，在walks之前加了 freeze_support() 但是没有效果。关键是，在jupyter上运行是没有问题的！ 未解决。...

编程日记 2023/12/12 9:44:36

【常用字符大全】含emoji表情

常用符号大全 ❤❥웃유♋☮✌☏☢☠✔☑♚▲♪✈✞↑↓◆◇⊙■□△▽─│♥❣♂♀☿Ⓐ✍✉☣☤✘☒♛▼♫⌘☪≈←→◈◎☉★☆⊿※¡━┃♡ღツ☼☁❅♒✎©™Σ✪✯☭➳卐√↖↗●◐Θ◤◥︻〖〗┄┆℃℉✿ϟ☃☂✄¢€£∞✫★✡↙↘○◑⊕◣◢︼【】┅┇…...

编程日记 2023/12/12 9:42:34

android 蓝牙开关设置

frameworks/base/packages/SettingsProvider/res/values/defaults.xml <bool name"def_bluetooth_on">false</bool>将 def_bluetooth_on 的值设为false（系统默认开启值） adb动态设置关闭：adb shell settings put gl…...

编程日记 2023/12/12 9:41:33

C++ extern “C“ 用法

extern “C” 由于c中需要支持函数重载，所以c和c中对同一个函数经过编译后生成的函数名是不相同的 extern “C” 的主要作用就是为了实现c代码能够调用其他 c 语言代码。 1(不常用) //告诉编译器 show() 函数按c语言的方式进行编译和链接 extern "C" voi…...

编程日记 2023/12/12 9:39:31

HTML面试题---专题四

文章目录一、前言二、如何在 HTML 中嵌入音频文件？三、解释 <script> 标签中 defer 属性的用途。四、如何在 HTML 中创建粘性/固定导航栏？五、HTML 中的 span 元素的用途是什么？六、如何使 HTML 元素可拖动？七、解释 <i…...

编程日记 2023/12/12 9:38:30

stm32项目（11）——基于stm32的俄罗斯方块游戏机

1.功能设计使用stm32f103zet6平台，以及一块LCD屏幕，实现了一个俄罗斯方块游戏机。可以用按键调整方块的位置、还可以控制方块下降的速度！ 2.视频演示俄罗斯方块 3.俄罗斯方块发展史俄罗斯方块是一种经典的拼图游戏，由苏联俄罗…...

编程日记 2023/12/12 9:37:28

【计算机网络基础2】IP地址和子网掩码

1、IP地址网络地址 IP地址由网络号（包括子网号）和主机号组成，网络地址的主机号为全0，网络地址代表着整个网络。广播地址广播地址通常称为直接广播地址，是为了区分受限广播地址。广播地址与网络地址的主机号正…...

编程日记 2023/12/12 9:33:25

ES6-import后是否有{}的区别

在ES6中，import语句用于导入其他模块中的变量、函数、类等。在使用import语句时，可以选择是否使用花括号{}来包裹导入的内容，这会影响导入的内容的使用方式。 1.使用花括号{}： 当使用花括号{}时，表示只导入指定的变量…...

编程日记 2023/12/12 9:29:22

rv1126-rv1109-以太网功能-eth-(原理篇)

这里只是浅浅分析一下 1.主控里面会内置mac 2.mac有组接口接到phy(网络芯片:8201) 3.phy(网络芯片:8201)接到网口 //这里就到达硬件的接口了,大致就是这个原理; 4.然后涉及到软件部分就是mdio总线;这个总线是注册phy用的; 如果注册失败会导致网口无法使用 [ 1.002751] m…...

编程日记 2023/12/12 9:27:20

【IDEA】反向撤销操作快捷键 ctrl+shift+z 和搜狗热键冲突的解决办法

当我们执行某些操作时与搜狗热键冲突，直接取消搜狗的快捷键即可！！！以下以 ctrlshiftz 为例。在输入悬浮框右键找到更多设置按键里面找到系统功能快捷键设置取消掉冲突的热键即可...

编程日记 2023/12/12 9:21:15

数据结构之----逻辑结构、物理结构

数据结构之----逻辑结构、物理结构目前我们常见的数据结构分别有： 数组、链表、栈、队列、哈希表、树、堆、图而它们可以从逻辑结构和物理结构两个维度进行分类。什么是逻辑结构？ 逻辑结构是指数据元素之间的逻辑关系，而逻辑结构又分为…...

编程日记 2023/12/12 9:20:15

pip 通过git安装库

举例：安装peft库 git clone https://github.com/huggingface/peft.git cd peft python -m pip install . 解释： 使用git clone克隆PEFT库的代码。进入克隆的目录。使用python -m pip install .来安装PEFT库。补充：使用pip安装到指定编译器…...

编程日记 2023/12/12 9:19:13

C语言——从终端输入 3 个数 a、b、c，按从大到小的顺序输出。

方式一 #include <stdio.h> int main() {int a, b, c, temp;printf("请输入三个数：\n");scanf("%d %d %d", &a, &b, &c);if (a < b) {temp a;a b;b temp;}if (a < c) {temp a;a c;c temp;}if (b < c) {temp…...

编程日记 2023/12/12 9:17:11

【JVM从入门到实战】（二）字节码文件的组成

一、Java虚拟机的组成二、字节码文件的组成字节码文件的组成 – 应用场景字节码文件的组成部分-Magic魔数什么是魔数？ Java字节码文件中的魔数文件是无法通过文件扩展名来确定文件类型的，文件扩展名可以随意修改，不影响文件的内容。…...

编程日记 2023/12/12 9:16:10

OPC UA常见故障信息代码

错误信息解释0x00000000操作成功。0x40000000值不确定，但原因不明。0x80000000值为坏，但原因不明。Bad_UnexpectedError 0x80010000发生非预期错误。Bad_InternalError 0x80020000编程或配置错误时发生内部错误。Bad_OutOfMemory 0x80030000完成操作所需…...

编程日记 2023/12/12 9:12:05

第20关快速掌握K8S下的有状态服务StatefulSet

------> 课程视频同步分享在今日头条和B站大家好，我是博哥爱运维，K8s是如何来管理有状态服务的呢？跟着博哥来会会它们吧！ 前面我们讲到了Deployment、DaemonSet都只适合用来跑无状态的服务pod，那么这里的Statefu…...

编程日记 2023/12/12 9:11:04

如何使用https://www.krea.ai/来实现文生图，图生图，

网址：https://www.krea.ai/apps/image/realtime Krea.ai 是一个强大的人工智能艺术生成器，可用于创建各种创意内容。它可以用来生成文本描述的图像、将图像转换为其他图像，甚至写博客文章。文本描述生成图像要使用 Krea.ai 生成文本描述…...

编程日记 2023/12/12 9:10:04

点滴生活记录2

我从小跟着我爷爷奶奶，小学六年级转到县城上小学，就没跟我奶奶他们住一起了。十一回家，把奶奶接到我这住，细想，自六年级之后，就很少跟奶奶住一起了。奶奶（间歇性）耳聋，为…...

编程日记 2023/12/12 9:09:03

【带头学C++】----- 九、类和对象 ---- 9.12 C++之友元函数（9.12.1---12.4）

❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️创做不易，麻烦点个关注❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️ ❤️❤️❤️❤️❤️❤️❤️❤️❤️文末有惊喜！献舞一支！❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️ 目录 9.12…...

编程日记 2023/12/12 9:07:01

idea大量爆红问题解决

问题描述在学习和工作中，idea是程序员不可缺少的一个工具，但是突然在有些时候就会出现大量爆红的问题，发现无法跳转，无论是关机重启或者是替换root都无法解决就是如上所展示的问题，但是程序依然可以启动。问题解决…...

编程新知 2026/2/8 6:37:38

Linux链表操作全解析

Linux C语言链表深度解析与实战技巧一、链表基础概念与内核链表优势1.1 为什么使用链表？1.2 Linux 内核链表与用户态链表的区别二、内核链表结构与宏解析常用宏/函数三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势5.1 插入效率5.2 安全…...

编程新知 2025/12/3 20:14:32

23-Oracle 23 ai 区块链表（Blockchain Table）

小伙伴有没有在金融强合规的领域中遇见，必须要保持数据不可变，管理员都无法修改和留痕的要求。比如医疗的电子病历中，影像检查检验结果不可篡改行的，药品追溯过程中数据只可插入无法删除的特性需求；登录日志、修改日志…...

编程新知 2026/1/27 3:40:30

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

循环冗余码校验CRC码算法步骤+详细实例计算

通信过程：（白话解释） 我们将原始待发送的消息称为 M M M，依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)（意思就是 G （ x ) G（x) G（x) 是已知的）&#xff0…...

编程新知 2026/2/8 8:16:14

cf2117E

原题链接：https://codeforces.com/contest/2117/problem/E 题目背景： 给定两个数组a,b，可以执行多次以下操作：选择 i (1 < i < n - 1)，并设置或，也可以在执行上述操作前执行一次删除任意和。求…...

编程新知 2026/2/4 15:29:40

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录一、搜索引擎1、什么是搜索引擎？2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长，文件大。2.其次，树深，IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

编程新知 2026/1/30 17:10:19

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码五、报告文件爬取5.1 提…...

编程新知 2026/2/4 12:52:32

dify打造数据可视化图表

一、概述在日常工作和学习中，我们经常需要和数据打交道。无论是分析报告、项目展示，还是简单的数据洞察，一个清晰直观的图表，往往能胜过千言万语。一款能让数据可视化变得超级简单的 MCP Server，由蚂蚁集团 AntV 团队…...

编程新知 2026/1/20 20:10:03

前言

1 数据集制作与加载

1.1 导入数据

第一步，导入十分类数据

第二步，读取MAT文件驱动端数据

第三步，制作数据集

第四步，制作训练集和标签

1.2 数据加载，训练数据、测试数据分组，数据分batch

2 Transformer分类模型和超参数选取

2.1 定义Transformer分类模型，采用Transformer架构中的编码器：

2.2 定义模型参数

2.3 模型结构

3 Transformer模型训练与评估

3.1 模型训练

3.2 模型评估

相关文章：