牛了,LSTM+Transformer王炸结合创新,荣登Nature,精度高达95.65%
【LSTM结合Transformer】的研究方向探索了如何利用Transformer模型处理序列数据的能力以及LSTM在捕捉时间序列依赖性方面的优势。这一方向的意义在于通过融合两种模型的特点,提高了对复杂时空数据的预测准确性,尤其是在智能电网攻击检测、多变量时间序列预测和时空预测等领域。研究结果表明,这种混合模型能够有效地捕捉数据中的时空特征,增强了模型对长期依赖关系的学习能力,并在多个数据集上实现了性能上的提升。近年来,无数的研究者们对LSTM结合Transformer这个领域的进行了大量研究,并产出了大量的学术成果。
这种策略结合了两者的优势,在各种序列分析任务中实现了更精确的预测、更好的性能表现、更高的训练效率。比如登上Nature子刊的最新混合架构,以及精度高达95.65%的BiLSTM-Transformer。
为了帮助大家全面掌握【LSTM结合Transformer】的方法并寻找创新点,本文总结了最近两年【LSTM结合Transformer】相关的16篇前沿研究成果,这些论文、来源、论文的代码都整理好了,希望能给各位的学术研究提供新的思路。
需要的同学扫码添加我
回复“LSTM16”即可全部领取
1、XTM: A Novel Transformer and LSTM-Based Model for Detection and Localization of Formally Verified FDI Attack in Smart Grid
方法:
- 该论文提出了一种名为XTM的新型混合深度学习模型,用于实时检测和定位智能电网中的虚假数据注入(FDI)攻击。
- XTM模型结合了变换器(Transformer)和长短期记忆网络(LSTM),是首个在该研究领域探索变换器性能的混合深度学习模型。
- 论文首先引入了一种新的阈值选择方案,以检测FDI的存在,取代了传统的坏数据检测(BDD)算法。
- 接着,使用多标签分类方法定位攻击的确切入侵点。
- 为了操纵数据集,使用了基于正式验证的约束满足攻击向量模型。
- 在IEEE-14总线系统中,考虑了电力系统的时序特性,使用小时和分钟级的传感器数据来训练和评估所提出的模型,实现了接近100%的检测准确率。
- 还评估了位置检测模块的行准确率(RACC),对于小时和分钟级数据集,值分别为92.99%和99.99%。
创新点
- 混合模型架构:XTM是首个将变换器和LSTM结合用于FDI攻击检测的模型,利用了变换器在处理序列数据方面的优势。
- 实时监测与预测:XTM能够实时预测传感器测量值,独立于系统参数,使其能够有效地作为电网入侵时的FDI攻击缓解工具。
- 阈值选择方案:提出了一种新的阈值选择方案,提高了对FDI攻击存在性的检测准确性,取代了传统的BDD方法。
- 多标签分类定位:使用多标签分类方法来确定攻击的确切位置,这种方法在检测攻击位置方面提供了更高的灵活性和准确性。
- 数据集和攻击向量的公开:论文提供了详细的数据集和攻击向量描述,并将它们公开在GitHub上,促进了研究社区的进一步研究和模型验证。
- 高准确率:在IEEE-14总线系统上进行的测试显示,XTM模型在检测FDI攻击及其位置方面,相比文献中提到的其他深度学习方法,展现出了更高的性能。
- 考虑时序特性:模型训练和评估考虑了电力系统的小时级和分钟级数据,增强了模型对实时数据的适应性和准确性。
2、SwinLSTM: Improving Spatiotemporal Prediction Accuracy using Swin Transformer and LSTM
方法:
- 该论文提出了一种新的循环单元SwinLSTM,用于提高时空预测的准确性。
- SwinLSTM结合了Swin Transformer模块和简化版的LSTM,替代了ConvLSTM中的卷积结构,引入自注意力机制。
- 论文构建了一个以SwinLSTM单元为核心的网络架构,用于时空预测任务。
- 该架构首先将输入图像分割成一系列图像块,然后将这些图像块展平并输入到嵌入层。
- SwinLSTM层接收嵌入后的图像块或前一层(Patch Merging或Patch Expanding)转换后的隐藏状态,并结合前一时间步的细胞和隐藏状态来提取时空表示。
- 最后,重建层将时空表示解码生成下一帧。
创新点
- SwinLSTM单元:提出了一种新的循环单元,有效结合了Swin Transformer的全局空间建模能力和LSTM的时间序列建模能力。
- 自注意力机制:使用自注意力机制代替传统的卷积操作,以捕获全局空间依赖性,这在传统的CNN中是难以实现的。
- 架构设计:构建了一个以SwinLSTM单元为核心的预测网络,该网络能够同时有效地模拟空间和时间依赖性。
- 无特定技巧:SwinLSTM在没有使用特定技巧的情况下,超越了现有的最先进方法,这表明了其方法的通用性和有效性。
- 跨数据集验证:在多个数据集(Moving MNIST、Human3.6m、TaxiBJ和KTH)上进行了实验验证,证明了SwinLSTM的优越性能和泛化能力。
- 性能提升:与ConvLSTM相比,SwinLSTM在预测精度上表现出显著提升,这强调了学习全局空间依赖性对于捕获时空依赖性的重要性。
需要的同学扫码添加我
回复“LSTM16”即可全部领取
3、TCLN: A Transformer-based Conv-LSTM network for multivariate time series forecasting
方法:
- 该论文提出了一种基于Transformer、卷积神经网络(CNN)和长短期记忆网络(LSTM)的新型模型,用于解决多变量时间序列预测(MTSF)问题
- 模型首先通过提出的多核CNN模块提取空间特征向量
- 然后,通过包含Transformer编码器层和LSTM网络的编码器层来充分提取时间信息,同时获得潜在的时空相关性
- 为了提取更多的特征信息,模型堆叠了多个编码器层。
- 最后,输出通过由ReLU激活函数和线性层组成的解码器层进行解码。
- 为了提高模型的鲁棒性,还集成了一个自回归模型。
创新点:
- 多核CNN模块:与传统卷积层相比,多核CNN模块具有更深的感受野,能够提取变量间的更多空间信息。
- 编码器层的结合:Transformer编码器层与LSTM网络的结合,不仅能够处理长序列输入,还能从输入顺序的角度有效获取时间信息。
- 堆叠编码器层:通过堆叠多个编码器层,模型能够更充分地提取特征信息。
- 自回归模型集成:自回归模型的加入,增强了模型对目标变量过去序列线性相关的提取能力,提升了预测精度。
- 多变量时间序列预测:模型针对多变量时间序列预测任务进行了特别设计,能够处理复杂的非线性关系和长期依赖问题。
- 多数据集验证:在包括经济、气候、能源和工业产品产量的四个数据集上验证了模型性能,证明了模型的泛化能力。
- 长时域预测能力:模型在长时域预测任务上表现出色,能够满足实际应用中对长期预测的需求。
需要的同学扫码添加我
回复“LSTM16”即可全部领取
相关文章:

牛了,LSTM+Transformer王炸结合创新,荣登Nature,精度高达95.65%
【LSTM结合Transformer】的研究方向探索了如何利用Transformer模型处理序列数据的能力以及LSTM在捕捉时间序列依赖性方面的优势。这一方向的意义在于通过融合两种模型的特点,提高了对复杂时空数据的预测准确性,尤其是在智能电网攻击检测、多变量时间序列…...

Java面试题:通过实例说明工厂模式和抽象工厂模式的用法,以及它们在解耦中的作用
工厂模式和抽象工厂模式是创建型设计模式中的两种,主要用于对象的创建,并且通过将对象的创建过程封装起来,来实现代码的解耦和灵活性。下面通过具体实例来说明这两种模式的用法及其在解耦中的作用。 工厂模式(Factory Method Pat…...

成都欣丰洪泰文化传媒有限公司电商服务的创新者
在数字化浪潮席卷全球的今天,电商行业正以前所未有的速度蓬勃发展。作为这一领域的佼佼者,成都欣丰洪泰文化传媒有限公司凭借其对电商服务的深度理解和精准把握,成功在竞争激烈的市场中脱颖而出,成为行业内的佼佼者。 一、公司简…...

学习笔记——动态路由——RIP(距离矢量协议)
一、距离矢量协议 1、距离矢量协议 矢量行为:协议收到一个路由之后,查看是否可以加入到本地的路由表中,如果可以加入,则可以传递,如果不可以加入,则无法传递。 距离矢量路由协议 RIP基于距离矢量算法(又…...

【python】OpenCV—Segmentation
文章目录 cv2.kmeans牛刀小试 cv2.kmeans cv2.kmeans 是 OpenCV 库中用于执行 K-Means 聚类算法的函数。以下是根据参考文章整理的 cv2.kmeans 函数的中文文档: 一、函数功能 cv2.kmeans 用于执行 K-Means 聚类算法,将一组数据点划分到 K 个簇中&…...

python-题库篇-Python语言特性
文章目录 Python语言特性1 Python的函数参数传递2 Python中的元类(metaclass)3 staticmethod和classmethod4 类变量和实例变量5 Python自省6 字典推导式7 Python中单下划线和双下划线8 字符串格式化:%和.format9 迭代器和生成器10 *args and **kwargs11 面向切面编程AOP和装饰器…...

WEB界面上使用ChatGPT
(作者:陈玓玏) 开源项目,欢迎star哦,https://github.com/tencentmusic/cube-studio 随着大模型不断发展,现在无论写代码,做设计,甚至老师备课、评卷都可以通过AI大模型来实现了&…...

【Matlab】CNN-LSTM分类 卷积神经网络-长短期记忆神经网络组合模型(附代码)
资源下载: https://download.csdn.net/download/vvoennvv/89466499 分类算法资源合集:https://download.csdn.net/download/vvoennvv/89466519 目录 Matlab SVM支持向量机分类算法 Matlab RF随机森林分类算法 Matlab RBF径向基神经网络分类算法 Ma…...

性能工具之 MySQL OLTP Sysbench BenchMark 测试示例
文章目录 一、前言二、测试环境1、服务器配置2、测试拓扑 三、测试工具安装四、测试步骤1、导入数据2、压测数据3、清理数据 五、结果解析六、最后 一、前言 做为一名性能工程师掌握对 MySQL 的性能测试是非常必要的,本文基于 Sysbench 对MySQL OLTP(联…...

【QT】QCustomPlot库中iSelectPlottables的使用
QCP::iSelectPlottables 是 QCustomPlot 库中的一个枚举值,用于控制选择交互。QCustomPlot 是一个用于创建绘图和数据可视化的Qt库。 QCP::iSelectPlottables 允许用户选择图表中的绘图对象(如图形、曲线、柱状图等)。 应用场景 QCP::iSele…...

字节跳动联手博通:5nm AI芯片诞生了?
字节跳动联手博通:5nm AI芯片诞生了? 前言 就在6月24日,字节跳动正在与美国博通合作开发一款5纳米工艺的专用集成电路(ASIC) AI处理器。这款芯片旨在降低采购成本并确保高端AI芯片的稳定供应。 根据报道,尽管芯片设计工作进展顺利…...

【数据结构与算法】动态查找表(二叉排序树,二叉平衡树)详解
二叉排序树的数据结构。 struct TreeNode {ElemType data;TreeNode *left, *right; }; using BiTree TreeNode *;结构体包含三个成员: data 是一个 ElemType 类型的变量,用于存储二叉搜索树节点的数据。left 是一个指向 TreeNode 类型的指针ÿ…...

PyTorch中“No module named ‘torch._six‘“的报错场景及处理方法
🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 在使用PyTorch时,您可能会遇到"No module named ‘torch._six’"的错误。这通常是因为PyTorch的某些…...

Spring Boot 集成 MinIO 实现文件上传
Spring Boot 集成 MinIO 实现文件上传 一、 Minio 服务准备 MinIO的搭建过程参考 Docker 搭建 MinIO 对象存储。 登录MinIO控制台,新建一个 Bucket,修改 Bucket 权限为公开。 二、MinIO 集成 添加 MinIO 依赖 <!-- https://mvnrepository.com/ar…...

目标跟踪——KCF源码用python实现
from numpy.fft import fft2, ifft2, fftshift import cv2 import numpy as npclass HOG:def __init__(self, winSize):""":param winSize: 检测窗口的大小"""self.winSize winSizeself.blockSize (8, 8)self.blockStride (4, 4)self.cellSiz…...

前端 转换笔记
<!DOCTYPE html> <html> <head> <meta charset"utf-8" /> <title>转换</title> <style> .box{ /* 盒子摆在body的正中间 */ position: absolut…...

个人开发笔记
开发笔记 开发常见问题Vue开发中页面flex滚动布局,内容置顶问题功能快捷键 开发常见问题 Vue开发中页面flex滚动布局,内容置顶问题 直接操作路由: const router createRouter({routes: routes,history: createWebHashHistory(),scrollBeha…...

pdf压缩,pdf压缩在线,pdf文件太大怎么变小
在数字化时代,PDF文档因其跨平台、保持原样、易于阅读和打印等特点,成为了我们日常工作和生活中不可或缺的一部分。然而,随着PDF文件的不断累积,存储空间逐渐变得紧张,特别是在处理大量大型PDF文件时,如何有…...

Go 如何使用指针灵活操作内存
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…...

【面试干货】Java中的++操作符与线程安全性
【面试干货】Java中的操作符与线程安全性 1、什么是线程安全性?2、 操作符的工作原理3、 操作符与线程安全性4、如何确保线程安全?5、 结论 💖The Begin💖点点关注,收藏不迷路💖 在Java编程中,操…...

NLP学习与踩坑记录(持续更新版)
NLP学习与踩坑记录(持续更新版) OSError: Cant load tokenizer for bert-base-uncased.google.protobuf.message.DecodeError: Error parsing messageDeepspeed 本博客记录了博主在学习NLP时遇到了各种各样的问题与解决方法,供大家参考&#…...

Java也能做OCR!SpringBoot 整合 Tess4J 实现图片文字识别
文章目录 1. 环境准备1.1 安装 Tesseract OCR 引擎1.2 引入 Tess4J 依赖 2. 创建 Spring Boot 项目2.1 初始化项目2.2 目录结构 3. 编写 OCR 功能代码3.1 创建服务层3.2 创建控制器层 4. 配置 Tesseract 语言包5. 运行和测试5.1 启动 Spring Boot 应用5.2 使用 Postman 或 cURL…...

微信小程序常用标签及其用法
大家好,我是linzi,今天我来给大家分享一下微信小程序一些个常用的标签及其用法 1. <view> 标签 <view> 标签是小程序中最常用的标签之一,用于组织和布局页面上的内容,类似于HTML中的 <div> 标签。 <view …...

开发查询订单信息fastGPT智能体工作流 将工作流接入到人工客服系统
我在抖音上发布了视频 https://www.douyin.com/video/7382446337482099977 下面是主要内容介绍 【视频标题:】开发查询订单信息fastGPT智能体工作流 将工作流接入到人工客服系统 #智能体 #FastGPT #客服系统-----------【视频行业分类:】<3C数码>-…...

Flink集群运行模式
我们了解了flink的一个集群的一个基础架构,包括里面核心的一些组件,比如说job manager,task manager等一些组件的一些主要的一些组成。本节课程开始我们学习flink的一个集群部署模式。首先我们来看一下flink集群部署模式究竟应该有哪一些种类…...

XSS 安全漏洞介绍及修复方案
简介 XSS(Cross Site Scripting)是一种常见的 Web 安全漏洞,攻击者通过在网页中注入恶意脚本代码,使得网页在用户端执行这些脚本,从而窃取用户信息或者进行其他恶意操作。为了防止 XSS 攻击,可以使用正则表…...

基于STM32的智能仓库管理系统
目录 引言环境准备智能仓库管理系统基础代码实现:实现智能仓库管理系统 4.1 数据采集模块4.2 数据处理与分析4.3 通信模块实现4.4 用户界面与数据可视化应用场景:仓库管理与优化问题解决方案与优化收尾与总结 1. 引言 智能仓库管理系统通过使用STM32嵌…...

LeetCode —— 只出现一次的数字
只出现一次的数字 I 本题依靠异或运算符的特性,两个相同数据异或等于0,数字与0异或为本身即可解答。代码如下: class Solution { public:int singleNumber(vector<int>& nums) {int ret 0;for (auto e : nums){ret ^ e;}return ret;} };只出…...

python遍历文件夹中所有图片
python遍历文件夹中的图片-CSDN博客 这个是之前的版本,现在这个版本会更好,直接进来就在列表中 path glob.glob("1/*.jpg")print(path)print(len(path))path_img glob.glob("1/*.jpg")path_img.extend(path)print(len(path_img))…...

速盾:DDOS能打死高防ip吗?
DDoS攻击是一种利用大量计算机或设备发起的分布式拒绝服务攻击。它的目标是通过发送大量流量或请求,使目标服务器或网络资源无法正常工作。高防IP是一种具有强大防御能力的网络服务,能够抵御各种形式的网络攻击,包括DDoS攻击。然而࿰…...