ICML 2024 论文分享┆一个简单且通用的交通预测提示调优框架
论文简介
本推文介绍了2024 ICML的优秀论文之一《FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction》。论文的核心目标是通过整合空间和时间因素,精准地预测和分析交通流量的动态变化。然而,在交通预测领域,分布偏移问题始终是一个重大的挑战。当前的模型在面对测试数据与训练数据存在显著差异的情况下,往往表现出较弱的泛化能力,难以适应复杂的实际交通情况。为了解决这一问题,论文提出了一种简单而通用的时空提示调优框架——FlashST,该框架能够根据多种下游数据集的特征调整预训练模型,从而改善在不同交通预测场景中的泛化能力。具体而言,FlashST框架采用了轻量级的时空提示网络,旨在进行上下文学习,捕捉时空不变知识,并促进有效适应。
推文作者为邱雪,审校为许东舟和黄星宇。
论文链接:https://arxiv.org/abs/2405.17898
1.会议介绍
ICML(International Conference on Machine Learning,国际机器学习会议)创办于1980年,由国际机器学习协会主办,每年举办一次。作为人工智能(Artificial Intelligence, AI)和机器学习领域中最具有影响力的会议之一,它的讨论主题领域广泛,包括通用机器学习、深度学习、学习理论、优化、概率推理等。
2.研究背景
近年来,交通预测已成为智能交通系统和城市规划中的一个重要研究领域。准确预测交通流量和模式不仅有助于缓解交通拥堵,还能优化资源配置,提高运输效率。然而,现有模型在面对分布偏移时往往表现不佳,难以适应测试数据与训练数据之间的显著差异。这种分布偏移使得交通预测面临着更大的挑战,因此,提高模型的泛化能力变得尤为重要。
基于上述背景,论文做出了以下的研究创新:
(1)时空提示调优
提出了一种简单且通用的时空提示调优框架——FlashST,旨在通过对预训练模型进行适应性调整,以应对多样化的下游数据集,最终提升模型在不同下游任务中的适应能力。
(2)通过上下文学习实现的适应
利用上下文蒸馏机制,捕捉来自未见数据的时间和空间上下文信号,帮助模型适应不同的时空场景。
(3)统一分布映射机制
引入了统一分布映射机制,通过对预训练阶段与下游数据集的分布进行对齐,减小分布差异,从而促进了跨不同城市交通数据集的有效知识迁移。
图1 FlashST提出的必要性。左图展示了不同时空数据集之间多样的数据分布,而右图则表明端到端模型的参数在训练集A上出现过拟合,无法很好地泛化到测试集B。
图1表明了FlashST框架通过提示调优和分布映射机制来解决这一问题的必要性。其中左图展示了不同时空数据集之间的分布差异;右图展示了现有端到端模型在训练集上表现良好,但在测试集上泛化能力差的问题。
3.方法
图2 我们提出的FlashST框架采用了一种集成时空上下文学习和统一分布映射机制的架构,为在不同场景下进行时空提示调优提供了一种高效且有效的解决方案。
FlashST框架通过三个主要模块来实现对交通数据的时空建模与预测。这些模块分别负责捕捉时空上下文、建模时空依赖关系以及优化数据分布映射,使得模型可以更好地在不同交通场景中进行泛化和适应。
(1)时空上下文学习
a)时空上下文蒸馏:首先将输入的时空数据嵌入到一个初始的时空表示中,然后使用线性层将时间特征和空间特征转化为上下文嵌入,捕捉基础的时空关系。
b)时空依赖建模:空间依赖通过图神经网络(GNNs)进行传播,帮助模型理解交通网络中位置间的关系。时间依赖通过多层感知机(MLP)和门控机制捕捉,建模时空数据中的动态变化。
(2)统一分布映射机制
首先通过提示嵌入(Prompt Embedding)和InfoNCE损失优化,将输入数据的分布映射为更标准、均匀的分布。同时,处理正负样本对,优化信息嵌入,使模型能够更好地适应不同区域的数据。
4.数据集
表1 预训练数据集的统计信息
表2 下游任务数据集的统计信息
表1和表2展示了FlashST模型在预训练和下游任务中所使用的数据集的统计信息。具体如下:
(1)预训练数据集
预训练阶段使用了PEMS系列交通流量数据集,分别是PEMS03、PEMS04、PEMS07和PEMS08。这些数据集的记录类型都是交通流量,涵盖了不同的区域数量和时间步长,采样时间从2016年到2018年不等。
(2)下游任务数据集
下游任务阶段使用了多种类型的数据集,包括PEMS07(M)交通速度数据集、CA-D5交通流量数据集、ChengDu-DIDI交通指数数据集以及NYC Citi Bike单车订单数据集。这些数据集用于测试模型在不同任务场景中的泛化能力,涵盖了不同的区域数和时间步长。
5.实验及结果
(1)对比实验
表3展示了在PEMS07(M)、CA-D5、ChengDu-DIDI和NYC Citi Bike等多个数据集上,各种模型在三个评价指标(MAE、RMSE和MAPE)下的整体性能表现。
表3 在PEMS07(M)、CA-D5、成都-DIDI和纽约市 CitiBike 数据集上的总体表现,评估指标包括 MAE、RMSE 和 MAPE
根据表3可以看出模型的对比结果如下:
a)传统模型(如TGCN、STGCN、ASTGCN等)在不同的数据集上的性能表现相对较弱,尤其是TGCN模型在多个数据集上显示出较高的误差值,说明其泛化能力不够强;
b)MTGNN模型在NYC Citi Bike数据集上表现出色,特别是 MAPE最低,表明其对交通流量预测的有效性较强;
c)我们的模型(Ours)在所有数据集上都显示了优异的性能。特别是在ChengDu-DIDI和NYC Citi Bike数据集上,其MAE、RMSE和MAPE均优于其他模型,说明模型在不同任务中的鲁棒性和泛化能力都非常突出。
总的来说,FlashST在所有数据集和评估指标上均取得了显著的优势,这表明该模型能够更好地处理不同交通场景中的预测任务,并具有较强的泛化能力。
(2)模型无关和模型微调
表4展示了在PEMS07(M)、CA-D5、ChengDu-DIDI和NYC Citi Bike数据集上的模型无关实验结果,分别比较了STGCN、GWN、MTGNN、PDFormer以及“我们的模型”(Ours)的性能表现,主要以三项指标MAE、RMSE和MAPE进行评估。同时,对比了模型在没有进行微调(w/o Finetune)和经过微调(w/ Finetune)后的表现。
表4 在 PEMS07(M)、CA-D5、成都-DIDI 和纽约市 CitiBike 数据集上进行的模型无关实验
根据表4可以看出模型的无关实验结果如下:
a)无微调模型的表现:可以看到,未经过微调的模型(w/o Finetune)在所有数据集上的误差(MAE、RMSE、MAPE)显著高于微调后和我们的模型。这表明,如果模型没有适应特定的数据分布,其性能会大幅下降,尤其是在CA-D5数据集上的表现极差;
b)经过微调后的表现:在微调后,所有模型的误差都明显下降,但仍未能超越“我们的模型”。例如,STGCN经过微调后,MAE在PEMS07(M)数据集上从8.07下降到3.18,但我们的模型仍然保持在2.68的较低值。
c)我们的模型的表现:不论是哪个数据集,我们的模型在所有指标上均表现出色。例如,在ChengDu-DIDI数据集中,经过微调的MTGNN模型的MAE为2.33,但我们的模型达到了更低的2.31。类似地,在NYC Citi Bike数据集上,我们的模型以最小的MAPE(50.06%)和RMSE(2.67)领先。
表4证明了FlashST模型在多种数据集上的优越性,即便在其他模型经过微调之后,仍能在MAE、RMSE和MAPE上保持较低的误差。这表明了我们提出的方法具有更强的泛化能力和稳健性,特别是在处理不同的数据分布时,能够显著减少预测误差。
(3)模型效率评估(训练时间)
表5展示了不同模型在计算时间上的开销(以秒为单位),以比较“我们的模型”与其他模型在进行预测任务时的效率。
表5 计算时间成本调查(秒)
根据表5可以看出传统模型和微调后的模型虽然在预测性能上有所提升,但计算开销较大。而结合FlashST框架的模型在保持良好预测性能的同时,极大地减少了计算时间,表现出更好的计算效率和实用性。
(4) FlashST收敛速度
图3展示了在PEMS07(M)和CA-D5两个数据集上不同模型的验证损失(Validation Loss)随训练轮次(Epochs)变化的对比情况。曲线图对比了原始的MTGNN模型、经过微调的MTGNN模型(Finetune),以及“我们的模型”(Ours)的性能表现。
图3 FlashST的收敛效率
从图中可以看出,在这两个数据集上都表现出色,验证损失在较少的训练轮次内迅速降低并趋于稳定,明显优于原始模型和经过微调的模型。这表明我们的模型在时空数据建模和预测任务中具有更强的泛化能力和稳定性。
(5)消融实验
图4展示了在PEMS07(M)和CA-D5数据集上,不同模型配置下的MAE、RMSE和MAPE的对比结果。每个图包含多个柱状图,分别表示不同特征的移除或变更对模型性能的影响,比较了多个配置和“我们的模型”(Ours)的表现。
图4 FlashST的消融实验
从图中可以看出,不同特征的移除或变更会对模型的性能产生不同程度的影响。其中,时间上下文和统一分布映射的移除对性能影响最大。“我们的模型”通过保留所有关键模块,在不同数据集上均表现出最优的性能。
6.总结及展望
本文介绍了FlashST,这是一种用于将时空预测模型适应于未见过数据的下游任务的框架。FlashST通过引入时空提示网络,包含时空上下文学习机制和时空依赖性建模方案,能够有效地捕捉上下文信号并建模时间和地点之间的复杂关系,从而适应不同的时空场景。为了解决分布差异问题,框架还整合了一个统一分布映射机制,促进了预训练数据与下游数据分布的对齐,从而实现了高效的知识转移。
在未来的研究中,FlashST将继续优化其在多种下游时空预测场景中的适应能力。一个有前景的研究方向是探索如何将大规模语言模型(LLMs)整合到FlashST框架中,进一步提升模型的泛化性与知识指导能力。
相关文章:
ICML 2024 论文分享┆一个简单且通用的交通预测提示调优框架
论文简介 本推文介绍了2024 ICML的优秀论文之一《FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction》。论文的核心目标是通过整合空间和时间因素,精准地预测和分析交通流量的动态变化。然而,在交通预测领域,…...
【C++打怪之路Lv4】-- 类和对象(中)
🌈 个人主页:白子寰 🔥 分类专栏:C打怪之路,python从入门到精通,数据结构,C语言,C语言题集👈 希望得到您的订阅和支持~ 💡 坚持创作博文(平均质量分82)&#…...
滚雪球学MySQL[1.1讲]:MySQL简介与环境配置
全文目录: 前言1. MySQL简介与环境配置1.1 MySQL简介什么是MySQLMySQL的历史和版本MySQL的应用场景 1.2 安装与配置安装MySQL(Windows、Linux、macOS)配置文件解析(my.cnf)启动与停止MySQL服务 1.3 MySQL客户端工具MyS…...
Llama微调以及Ollama部署
1 Llama微调 在基础模型的基础上,通过一些特定的数据集,将具有特定功能加在原有的模型上。 1.1 效果对比 特定数据集 未使用微调的基础模型的回答 使用微调后的回答 1.2 基础模型 基础大模型我选择Mistral-7B-v0.3-Chinese-Chat-uncensored&#x…...
中关村环球时尚产业联盟 东晟时尚产业创新中心成立
2024年9月6日,中关村环球时尚产业联盟与东晟时尚创新科技(北京)有限公司于中关村科技园东城园举行了隆重的战略合作签约仪式。 中关村科技园东城园领导发表了致辞,并表示东城区作为首都北京的核心区域,拥有深厚的历史…...
基于SSM的宠物领养管理系统的设计与实现 (含源码+sql+视频导入教程+文档+PPT)
👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的宠物领养管理系统2拥有两种角色 管理员:宠物分类管理、领养管理、宠物商品管理、用户管理、寄存管理、丢失信息管理、订单管理等 用户:登录注册、收藏评…...
为什么要配置环境变量?
在 Windows 操作系统中配置环境变量有多个重要的原因,这些原因与软件开发、系统管理和日常使用密切相关。以下是一些主要的原因: 1. 系统路径(PATH) 可执行文件的位置:PATH 环境变量用于指定操作系统在何处查找可执行…...
条件熵公式详细解释、举例说明计算步骤
公式 7-4 是条件熵的表达式: E ( Y ∣ X ) ∑ i 1 m p ( X x i ) E ( Y ∣ X x i ) E(Y|X) \sum_{i1}^m p(X x_i) E(Y | X x_i) E(Y∣X)i1∑mp(Xxi)E(Y∣Xxi) 这个公式表示的是条件熵,它是衡量在已知某一特征 X X X 的情况下,…...
颍川陈氏始祖陈寔逆势崛起的原由(一)不屈的努力
园子说颍川 按陈寔的出身,与当官是风马牛不相及的。 东汉末年的社会,朝中外戚、宦官当道,地方则由世家大族把持,郡县的政治经济资源都由他们掌控分配,平民以及中小地主很难有出头之日,弄不好就被兼并了。…...
golang小项目1-家庭收支记账系统
项目地址:golang小项目 参考资料:尚硅谷golang教程P229 家庭收支记账系统 1. 系统简介 1.1 项目背景 在现代社会中,家庭的财务管理显得尤为重要。随着生活成本的不断上升,家庭需要有效地记录和分析收支情况,以确保…...
Visual Studio Code下载安装及汉化
官网:https://code.visualstudio.com/ 按照指示一步步操作即可: 汉化:...
MySQL—触发器详解
基本介绍 触发器是与表有关的数据库对象,在 INSERT、UPDATE、DELETE 操作之前或之后触发并执行触发器中定义的 SQL 语句。 触发器的这种特性可以协助应用在数据库端确保数据的完整性、日志记录、数据校验等操作。 使用别名 NEW 和 OLD 来引用触发器中发生变化的记…...
钉钉H5微应用Springboot+Vue开发分享
文章目录 说明技术路线注意操作步骤思路图 一、创建钉钉应用二、创建java项目三、创建vue项目(或uniapp项目),npm引入sdk的依赖四、拥有公网域名端口。开发环境可以使用(贝锐花生壳等工具)五、打开钉钉开发者平台&…...
项目:微服务即时通讯系统客户端(基于C++QT)]四,中间界面搭建和逻辑准备
四,中间界面搭建 前言:当项目越来越复杂的时候,或许画草图是非常好的选择 一,初始化中间窗口initMidWindow void mainWidget::initMidWindow() {//使用网格布局进行管理QGridLayout* layout new QGridLayout();//距离上方 20px 的距离&…...
【C语言】指针详解(一)
个人主页 : zxctscl 如有转载请先通知 文章目录 1.内存与地址2.指针变量与地址2.1 取地址操作符&2.2 指针变量2.3 指针类型2.4 解引用操作符2.5 指针变量的大小 3. 指针变量类型的意义3.1 指针的解引用 4. const修饰指针4.1 const修饰变量4.2 const修饰指针变量…...
unity3D雨雪等粒子特效不穿透房屋效果实现(粒子不穿透模型)
做项目有时候会做天气模拟,模拟雨雪天气等等。但是容易忽略一个问题,就是房屋内不应该下雨或者下雪,这样不就穿帮了嘛。 下面就粒子穿透物体问题做一个demo。 正常下雨下雪在室内的话,你可以看到,粒子是穿透建筑的。 那要怎么模拟真实的雨雪天气,不让粒子穿透房屋建筑呢…...
ROS2安装cartographer
2. 安装Cartographer和Cartographer ROS 使用apt安装(推荐): bash sudo apt install ros-humble-cartographer-ros或者,从源代码安装: bash sudo apt-get update sudo apt-get install -y python3-wstool python3…...
kafka测试
1】确认 ZooKeeper 服务状态 为了进一步确认 ZooKeeper 服务的状态,你可以执行以下操作: 检查 ZooKeeper 服务状态: docker ps 确保 ZooKeeper 容器正在运行。 检查 ZooKeeper 日志: docker logs zookeeper 查看最新的日志条目&…...
总结C/C++中内存区域划分
目录 1.C/C程序内存分配主要的几个区域: 2.内存分布图 1.C/C程序内存分配主要的几个区域: 1、栈区 2、堆区 3、数据段(静态区) 4.代码段 2.内存分布图 如图: static修饰静态变量成员——放在静态区 int globalVar 是…...
第168天:应急响应-ELK 日志分析系统Yara规则样本识别特征提取规则编写
目录 案例一:ELK 搭建使用-导入文件&监控日志&语法筛选 案例二:Yara 规则使用-规则检测&分析特征&自写规则 案例一:ELK 搭建使用-导入文件&监控日志&语法筛选 该软件是专业分析日志的工具,但是不支持安…...
MySQL 面试题及答案
MySQL 面试题及答案: 一、基础问题 什么是数据库索引?有哪些类型? 答:数据库索引是一种数据结构,用于提高数据库查询的效率。它就像一本书的目录,可以快速定位到特定的数据行。 类型主要有: …...
vue仿chatGpt的AI聊天功能--大模型通义千问(阿里云)
vue仿chatGpt的AI聊天功能–大模型通义千问(阿里云) 通义千问是由阿里云自主研发的大语言模型,用于理解和分析用户输入的自然语言。 1. 创建API-KEY并配置环境变量 打开通义千问网站进行登录,登陆之后创建api-key,右…...
养老院管理系统(含源码+sql+视频导入教程+文档)
👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 养老院管理系统拥有两种角色:管理员和护工 管理员:用户管理、老人信息管理、事故记录管理、入住费用管理、护工薪资管理、护工请假管理、床位管理、请假管理等 护…...
大数据的挑战是小文件
小文件可能会给存储平台及其支持的应用程序带来大问题。在 Google 上搜索 “small files performance” 会产生 2M 的结果。这篇博文将更深入地研究小文件问题,深入研究其根源并总结解决方案。 问题陈述 出于本讨论的目的,小文件通常被视为小于 64 KB …...
迁移学习案例-python代码
大白话 迁移学习就是用不太相同但又有一些联系的A和B数据,训练同一个网络。比如,先用A数据训练一下网络,然后再用B数据训练一下网络,那么就说最后的模型是从A迁移到B的。 迁移学习的具体形式是多种多样的,比如先用A训练…...
MCUboot 和 U-Boot区别
MCUboot 和 U-Boot 都是用于嵌入式系统的引导加载程序,但它们在一些方面存在区别: 功能特性 安全特性侧重不同 MCUboot :更专注于安全引导方面,强调安全启动、固件完整性验证和加密等安全功能。它提供了强大的安全机制来防止恶意…...
Apache OFBiz SSRF漏洞CVE-2024-45507分析
Apache OFBiz介绍 Apache OFBiz 是一个功能丰富的开源电子商务平台,包含完整的商业解决方案,适用于多种行业。它提供了一套全面的服务,包括客户关系管理(CRM)、企业资源规划(ERP)、订单管理、产…...
计算机毕业设计 饮食营养管理信息系统的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…...
828华为云征文|华为云Flexus云服务器X实例部署——盲盒抽奖商城系统以及编译发布小程序
盲盒抽奖商城系统使用 thinkphp6.0 uniapp 开发,做到了全移动端兼容。一个系统不仅可以打包 小程序 还可以 打包APP ,H5 华为云Flexus云服务器X实例在安装搭建盲盒商城小程序方面具有显著优势,这些优势主要体现在以下几个方面: …...
优化理论及应用精解【12】
文章目录 最优化基础基本概念一、目标函数二、约束条件三、约束函数 可行域与可行点可行点可行域可行点与可行域的关系示例 最优值与可行域的关系1. 最优值一定在可行域内取得2. 可行域定义了最优解的搜索空间3. 最优值的存在性与可行域的性质有关4. 最优值与可行域的边界关系示…...
有关网站建设的公众号/软文营销经典案例200字
A. timestampdiff() 传三个参数,第一个时间类型如年,月,日,第二个开始时间,第三个结束时间select test_name, timestampdiff(YEAR,create_time,end_time) y_date from test_table; --计算时间-------------------| tes…...
兰州迅豹网络/网站做优化一开始怎么做
Redisson官方文档 GetMapping("/hello")public String testRedissonClient(){//根据名字获取锁 只要锁名一样 就是同一把锁 第一个线程拿到这个锁 加锁 第二个线程拿到的就是 一个正在运行的加了锁的锁RLock mylock redissonClient.getLock("my-lock"…...
做金融看哪些网站有哪些内容/惠州市seo广告优化营销工具
为什么80%的码农都做不了架构师?>>> 一两个简单概念长连接与短连接: 1.长连接 Client方与Server方先建立通讯连接,连接建立后不断开, 然后再进行报文发送和接收。2.短连接 Client方与Server每进行一次报文收发交易时才…...
做家政网站公司名称/seo优化软件哪个好
Idea 的 task server 配置为 Gitlab 个人站点 http://ronnie.wang 找到配置窗口,Preferences -> Tools -> Tasks -> Servers 点击加号,添加 Gitlab 点击增加之后的条目,可以看到下面的配置项 在 Server URL 填 Gitlab 服务器的…...
资阳网站建设/百度热词指数
VR行业近年来的发展可谓是如火如荼,而与之相关的360度VR全景视频拍摄也跟着大火,无论是刚刚入行的初学者还是资深全景摄影师来说,掌握一些360度VR全景视频拍摄技巧能让你拍出更高质量的作品,这是非常有必要的,今天为大…...
wordpress iframe页面/35个成功的市场营销策划案例
http://www.cnblogs.com/wservices/archive/2010/07/08/1773449.html 看到很多书中都没有对PreferenceActivity做介绍,而我正好又在项目中用到,所以就把自己的使用的在这总结一下,也方便日后查找。 PerferenceActivity是什么,看下…...