当前位置: 首页 > news >正文

2023.08.20 学习周报

文章目录

  • 摘要
  • 文献阅读
    • 1.题目
    • 2.现有问题
    • 3.解决方案
    • 4.本文贡献
    • 5.方法
      • 5.1 利用长短期记忆网络学习时空演化特征
      • 5.2 构建用于气象辅助信息编码的堆叠自编码器
      • 5.3 使用多任务学习发现全市通用模式
      • 5.4 模型
    • 6. 实验
      • 6.1 数据集
      • 6.2 实验设置
      • 6.3 实验结果
    • 7.结论
    • 8.展望
  • 大气污染物传输
  • 总结


摘要

This week, I read a computer science that predicted the time series of PM2.5 in multiple locations in Beijing. Existing data-driven methods ignore the dynamic relationship between multiple sites in urban areas, resulting in unsatisfactory prediction accuracy. To solve this problem, a long short-term memory-Autoencoder multitask learning model (LSTM-Autoencoder) is proposed to predict PM2.5 time series at multiple locations across the city. The multi-layer LSTM network can simulate the spatiotemporal characteristics of urban air pollution particles, the autoencoder can encode the key evolution model of urban meteorological system, and the multi-task learning can automatically discover the dynamic relationship between multiple key pollution time series. The simulation results of PM2.5 in Beijing show the effectiveness of the proposed method. In addition, I learn the basic knowledge of air pollutant transmission.

本周,阅读了一篇预测北京市多个地点的PM2.5时间序列的文章。现有的数据驱动方法会忽略城市地区多个站点之间的动态关系,导致预测精度不理想。针对这个问题,提出了一种长短期记忆-自编码器多任务学习模型(LSTM-Autoencoder)来预测全市多个地点的PM2.5时间序列。展开来说,多层LSTM网络可以模拟城市空气污染颗粒物的时空特征,自编码器可以对城市气象系统关键演化模式进行编码,多任务学习可以自动发现多个关键污染时间序列之间的动态关系。对北京市PM2.5进行模拟,实验结果表明了该方法的有效性。此外,我学习了大气污染物传输的基础知识。


文献阅读

1.题目

文献链接:Multitask Air-Quality Prediction Based on LSTM-Autoencoder Model

2.现有问题

现有的基于人工神经网络的PM2.5时间序列预测方法,主要是选择一个地点进行建模,容易造成信息丢失。

3.解决方案

1)采用多位置PM2.5时间序列,利用LSTM学习时空演化特征。
2)考虑到深度学习模型的有效性,提出了带气象信息编码器的多任务LSTM模型,用于PM2.5时间序列的建模。
3)采用多LSTM层提取PM2.5时间序列的时空特征,提出叠置式自编码器对多个地点的气象信息进行编码,使用级联并行架构进行多任务学习。

4.本文贡献

1)考虑到空气污染物的复杂时空动态,通过多层LSTM网络的时空学习,探索城市多个地点颗粒物的时空特征。
2)利用气象信息,采用稀疏约束叠加自编码器对进化信息进行编码。
3)PM2.5时间序列在多个地点之间具有很强的相关性,于是利用多任务学习自动探索重点污染监测站之间的联系,并通过深度学习模型隐式描述各地点之间的关系。
4)对北京市多站PM2.5时间序列和气象观测资料的建模与仿真表明,该方法考虑了多站间的相互关系,取得了满意的效果。

5.方法

5.1 利用长短期记忆网络学习时空演化特征

LSTM网络图:
在这里插入图片描述

5.2 构建用于气象辅助信息编码的堆叠自编码器

1)定义了一个特征学习函数h = fθ (X),其中fθ(·)称为编码器函数。然后,解码函数X = gθ (h)学习重构原始信号。特征向量h是原始输入的压缩表示。
2)目标是构建气象信息的向量表示,并将其用于PM2.5时间序列的建模。气象自编码器的目标函数可表示为:
在这里插入图片描述
其中:XMeteo,i为第i个监测点位置的气象信息,R(θ)是自编码器权值的约束项。

5.3 使用多任务学习发现全市通用模式

1)在硬参数共享中,学习神经网络基础层的公共特征子空间。在基础层中参数是完全相同的,可以防止过拟合问题,有更好的泛化效果。
2)在软参数共享中,任务的模型参数可以是不同的、受规则约束的特征子空间。
3)多任务学习的参数学习图:
在这里插入图片描述
4)多任务学习的目标函数:
在这里插入图片描述
其中:X为多任务输入,Yi为各自的多任务学习目标,θi是第i个任务对应的学习参数,N是任务数。

5.4 模型

1)模型架构图:
在这里插入图片描述
多层LSTM网络对PM2.5时空序列特征进行学习,层叠式自编码器可以逐层压缩有用信息,提高性能。
2)在更高层次的特征学习上,使用两层密集网络学习PM2.5综合演化信息和气象辅助。基于深度特征,利用多个亚密集层对全市范围内多个地点的PM2.5时间序列进行建模,并输出预测值。整个模型的目标函数为:
在这里插入图片描述
其中:yi,j为PM2.5时间序列实值,N为空气质量监测站的个数,n是时间序列的个数。XPM2.5为所有空气质量监测站的记录值,XMeteo是辅助气象信息的输入,θ为所提模型的所有参数。

6. 实验

6.1 数据集

1)主要包括几种空气污染物的浓度:PM2.5(μg/m3)、PM10(μg/m3)、NO2(μg/m3)、CO(mg/m3)、O3(mg/m3)和SO2(μg/m3)。共有18个监测站,站点名称、经纬度如下所示:
在这里插入图片描述
2)时间序列从2017年1月30日下午4点到2018年1月31日下午3点每小时采样一次,共8784个样本。
3)利用气象信息作为辅助信息,包括温度、压力、湿度、风向、风速和天气情况。共有13个气象站,位置如下所示:
在这里插入图片描述

6.2 实验设置

优化方法是最常用的ADAM优化器,使用三个评价指标来比较所提出模型的性能:均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)。

6.3 实验结果

1)该模型在北京市多个气象监测站的预报结果:
在这里插入图片描述
从图中可以看出,多个地点的PM2.5时间序列趋势是一致的,但地点之间的细节差异很明显。
2)该方法对PM2.5时间序列的一步前预测结果和三步前预测结果:
在这里插入图片描述
从表中可以看出,提出的方法在各个指标(RMSE、MAE、SMAPE)上都有更好的表现,每个指标的预测误差都比对比方法好10%左右。
3)LSTM-Autoencoder模型和传统LSTM模型的预测结果
在这里插入图片描述
两者之间预测结果相差很大,LSTM-Autoencoder模型在12月21日的预测结果优于传统的LSTM模型。预测曲线增长快,能有效地预测空气质量。相比之下,传统LSTM无法跟踪PM2.5时间序列的趋势。

7.结论

1)提出了一种新的多任务深度学习模型,该模型具有自动编码的辅助信息,用于空气质量时间序列预测。
2)模型可以利用历史PM2.5时间序列和全市多地点的气象时间序列,而多任务学习范式可以隐式捕捉跨任务演化模式,用于时间序列建模。
3)克服了数据驱动的PM2.5预测方法的局限性,模拟结果证实了模型的有效性。
4)模型可以跟踪PM2.5时间序列发生剧烈变化时的演变模式,并且可以隐式学习多个站点的多个PM2.5时间序列的共同模式。

8.展望

在PM2.5时间序列建模中加入更多的辅助信息,如经济因素、气体排放等,即传统PM2.5预测模型从未考虑过的确定性过程。

大气污染物传输

1.大气污染物传输的本质是空气中污染物的扩散和迁移过程,而大气污染物传输的主要因素包括风、大气稳定度、地形、气象条件等。
1)风:风的方向和速度决定了污染物的扩散方向和速率。强风能够将污染物快速地从污染源地带到其他地区,而相对较弱的风可能导致污染物在源地积累。
2)大气稳定度:大气稳定度指的是大气中垂直气流的强弱。在稳定的大气条件下,污染物容易积聚在较低的空气层中,形成雾霾等现象。而在不稳定的大气条件下,污染物可能会被较强的垂直气流带到较高的空气层,减少地表的浓度。
3)地形:山脉、山谷等地形特征能够影响风的流动,并且可能导致污染物在某些地区的积聚或稀释。
4)气象条件:温度的变化可以影响空气密度,从而影响污染物的上升和下沉。湿度可以影响污染物的溶解和反应。

2.利用高维数学方法来建立模型预测大气污染物传输
1)偏微分方程:大气污染物传输通常涉及多个自变量,如时间、空间坐标等。偏微分方程是用来描述多个自变量之间关系的数学方程。
2)扩散方程:扩散方程是描述物质传输和扩散过程的数学模型。在高维数学中,可以使用偏微分方程来表示扩散方程。这些方程可以考虑污染物浓度随时间和空间的变化,同时考虑风速、大气稳定度等因素。
3)数值模拟方法:由于复杂的大气流动和扩散过程难以解析地求解,数值模拟方法成为了预测大气污染物传输的重要工具。通过将扩散方程离散化,可以在计算机上模拟大气污染物的传输过程。
4)数据同化:将观测数据与模型预测结果进行融合,从而提高预测的准确性。数据同化技术可以将实际观测数据与模型预测进行比较,通过优化算法来调整模型参数,使模型的输出与实际观测数据更加一致。
5)随机过程:大气传输过程中存在不确定性因素,如风速和方向的随机变化。随机过程理论可以用来建立随机扩散模型,考虑这些不确定性因素对污染物传输的影响。

3.大气污染物传输过程需要遵循的物理规律
1)质量守恒:在任何给定的空间区域内,污染物的质量不能凭空产生或消失,只能通过传输和转化来改变。这意味着传输过程中,污染物的流入流出量必须相等。
2)扩散:它描述了污染物在浓度梯度驱动下在空气中的随机运动。扩散过程可以使用菲克定律来描述,该定律表明扩散通量与浓度梯度成正比。
3)对流:对流可以通过空气的运动来将污染物从一个地区传输到另一个地区,其中风的方向和速度决定了污染物的传输路径。
4)沉降:大气中的颗粒物和气溶胶等污染物会因重力作用而沉降到地面,这被称为沉降过程。沉降速率取决于颗粒物的大小、密度以及空气的粘度和密度。
5)化学反应:大气中的污染物可能会发生化学反应,导致浓度的变化。其中化学反应可以影响污染物的浓度分布和组成。
6)辐射传输:辐射传输是指太阳辐射或其他电磁辐射对污染物传输的影响。一些污染物可能吸收或散射辐射,从而影响大气的温度和辐射平衡。


总结

本周,我阅读了一篇预测北京市多个地点的PM2.5时间序列的文章,它是一个基于神经网络的预测模型,该模型使用神经网络来模拟气候污染物的运输过程。 此外,我学习了大气污染物传输的基础知识,其中包含了大气污染物传输的影响因素以及需要遵循的物理规律。下周,我会学习一些数学方法或者模型能够有效地分析大气污染的变化规律,预测大气污染物未来的走势,理解其中的优势点。

相关文章:

2023.08.20 学习周报

文章目录 摘要文献阅读1.题目2.现有问题3.解决方案4.本文贡献5.方法5.1 利用长短期记忆网络学习时空演化特征5.2 构建用于气象辅助信息编码的堆叠自编码器5.3 使用多任务学习发现全市通用模式5.4 模型 6. 实验6.1 数据集6.2 实验设置6.3 实验结果 7.结论8.展望 大气污染物传输总…...

软件测试技术之单元测试—工程师 Style 的测试方法(2)

怎么写单元测试? JUnit 简介 基本上每种语言和框架都有不错的单元测试框架和工具,例如 Java 的 JUnit、Scala 的 ScalaTest、Python的 unittest、JavaScript 的 Jest 等。上面的例子都是基于 JUnit 的,我们下面就简单介绍下 JUnit。 JUnit…...

项目中超图 for openlayer和超图for cesium同时引入的问题

一个项目中同时用到了超图的openlayer和cesium版本&#xff0c;首先我是外部引入的超图的开发包&#xff0c;你要是通过npm导入的那就没关系了。 <script type"text/javascript" src"/static/openlayer/supermap/ol/iclient-ol.min.js"></script&…...

3D与沉浸式技术,如何助力企业数字化转型?

说起3D&#xff0c;估计许多读者朋友会在第一时间想起《阿凡达》系列和《侏罗纪公园》系列电影大作。每一帧细节纤毫毕现的逼真画面&#xff0c;让观众几乎分不清虚拟与现实&#xff0c;完全沉浸在导演打造的视觉盛宴中。 事实上&#xff0c;除了大家所熟知的3D影视动画之外&am…...

excel vba 将多张数据表的内容合并到一张数据表

功能描述&#xff1a; 一个Excel文件有很多个 样式相同 的数据表&#xff0c; 需要将多张数据表的内容合并到一张数据表里。 vba实现代码如下&#xff1a; Attribute VB_Name "NewMacros" Option Explicit Public Const Const_OutSheetName As String "V…...

接口和抽象类的区别?解析接口和抽象类的特点和用法

接口和抽象类的区别&#xff1f;解析接口和抽象类的特点和用法 引言 在面向对象编程中&#xff0c;接口和抽象类是两个非常重要的概念。它们都可以用于定义一组相关的方法&#xff0c;但在实际使用中有一些差异。本文将探讨接口和抽象类的区别&#xff0c;并通过示例代码和测…...

vscode-vue项目格式化

一、插件要求 Prettier Vetur 二、配置文件 {"workbench.startupEditor": "newUntitledFile","files.autoSave": "off", // 关闭文件自动保存&#xff0c;避免开发时候页面变化"editor.tabSize": 2, // tab距离"ve…...

SAP MM学习笔记26- SAP中 振替转记(转移过账)和 在库转送(库存转储)1- 移动Type间振替转记

SAP 中在库移动 不仅有入库&#xff08;GR&#xff09;&#xff0c;出库&#xff08;GI&#xff09;&#xff0c;也可以是单纯内部的转记或转送。 1&#xff0c;振替转记&#xff08;转移过账&#xff09; 2&#xff0c;在库转送&#xff08;库存转储&#xff09; 1&#xff…...

SAP SPL(Special Ledger)之注释行项目-Noted Items

财务凭证过账里常见的SPL特殊总账标识根据业务主要有三种&#xff0c;BoE-billing of exchange: 汇票业务&#xff0c;包括商业汇票和银行汇票&#xff1b;Down Payment&#xff0c;预付款业务&#xff0c;包括供应商和客户预付款和申请&#xff1b;其它&#xff0c;一般是保证…...

学习平台助力职场发展与提升

近年来&#xff0c;随着互联网技术的发展&#xff0c;学习平台逐渐成为了职场发展和提升的必备工具。学习平台通过提供丰富的课程内容、灵活的学习时间和个性化的学习路径&#xff0c;帮助职场人士更好地提升自己的技能和知识储备&#xff0c;为职场发展打下坚实的基础。 学习…...

有没有免费格式转换工具推荐?PDF转化为PPT的方法

在当今职场生活中&#xff0c;掌握文件格式转换技能变得异常重要。将PDF文档转换为PPT格式可以在演讲、报告等场合更好地展示和传达信息&#xff0c;为我们的专业形象增添亮点&#xff0c;接下来我们可以一起来看一下“有没有免费格式转换工具推荐?PDF转化为PPT的方法”相关的…...

【LeetCode-经典面试150题-day12】

20.有效的括号 题意&#xff1a; 给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0c;}&#xff0c;[&#xff0c;] 的字符串 s &#xff0c;判断字符串是否有效。 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括…...

TCP机制-延迟应答,捎带应答

在看本篇博客前推荐先看TCP中窗口和滑动窗口的含义以及流量控制 延迟应答和捎带应答都是TCP用于提高网络传输效率的机制 延迟应答 当发送端发送数据给接收端了以后&#xff0c;按道理接收端的内核会立即返回ACK&#xff08;应答报文&#xff09;给发送端&#xff0c;而且ACK&a…...

【Redis从头学-8】Redis中的ZSet数据类型实战场景之用户积分榜

&#x1f9d1;‍&#x1f4bb;作者名称&#xff1a;DaenCode &#x1f3a4;作者简介&#xff1a;啥技术都喜欢捣鼓捣鼓&#xff0c;喜欢分享技术、经验、生活。 &#x1f60e;人生感悟&#xff1a;尝尽人生百味&#xff0c;方知世间冷暖。 &#x1f4d6;所属专栏&#xff1a;Re…...

Springboot内嵌SQLite配置使用

版本号 MacOS Apple M1 | Jdk17 | Maven 3.8.5 | SpringBoot 2.6.9 | SQLite 3.42.0.0 pom.xml <dependencies><dependency><groupId>org.xerial</groupId><artifactId>sqlite-jdbc</artifactId><version>3.42.0.0</version&g…...

【微服务学习笔记】认识微服务

【微服务学习笔记】认识微服务 单体架构 分布式架构 微服务架构 SpringCloud 服务拆分和注意事项 服务拆分的案例demo 各个服务之间的数据库都是相互独立的&#xff0c;你不能直接访问对方的数据库&#xff0c;只能从一个服务像另外一个服务发起远程调用 在订单模块的服务中 …...

基于Android R快速编译recovery-ramdisk.img

Android默认没有单编recovery-ramdisk.img的命令&#xff0c;我们可以自己修改Makefile实现 修改&#xff1a;build/core/Makefile 添加&#xff1a; .PHONY: recovery-ramdisk-nodeps recovery-ramdisk-nodeps: $(MKBOOTFS) | $(COMPRESSION_COMMAND_DEPS)echo "make …...

Redis分布式缓存

分布式缓存 -- 基于Redis集群解决单机Redis存在的问题 单机的Redis存在四大问题&#xff1a; 1.Redis持久化 Redis有两种持久化方案&#xff1a; RDB持久化 AOF持久化 1.1.RDB持久化 RDB全称Redis Database Backup file&#xff08;Redis数据备份文件&#xff09;&#x…...

最大公约数和最小公倍数

最大公约数&#xff1a; 概念&#xff1a; 公约数中最大的称为最大公约数。 对任意的若干个正整数&#xff0c;1总是它们的公因数。 公约数与公倍数相反&#xff0c;就是既是A的约数同时也是B的约数的数&#xff0c;12和15的公约数有1&#xff0c;3&#xff0c;最大公约数就是…...

数据结构——二叉搜索树(附带C++实现版本)

文章目录 二叉搜索树概念 二叉树的实际应用二叉树模拟实现存储结构二叉搜索树构成二叉搜索树的查找插入操作中序遍历二叉树的删除循环(利用左子树最右节点&#xff09;递归(利用右子树根节点) 二叉树拷贝二叉树资源的销毁 二叉树实现完整代码总结 二叉搜索树 概念 二叉搜索树…...

Python爬虫实战:研究MechanicalSoup库相关技术

一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径

目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力

引言&#xff1a; 在人工智能快速发展的浪潮中&#xff0c;快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型&#xff08;LLM&#xff09;。该模型代表着该领域的重大突破&#xff0c;通过独特方式融合思考与非思考…...

select、poll、epoll 与 Reactor 模式

在高并发网络编程领域&#xff0c;高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表&#xff0c;以及基于它们实现的 Reactor 模式&#xff0c;为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。​ 一、I…...

优选算法第十二讲:队列 + 宽搜 优先级队列

优选算法第十二讲&#xff1a;队列 宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...

Java编程之桥接模式

定义 桥接模式&#xff08;Bridge Pattern&#xff09;属于结构型设计模式&#xff0c;它的核心意图是将抽象部分与实现部分分离&#xff0c;使它们可以独立地变化。这种模式通过组合关系来替代继承关系&#xff0c;从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...

LabVIEW双光子成像系统技术

双光子成像技术的核心特性 双光子成像通过双低能量光子协同激发机制&#xff0c;展现出显著的技术优势&#xff1a; 深层组织穿透能力&#xff1a;适用于活体组织深度成像 高分辨率观测性能&#xff1a;满足微观结构的精细研究需求 低光毒性特点&#xff1a;减少对样本的损伤…...

通过 Ansible 在 Windows 2022 上安装 IIS Web 服务器

拓扑结构 这是一个用于通过 Ansible 部署 IIS Web 服务器的实验室拓扑。 前提条件&#xff1a; 在被管理的节点上安装WinRm 准备一张自签名的证书 开放防火墙入站tcp 5985 5986端口 准备自签名证书 PS C:\Users\azureuser> $cert New-SelfSignedCertificate -DnsName &…...

协议转换利器,profinet转ethercat网关的两大派系,各有千秋

随着工业以太网的发展&#xff0c;其高效、便捷、协议开放、易于冗余等诸多优点&#xff0c;被越来越多的工业现场所采用。西门子SIMATIC S7-1200/1500系列PLC集成有Profinet接口&#xff0c;具有实时性、开放性&#xff0c;使用TCP/IP和IT标准&#xff0c;符合基于工业以太网的…...

xmind转换为markdown

文章目录 解锁思维导图新姿势&#xff1a;将XMind转为结构化Markdown 一、认识Xmind结构二、核心转换流程详解1.解压XMind文件&#xff08;ZIP处理&#xff09;2.解析JSON数据结构3&#xff1a;递归转换树形结构4&#xff1a;Markdown层级生成逻辑 三、完整代码 解锁思维导图新…...