图神经网络:处理复杂关系结构与图分类任务的强大工具
创作不易,您的打赏、关注、点赞、收藏和转发是我坚持下去的动力!
图神经网络(Graph Neural Network, GNN)是针对图数据的一类神经网络模型。图数据具有节点(节点代表实体)和边(边代表节点之间的关系),因此,GNN能够处理这种复杂的关系结构,提取图结构中有用的信息。GNN的基本思想是通过消息传递(message passing)机制将节点和它们的邻居进行特征融合,从而更新节点的表示。这种表示可以用来进行节点分类、边预测或者整个图的分类等任务。
1. GNN基础知识
GNN的核心机制是基于图的消息传递和特征聚合。对于每个节点,GNN会收集其邻居节点的信息,然后通过一定的聚合函数(例如求和或平均)生成新的特征表示。
1.1 图的定义
- 节点(Node):图中的实体,记作 (v_i)。
- 边(Edge):节点之间的关系,记作 (e_{ij}),表示从节点 (v_i) 到节点 (v_j) 的连接。
- 邻居节点(Neighbors):节点 (v_i) 的直接相连节点集合,记作 (N(v_i))。
1.2 GNN的消息传递机制
GNN的基本操作包括两个步骤:
- 消息传递(Message Passing):从每个节点的邻居节点收集特征。
- 特征更新(Feature Update):将节点的特征与邻居的特征聚合,更新节点的表示。
假设节点 (v_i) 的初始特征为 (h_i^{(0)}),其第 (k) 次迭代时的特征表示为 (h_i^{(k)})。GNN通过以下两步进行更新:
- 聚合邻居特征:将节点 (v_i) 的所有邻居节点的特征聚合起来,例如求和或平均:
[
m_i^{(k)} = \text{AGGREGATE}({ h_j^{(k-1)} : j \in N(v_i) })
] - 更新节点特征:将聚合的邻居特征与节点本身的特征结合起来,更新节点的表示:
[
h_i^{(k)} = \text{UPDATE}(h_i^{(k-1)}, m_i^{(k)})
]
1.3 GNN在图分类任务中的应用
图分类任务的目标是给定一张图,预测该图的类别。常见应用包括化学分子分类、社交网络分析等。在这种任务中,GNN的目标是通过学习图的全局结构信息来预测整张图的标签。
GNN处理图分类任务的流程一般如下:
- 特征初始化:给每个节点赋予初始特征(可以是节点的属性)。
- 消息传递与特征更新:通过多层GNN层,将节点特征与其邻居进行聚合和更新。
- 图的汇总(Readout):将所有节点的特征汇总为图的表示(例如通过求平均或全连接层)。
- 分类器:使用图的表示作为输入,通过一个分类器预测图的类别。
2. Python实现示例
我们可以使用PyTorch Geometric
来实现一个简单的图分类任务。
2.1 安装依赖
首先,你需要安装PyTorch
和PyTorch Geometric
库:
pip install torch
pip install torch-geometric
2.2 数据准备
我们使用PyTorch Geometric
中的一个经典的图分类数据集MUTAG
,这是一个小型化学分子数据集,每个分子作为一张图,目标是预测分子的类别。
import torch
import torch.nn.functional as F
from torch_geometric.datasets import TUDataset
from torch_geometric.loader import DataLoader
from torch_geometric.nn import GCNConv, global_mean_pool# 加载数据集
dataset = TUDataset(root='/tmp/MUTAG', name='MUTAG')# 划分训练集和测试集
train_dataset = dataset[:150]
test_dataset = dataset[150:]train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)
2.3 定义GNN模型
我们定义一个简单的图卷积网络(GCN)用于图分类任务。
class GCN(torch.nn.Module):def __init__(self):super(GCN, self).__init__()# 定义两个GCN层self.conv1 = GCNConv(dataset.num_node_features, 64)self.conv2 = GCNConv(64, 64)# 最后一个全连接层用于图分类self.fc = torch.nn.Linear(64, dataset.num_classes)def forward(self, data):x, edge_index, batch = data.x, data.edge_index, data.batch# 第一层GCN + ReLU激活x = self.conv1(x, edge_index)x = F.relu(x)# 第二层GCNx = self.conv2(x, edge_index)# 使用全局平均池化将节点特征聚合为图的特征x = global_mean_pool(x, batch)# 最后通过全连接层进行分类x = self.fc(x)return F.log_softmax(x, dim=1)
2.4 模型训练和测试
我们定义训练和测试的函数,分别用于训练模型和评估模型的性能。
# 定义设备
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = GCN().to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)def train():model.train()total_loss = 0for data in train_loader:data = data.to(device)optimizer.zero_grad()output = model(data)loss = F.nll_loss(output, data.y)loss.backward()optimizer.step()total_loss += loss.item()return total_loss / len(train_loader)def test(loader):model.eval()correct = 0for data in loader:data = data.to(device)output = model(data)pred = output.argmax(dim=1)correct += pred.eq(data.y).sum().item()return correct / len(loader.dataset)# 训练模型
for epoch in range(1, 201):loss = train()test_acc = test(test_loader)print(f'Epoch: {epoch:03d}, Loss: {loss:.4f}, Test Acc: {test_acc:.4f}')
2.5 解释代码
- GCNConv:图卷积层,用于将节点的特征与其邻居的特征进行聚合。
- global_mean_pool:对图中的所有节点特征进行全局池化,将节点特征汇总为图的特征表示。
- forward:定义了模型的前向传播,输入图的特征和结构,输出图的类别预测。
通过上述代码,你可以用GNN进行图分类任务。这个模型会对每张图中的所有节点进行特征更新,并最终通过全连接层进行分类。
大家有技术交流指导、论文及技术文档写作指导、课程知识点讲解、项目开发合作的需求可以搜索关注我私信我
相关文章:
图神经网络:处理复杂关系结构与图分类任务的强大工具
创作不易,您的打赏、关注、点赞、收藏和转发是我坚持下去的动力! 图神经网络(Graph Neural Network, GNN)是针对图数据的一类神经网络模型。图数据具有节点(节点代表实体)和边(边代表节点之间的…...
LeetCode: 1971. 寻找图中是否存在路径
寻找图中是否存在路径 原题 有一个具有 n 个顶点的 双向 图,其中每个顶点标记从 0 到 n - 1(包含 0 和 n - 1)。图中的边用一个二维整数数组 edges 表示,其中 edges[i] [ui, vi] 表示顶点 ui 和顶点 vi 之间的双向边。 每个顶点…...
mysql 查询表所有数据,分页的语句
在 MySQL 中,若要从表中查询所有数据并实现分页,你可以使用 SELECT 语句结合 LIMIT 和 OFFSET 子句。LIMIT 用于指定返回的记录数,而 OFFSET 则用于指定从哪一条记录开始返回(即跳过的记录数)。 以下是一个基本的分页…...
TI DSP TMS320F280025 Note13:CPUtimer定时器原理分析与使用
TMS320F280025 CPUtimer定时器原理分析与使用 ` 文章目录 TMS320F280025 CPUtimer定时器原理分析与使用框图分析定时器中断定时器使用CPUtimers.cCPUtimers.h框图分析 定时器框图如图所示 定时器有一个预分频模块和一个定时/计数模块, 其中预分频模块包括一个 16 位的定时器分…...
Australis 相機率定軟體說明
概要 課堂中使用Australis這套軟體,順帶記錄操作過程 內容以老師口述及我測試的經過 照片為老師課堂提供之 說明 執行 Step1. 匯入照片 注意!!如果是Mac的作業系統,將資料夾移到Windows上的時候,建議創一個新的資料…...
C++入门(有C语言基础)
string类 string类初始化的方式大概有以下几种: string str1;string str2 "hello str2";string str3("hello str3");string str4(5, B);string str5[3] {"Xiaomi", "BYD", "XPeng"};string str6 str5[2];str…...
第四届高性能计算与通信工程国际学术会议(HPCCE 2024)
目录 大会简介 主办单位,承办单位 征稿主题 会议议程 参会方式 大会官网:www.hpcce.net 大会简介 第四届高性能计算与通信工程国际学术会议(HPCCE 2024)将于2024年11月22-24日在苏州召开。HPCCE 2024将围绕“高性能计算与通信工…...
负载均衡架构解说
负载均衡架构是一种设计模式,用于在多个服务器之间分配网络或应用流量,以提高资源利用率、最大化吞吐量、减少响应时间,并确保高可用性。 负载均衡架构的关键组件和概念: 关键组件 1.负载均衡器(Load Balancer&…...
【异常数据检测】孤立森林算法异常数据检测算法(数据可视化 Matlab语言)
摘要 本文研究了基于孤立森林算法的异常数据检测方法,并在MATLAB中实现了该算法的可视化。孤立森林是一种无监督的异常检测算法,主要通过构建决策树来区分正常数据和异常数据。本文使用真实数据集,通过二维可视化展示了检测结果。实验结果表…...
MKV转MP4丨FFmpeg的简单命令使用——视频格式转换
MKV是一种视频封装格式,很好用,也是OBS的默认推荐录制格式,因为不会突然断电关机而导致整个视频录制文件丢失。 但是MKV无法直接导入PR中剪辑,最直接的方法是将MKV转换为MP4格式,最方便且安全无损的转换方法便是用FFmp…...
git使用“保姆级”教程4——版本回退及分支讲解
一、版本回退 1、历史回退(版本回退)——命令行git reset --hard 版本编号 注意:当前命令会让工作区的内容发生改变,可以理解成历史区(master分支)直接回到工作区比如:从版本4回到版本3,则工作区只会显示版本3的代码内容 1.1、指…...
spring cache,Spring data redis
本项目使用Redis存储缓存数据,如何通过Java去访问Redis? 常用的有Jedis和Lettuce两个访问redis的客户端类库 ,Jedis和Lettuce都是redis提供的。其中Lettuce的性能和并发性要好一些,Spring Boot 默认使用的是 Lettuce 作为 Redis …...
10.数据结构与算法-线性表的应用(线性表与有序表的合并)
线性表的合并 有序表的合并 顺序表 链表...
GAN|对抗| 生成器更新|判别器更新过程
如上图所示,生成对抗网络存在上述内容: 真实数据集;生成器;生成器损失函数;判别器;判别器损失函数;生成器、判别器更新(生成器和判别器就是小偷和警察的关系,他们共用的…...
day01——登录功能
逻辑: 前端将登录信息通过报文的形式,发送给后端。后端进行登陆验证 2.1 根据接受的用户名,查询数据表。 若不存在该用户的记录,返回用户不存在。 若用户存在,判断数据库中的密码和接收的是否一致,不一致则…...
Flutter中使用FFI的方式链接C/C++的so库(harmonyos)
Flutter中使用FFI的方式链接C/C库(harmonyos) FFI plugin创建和so的配置FFI插件对so库的使用 FFI plugin创建和so的配置 首先我们可以根据下面的链接生成FFI plugin插件:开发FFI plugin插件 然后在主项目中pubspec.yaml 添加插件的依赖路径&…...
【C++】二义性
在C中,二义性(ambiguity)通常指的是编译器无法确定使用哪个函数、变量或类成员的情况。这种不确定性通常是由于继承和多态特性导致的。下面是一些常见的产生二义性的场景以及如何解决它们的方法: 1. 多重继承中的二义性 当一个类…...
高并发内存池(五):ThreadCache、CentralCache和PageCache的内存回收机制、阶段性代码展示和释放内存过程的调试
目录 ThreadCache的内存回收机制 补充内容1 补充内容2 补充内容3 补充内容4 ListTooLong函数的实现 CentralCache的内存回收机制 MapObjectToSpan函数的实现 ReleaseListToSpans函数的实现 PageCache的内存回收机制 补充内容1 补充内容2 ReleaseSpanToPageCache函…...
STL之stackqueue篇(上)探索C++ STL中的Queue与Stack——构建数据处理的基础框架
文章目录 前言一、stack1.1 定义与基本概念1.2 底层容器1.3 成员函数1.4 使用示例1.5 注意事项1.6 应用场景 二、queue2.1 定义与基本概念2.2 底层容器2.3 成员函数2.4 使用示例2.5 注意事项2.6 应用场景 前言 本文旨在深入探讨C STL中的queue与stack容器,从它们的…...
代码随想录算法训练营Day13
110.平衡二叉树 力扣题目链接:. - 力扣(LeetCode) 后序迭代 class Solution {public boolean isBalanced(TreeNode root) {return getHeight(root)!-1;}public int getHeight(TreeNode root){if(rootnull){return 0;}int leftheightgetHei…...
基于STM32的智能门禁系统
目录 引言项目背景环境准备 硬件准备软件安装与配置系统设计 系统架构关键技术代码示例 RFID数据采集与处理门禁控制实现显示与报警功能应用场景结论 1. 引言 智能门禁系统在现代安防中占据重要地位,通常用于控制进入和离开特定区域的权限。通过基于STM32微控制器…...
[EBPF] 实时捕获DM数据库是否存在SQL阻塞
1. 介绍 eBPF(extened Berkeley Packet Filter)是一种内核技术,它允许开发人员在不修改内核代码的情况下运行特定的功能。eBPF 的概念源自于 Berkeley Packet Filter(BPF),后者是由贝尔实验室开发的一种网…...
秋招内推--招联金融2025
【投递方式】 直接扫下方二维码,或点击内推官网https://wecruit.hotjob.cn/SU61025e262f9d247b98e0a2c2/mc/position/campus,使用内推码 igcefb 投递) 【招聘岗位】 后台开发 前端开发 数据开发 数据运营 算法开发 技术运维 软件测试 产品策…...
Unity2022.3.x各个版本bug集合及推荐稳定版本
最近升级到Unity2022,发现以下问题,仅作参考 2022.3.0f1 - 2022.3.6f1 粒子渲染到RenderTexture闪屏 https://issuetracker.unity3d.com/issues/android-vulkan-visualisation-corruption-occurs-when-rendering-particles-to-render-texture 2022.3.…...
SparkSQL-性能调优
祝福 在这个举国同庆的时刻,我们首先献上对祖国的祝福: 第一,我们感谢您给我们和平的环境,让我们能快乐生活 第二,祝福我们国家未来的路越走越宽广,科技更发达,人民更幸福 第三,…...
leetcode-链表篇
leetcode-707 你可以选择使用单链表或者双链表,设计并实现自己的链表。 单链表中的节点应该具备两个属性:val 和 next 。val 是当前节点的值,next 是指向下一个节点的指针/引用。 如果是双向链表,则还需要属性 prev 以指示链表中的…...
JetLinks物联网平台微服务化系列文章介绍
橙蜂智能公司致力于提供先进的人工智能和物联网解决方案,帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、AI知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。 橙蜂智农的智慧农业产品涵盖了多方面的功能&#x…...
【QT Quick】基础语法:导入外部QML文件
在实际项目中,代码通常分为多个文件进行模块化管理,这样可以方便代码重用,例如统一风格或共享功能模块。我们将在此部分学习如何创建 QML 项目,并演示如何访问外部代码,包括其他 QML 文件、库文件以及 JS 代码。 准备…...
Llama 系列简介与 Llama3 预训练模型推理
1. Llama 系列简介 1.1 Llama1 由 Meta AI 发布,包含 7B、13B、33B 和 65B 四种参数规模的开源基座语言模型 数据集:模型训练数据集使用的都是开源的数据集,总共 1.4T token 模型结构:原始的 Transformer 由编码器(…...
【AIGC】ChatGPT提示词助力自媒体内容创作升级
博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言💯高效仿写专家级文章提示词使用方法 💯CSDN博主账号分析提示词使用方法 💯自媒体爆款文案优化助手提示词使用方法 💯小结 💯…...
wordpress 访客插件/网页设计代码
上篇博客试图采用RecyclerView这个组件来实现一个滑动效果,结果发现大部分代码都是通过java代码来控制填充,设计时不仅操作麻烦(最主要看不懂),而且不能像xml文件一样实时预览效果。 碰巧发现了这篇博客 Android ListV…...
windows2012系统怎么建设网站/新闻式软文
http://www.930cn.cn/credit-repair/14373.html 详细内容:如何维护硬盘? 答案: 如何正确使用维护硬盘 硬盘是如今微机中必不可少的部件,也是最昂贵、淘汰最慢的主设备,硬盘的正确使用与操作,维护&am…...
青海wap网站建设哪家好/百度推广图片尺寸要求
在詹姆斯的正代签名战靴中,有不少人气不错的经典配色,首次诞生于 LeBron 4 的 “Graffiti” 涂鸦配色就是其中之一。除了 4 代之外,LeBron 11 和 LeBron 15 都曾带来 “Graffiti” 涂鸦配色,近日 Instagram 知名球鞋爆料账号 zsne…...
济南微网站开发/百度一下首页网页手机版
jsp的常用指令有哪些(编译指令/动作指令整理) JSP动作指令 JSP - JSP中的脚本、指令、动作和注释...
安庆城乡建设局网站/国产免费crm系统有哪些在线
说明 POI可以对2003-和2007版本的Excel文件做导入导出操作,本章只简单介绍对Excel文件的导入操作。 Excel文件的上传处理处理请求,依然使用SpringMvc中的MultipartRequest方式处理。前端JSP中使用传统form表单提交方式。环境 MavenJDK6 Tomcat7.x Sprin…...
收录软件最多的网站/深圳网络营销推广渠道
另一列中写入 IF(COUNTIF(C:C,C1)>1,"有重复","") 其余往下拖拉公式 我在想如果可以有不往下拖的呢? 不过好像筛选中也有类似的选项.转载于:https://www.cnblogs.com/vimmer/p/3445794.html...