当前位置: 首页 > news >正文

【CS224图机器学习】task1 图机器学习导论

前言:本期学习是由datawhale(公众号)组织,由子豪兄讲解的202302期CS224图机器学习的学习笔记。本次学习主要针对图机器学习导论做学习总结。

1.什么是图机器学习?

通过图这种数据结构,对跨模态数据进行整理。可以实现预测结点、预测结点间关系、将图关系提出去成D维向量或生成子图的一种算法。

2.为什么要用图机器学习

图机器学习是解决跨模态数据间利用数据间关系进行挖掘的算法,而不是像cv、传统机器学习这样算法是针对个体进行学习的算法。有了图机器学习的研究可以掌握数据之间的关系,可以对关系进行预测及提炼。图机器学习的方法在很多领域已经有不错的应用,例如理疗知识图谱、物理建模粒子效果模拟、蛋白质结构预测。因此图网络的论文也是近年来的热点。

3.图神经网络的特点是什么?

对于图来说:

网络是复杂的。有任意尺寸的输入,同时有着复杂的拓扑结构。没有固定的结点顺序及参考锚点。图在动态变化,而且拥有多模态的特点。

对于网络来说:

输入:图(网络)

输出:结点标签、新链接、D维向量、生成图与子图

特点:端到端的表示学习

注意:这里的D维向量生成后可以理解为是二维数据,可以在此之上进行机器学习方法进行分类或预测。例如将银行客户数据采集到,进行预测客户是否会逾期。

4.本次学习的整体课程大纲

本次学习的课程是斯坦福大学的CS224W,主讲老师是Jure Leskovec (我觉得他好帅啊……而且感觉好年轻)

学习大纲如下:

①畅通机器学习方法

②node embedding方法(图嵌入方法)

GNN相关方法

④知识图谱推理

⑤子图

⑥图生成

学习中会用的库:

pyG、GraphG(都是jl老师做的)、NetworkX(比较简洁的图相关库,瑞士军刀)、DGL(沐神推荐的~亚马逊在做,里面有很多复现好的论文算法)

图数据存储数据库:Neo4j

5.图神经网络有哪些应用?

①节点层次:信用卡欺诈

②链接层面:推荐可能认识的人

③社群层:将用户聚类,挖掘相似群体

④图层次:生成新的子图,导航、铁路建设规划

⑤图生成:深化输入图的发展,完善输入数据

在节点层中一般有已知推未知包括短视频的推荐算法,这里子豪兄举例可以做药物融合后副作用预测,效果还不错。

子图层上的应用也很多,有导航、药物设计、物理粒子效果模拟,这里面最伟大的一个项目是预测蛋白质空间结构。这个研究推动了治疗癌症药物的发展,只需要输入蛋白质序列就可以输出预测的图结构,效果斐然。真厉害!

子豪兄还介绍了一些日常用得到的图相关应用:ReadPaper-论文阅读平台-专业学术讨论社区、Connected Papers | Find and explore academic papers 可以生成自己跌论文引用网络。 还有深圳政府做的bios医疗图谱Biomedical Informatics Ontology System | BIOS@IDEA。最后推荐了一名大牛老师:刘焕勇-个人主页 (liuhuanyong.github.io)。大佬对图的研究颇有建树。

图是最优质的长期资产,
网络效应是一个企业最深的护城河。

6.图的基本表示:

6.1 图基本结构

6.2 本体图

针对解决的问题设计图的结点类型。

如果结点类型等于2图叫二分图。二分图中分为u v 两类结点,可以单独列出一类做单类分析。

如果结点类型大于2的图叫异质图

6.3 图的各种知识点

图的边没有方向叫无向图

图的边带方向叫有向图

下图为连接数的计算方法。

自连接图多边图

有权图无权图

6.4 图的计算机表示

邻接矩阵

针对数据量比较丰富的图,可以用邻接矩阵的方法表示。

一般无向图是对称矩阵,有向图是非对称矩阵。当存在自连接情况对角线数据为1

下图为连接总数的计算。

对于大数据表示的图时会发现表现为稀疏矩阵,很多都为0.

采用连接列表只表示边的列表去表示图。

邻接列表 以节点的方式表示整个图。

6.5 图的连通性

所有点都连通叫连通图。连通子图叫连通域

任意两点可以相互触达是强连接图

强连通子图叫强连通域SCC

相关文章:

【CS224图机器学习】task1 图机器学习导论

前言:本期学习是由datawhale(公众号)组织,由子豪兄讲解的202302期CS224图机器学习的学习笔记。本次学习主要针对图机器学习导论做学习总结。1.什么是图机器学习?通过图这种数据结构,对跨模态数据进行整理。…...

Powershell Install SQL Server 2022

前言 SQL Server 2022 (16.x) 在早期版本的基础上构建,旨在将 SQL Server 发展成一个平台,以提供开发语言、数据类型、本地或云环境以及操作系统选项。 SQL Server Management Studio (SSMS) 是一种集成环境,用于管理从 SQL Server 到 Azure SQL 数据库的任何 SQL 基础结构…...

Jetson NX2 装机过程

1.固态硬盘安装完成后,系统配置 df -h 查看硬盘使用情况 2.查看Jetson NX的IP地址,以下两个都行 ifconfig ip address show 3.Jetson NX2安装arm64的annaconda3,安装有问题报错illegal instruction,未解决。 4.VNC远程登录 …...

初始C++(四):内联函数

文章目录一.内联函数概念二.内联函数用法三.内联函数的特性四.内联函数和宏一.内联函数概念 以inline修饰的函数叫做内联函数,编译时C编译器会在调用内联函数的地方展开,没有函数调用建立栈帧的开销,内联函数提升程序运行的效率。 二.内联函…...

九、初识卷积

文章目录1、通过边缘检测认识卷积2、Padding3、Strid Convelution4、RGB图像的卷积THE END1、通过边缘检测认识卷积 \qquad在使用神经网络进行图像识别时,神经网络的前几层需要完成对图像的边缘检测任务,所谓的边缘检测就是让计算机识别出一张图片的垂直…...

【Linux】【编译】编译调试过程中如何打印出实际的编译命令

🐚作者简介:花神庙码农(专注于Linux、WLAN、TCP/IP、Python等技术方向)🐳博客主页:花神庙码农 ,地址:https://blog.csdn.net/qxhgd🌐系列专栏:Linux技术&…...

linux安装jdk

step1 下载jdk 到下面的网站下载需要的jdk安装包版本。 Java Downloads | Oracle step2 复制到opt目录 其中user_name对应自己的home目录的用户文件夹 sudo cp /home/user_name//home/czh/Downloads/jdk-17_linux-x64_bin.tar.gz /opt/ step3 到opt目录解压安装包&#xf…...

迅为iTOP-3A5000龙芯开发板安装UOS操作系统

3A5000板卡采用全国产龙芯3A5000处理器,基于龙芯自主指令系统(LoongArch),市面上龙芯3A5000主板价格都在上万元,可以说是非常贵了, 迅为全新推出了款千元内的iTOP-3A5000开发板,这款板卡各方面的配置也是第…...

Firefox 110, Chrome 110, Chromium 110 官网离线下载 (macOS, Linux, Windows)

Mozilla Firefox, Google Chrome, Chromium, Apple Safari 请访问原文链接:https://sysin.org/blog/chrome-firefox-download/,查看最新版。原创作品,转载请保留出处。 作者主页:www.sysin.org 天下只剩三种(主流&am…...

如何使用ArcGIS转换坐标

1.概述大家都知道ArcGIS提供了坐标转换功能,在我们手里的数据坐标系千差万别,经常会遇到转换坐标的时候,那么是否可以用ArcGIS进行转换?答案是肯定的,但是转换的过程比较复杂,这里为大家介绍一下转换的方法…...

链表基本原理

链表基本原理1.链表1.1 基本原理1.2 链表大O记法表示2. 链表操作2.1 读取2.2 查找2.3 插入2.4 删除3.链表代码实现1.链表 1.1 基本原理 节点 组成链表的数据格子不是连续的。可以分布在内存的各个位置。这种不相邻的格子就叫结点。每个结点保存数据还保存着链表里的下一结点的…...

基于JAVA+SpringBoot+Vue+ElementUI中学化学实验室耗材管理系统

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 当前,中学…...

1.输入子系统学习-struct input_dev-2023.02

内核版本:4.4.194 平台相关:rk3399 目前主要是看的触摸屏的代码 目录 一、include/linux/input.h(struct_input_dev) 二、结构体的注释部分(百度翻译) 三、Documentation/input/event-codes.txt&…...

解决:PDFBox报的java.io.IOException: Missing root object specification in trailer

文章目录问题描述原因分析解决方案问题描述 使用pdfbox类库操作pdf文件时,遇到下面的报错信息: java.io.IOException: Missing root object specification in trailer PDFBox参考: https://pdfbox.apache.org/ Apache PDFBox 库是一个开源的…...

MAC OSX安装Python环境 + Visual Studio Code

MAC上开发python怎么能少得了python3环境呢,而安装python3环境的方式也有多种,这里仅选用并记录本人认为比较方便的方式 安装Homebrew Homebrew是macOS 缺失的软件包管理器, 使用它可以在MAC上安装很多没有预装的东西,详细说明可…...

音乐 APP 用户争夺战,火山引擎 VeDI 助力用户体验升级!

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 国内数字音乐市场正在保持稳定增长。 根据华经产业研究院数据报告显示,2020 年数字音乐市场规模为 357.3 亿元,到 2022 年市场规模已增长至 482.7 …...

CAP和BASE理论

CAP理论CAP是 Consistency、Availability、Partition tolerance 三个词语的缩写,分别表示一致性、可用性、分区容忍性。它指出一个分布式计算系统不可能同时满足以下三点:• 一致性(Consistency) :等同于所有节点访问同…...

基于商品理解的成交能力和成交满意度优化在Lazada的实践

作者:马蕊 Lazada推荐算法团队 在Lazada各域推荐场景中,既有优质商品优质卖家不断涌现带来的机会,也有商品质量参差带来的问题。如何才能为用户提供更好的体验,对卖家变化行为进行正向激励呢?下面本文将为大家分享我们…...

idea推送镜像到desktop报错:Cannot run program “docker-credential-desktop“ 系统找不到指定的文件。

windows Docker 搭建仓库 打开docker desktop 。 打开windows cmd窗口或powershell窗口。 输入"docker run -d -p 5000:5000 --name test registry:2 "运行一个名字叫test的registry容器。 idea配置springboot项目的docker插件 在pom.xml中的plugins中加入下面代码…...

hive开窗函数

hive开窗函数 窗口函数 数据准备 1 jx 20 2 zx 24 3 yx 18 4 wz 10 5 yy 34 6 wy 25create table t (> id int,> name string,> age int> )> row format delimited fields terminated by ; load data inpath /data/data.txt into table t;ROW_NUMBER ROW_N…...

安全多方计算系列笔记1——前世今生

这一系列笔记参考了绿盟科技研究通讯的安全多方计算文章,及其他。 首先看定义:在不泄露参与方原始输入数据的前提下,允许分布式参与方合作计算任意函数,输出准确的计算结果。 起源 安全多方计算问题及解首先由姚期智&#xff08…...

16- 梯度提升分类树GBDT (梯度下降优化) (算法)

梯度提升算法 from sklearn.ensemble import GradientBoostingClassifier clf GradientBoostingClassifier(subsample0.8,learning_rate 0.005) clf.fit(X_train,y_train) 1、交叉熵 1.1、信息熵 构建好一颗树,数据变的有顺序了(构建前&#xff0c…...

SpringCloud+Nacos+Gateway

SpringCloudNacosGatewaySpringBoot整合GatewayNacos一. 环境准备1. 版本环境2. 服务环境二. 实战1.创建用户服务2.创建订单服务3.创建网关服务4.测试三. 避坑指南问题1--503问题问题2--网关服务启动报错SpringBoot整合GatewayNacos 本篇文章只演示通过gateway网关服务访问其他…...

高通开发系列 - linux kernel内核升级msm-3.18升至msm-4.9(2)

By: fulinux E-mail: fulinux@sina.com Blog: https://blog.csdn.net/fulinus 喜欢的盆友欢迎点赞和订阅! 你的喜欢就是我写作的动力! 目录 返回高通开发系列 - 总目录 前面我们升级了msm-4.9内核系统正常启动了,文件系统也正常工作,但那是使用了老基线的文件系统,其yocto…...

Spring依赖注入与反转控制到底是个啥?

目录 1. 引言 2. 管中窥豹 3.1 Spring 依赖注入 3.2 Bean 的依赖注入方式有两种 4. 总结 1. 引言 此文目的是用通俗易懂的语言讲清楚什么是依赖注入与反转控制,在看了大量的博客文章后归纳总结,便于后续巩固!我相信,大多数…...

Linux Shell脚本讲解

目录 Shell脚本基础 Shell脚本组成 Shell脚本工作方式 编写简单的Shell脚本 Shell脚本参数 Shell脚本接收参数 Shell脚本判断用户参数 文件测试与逻辑测试语句 整数测试比较语句 字符串比较语句 Shell流程控制 if条件判断语句 单分支 双分支 多分支 for循环语句…...

Linux:用户空间非法指针coredump简析

1. 前言 限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺。 2. 背景 本文分析基于 ARM32 架构,Linux-4.14 内核代码。 3. 问题分析 3.1 测试范例 void main(void) {*(int *)0 8; }运行程序会 …...

带你玩转Jetson之Deepstream简明教程(四)DeepstreamApp如何使用以及用于工程验证。

1.DeepstreamApp是什么? 如果你安装完毕deepstream整体框架,会在你的系统执行目录内有可执行文件,文件名字是deepstream-app。这是一个可执行脚本文件,通过deepstream框架中的代码在安装的时候编译后install到系统根目录内。 此脚…...

快速搭建个人在线书库,随时随地畅享阅读!

前边我们利用NAS部署了个人的导航页、小说站、云笔记,今天,我们再看看怎么部署一个个人的在线书库。 相信很多朋友都在自己的电脑中收藏了大量的PDF、MOBI等格式的电子书籍,但是一旦换了一台设备,要么是无法翻阅,要么…...

电子纸墨水屏的现实应用场景

电子纸挺好个东西,大家都把注意力集中在商超场景 其实还有更多有趣的场景方案可用,价值也不小,比如: 一、仓库场景 通过亮灯拣选,提高仓库作业效率 二、仓库循环使用标签 做NFC类发卡式应用,替代传统纸…...

如何设置网站icon/企业网络推广的方法有哪些

jenkins怎么为视图添加对应job...

汕头市网站建设分站公司/网页制作代码html制作一个网页

①更改system_stm32f4xx.c中的所示值 PLL_VCO input clock (HSE_VALUE or HSI_VALUE / PLL_M) 此时设置的为此值 ②更改外部晶振初值,初始为25000000,改为外部晶振值 时钟树中此值。 ③添加宏和头 STM32F40_41xxx,USE_STDPERIPH_DRIVER 目的还是配置相关时钟的数…...

在深圳做网站平台需要什么备案/杭州全网推广

字典的常用方法 方便举例,先创建2个字典 list_test{"bob":19,"aoa":18,"coc":17} list_b{qqq:000}参数返回值含义.items()dict_items([(‘bob’, 19), (‘aoa’, 18), (‘coc’, 17)])返回所有键值.keys()dict_keys([‘bob’, ‘ao…...

网易云外链wordpress/百度关键词排名推广工具

一、简介说明 1.关于VS Code开发工具,安装和配置,更多可以参考以前文章 2.关于Vue.js,Vue是一个优秀的渐进式前端框架,不仅易于上手,还便于与第三方库或既有项目整合。 3.关于Vue的使用方式有两种,第一种…...

wordpress怎么复制别人的/万能推广app

精确率:检出为某类缺陷的样本中实际为该类缺陷的概率; 召回率:实际为某类缺陷的样本中被检出为该类缺陷的概率; 精确率和召回率越高越好...

百度小程序中心/关键词优化推广公司排名

大家好,我是汤圆,为什么要写面试题呢(这是直接搬的哈哈 表格的文章) ,太无聊了 就看一遍 然后搬一篇,我也要坚持搬运完100篇! 目录 面试题1:你怎么理解ORM框架,常见的ORM框架都有哪些? 正经回…...