图结构感知的Transformer:一种新的图表示学习方法

人工智能咨询培训老师叶梓 转载标明出处

尽管图神经网络(GNNs)在处理图数据方面取得了显著成就,但它们在表达能力和捕获长距离依赖方面存在局限性。为了突破这些局限,研究者们开始探索将Transformer架构应用于图表示学习。在此基础上,瑞士苏黎世联邦理工学院的研究团队提出了一种创新的方法——Structure-Aware Transformer(SAT),旨在通过在自注意力机制中引入基于子图的表示,增强模型对图结构的感知能力,从而在计算注意力时能够显式地考虑节点间的图结构信息。

SAT

在传统的Transformer模型中,自注意力机制仅依赖于节点特征,忽略了节点在图中的结构位置和邻域信息。研究者提出的结构感知自注意力机制,通过引入子图表示来增强模型对图结构的感知能力。

图 2 展示了一个使用k-subgraph GNN提取器作为其结构提取器的SAT层的概述。结构提取器生成结构感知的节点表示,这些表示被用来计算Transformer层中的查询(Q)和键(K)矩阵。具体为k-subgraph GNN提取器首先提取以每个节点为中心的k-hop子图(这里,k=1),然后使用GNN在每个子图上生成节点表示,利用完整的子图信息。

结构感知自注意力函数不仅考虑了节点特征的相似性,还考虑了子图之间的结构相似性。这使得它能够生成比原始自注意力更富有表达性的节点表示。

公式 (5) 定义了结构感知注意力函数 SA-attn(v),其中 SG(v) 表示以节点 v 为中心的子图,与节点特征 X 相关联,κgraph 是可以比较一对子图的核函数。这种自注意力不再是节点排列不变的,而仅在节点的特征和子图相同时才不变,这是理想的属性。

公式 (6) 提供了 κgraph 的一种形式,它包含了一大类富有表达性且计算上可行的模型。

在定义了结构感知自注意力函数之后,Structure-Aware Transformer的其他组件遵循Transformer架构。如图 2 所示,自注意力函数后面是一个跳跃连接(skip-connection)、一个前馈网络(FFN)以及FFN前后的两个归一化层。另外跳跃连接中还包括了度因子,这有助于减少高度连接的图组件的压倒性影响。

公式 (9) 展示了如何结合自注意力和节点的度来更新节点表示。

对于图属性预测,有多种方法可以将节点级表示聚合成图表示,例如通过取平均或求和。或者,可以使用虚拟 [CLS] 节点的嵌入,该节点附加到输入图上,与其他节点没有连接。

尽管结构感知自注意力已经能够感知结构信息,但大多数绝对编码技术仅是位置感知的,因此可以提供补充信息。实际上结合使用可以进一步提高性能。研究者选择使用随机游走位置编码(RWPE),尽管也可以使用其他任何绝对位置表示,包括可学习的表示。

定理 1 表明,如果两个节点的子图表示相似,那么它们在结构感知注意力之后的表示也会相似。这表明结构感知编码可以生成相似的节点级表示,即使在不同图中,只要它们具有相似的局部结构。

由于结构感知注意力的设计独特,依赖于子图结构提取器,因此可以研究输出表示的表达性。定理 2 表明,结构感知注意力层的节点表示至少与其子图表示一样具有表达性。

通过这些创新,Structure-Aware Transformer在图表示学习领域提供了一种新的视角,有望推动相关技术的发展。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。实战专家1小时讲解让您轻松上手,学习如何使用 Llama Factory 微调模型。

评论留言“参加”或扫描微信备注“参加”,即可参加线上直播分享,叶老师亲自指导,互动沟通,全面掌握Llama Factory。关注享粉丝福利,限时免费录播讲解。

LLaMA Factory 支持多种预训练模型和微调算法。它提供灵活的运算精度和优化算法选择,以及丰富的实验监控工具。开源特性和社区支持使其易于使用,适合各类用户快速提升模型性能。

实验

实验中,SAT模型与多种GNNs进行了比较,包括GCN、GraphSAGE、GAT、GIN、PNA、DeeperGCN和ExpC等。同时,也与最近提出的多种基于图的Transformer模型进行了比较,包括原始的Transformer与RWPE、Graph Transformer、SAN、Graphormer和GraphTrans等。

在表1和表2中,SAT模型与其他GNNs和Transformers的性能进行了比较。结果显示,SAT在所有数据集上一致地超越了现有的最先进方法,证明了其结合GNNs和Transformers优势的能力。特别是在CODE2数据集上,尽管参数数量相对较少且仅进行了最小的超参数调整,SAT模型仍然大幅度超越了其他SOTA方法。

表3总结了SAT相对于其使用的稀疏GNN的性能,这些GNN用于提取子图表示。在不同的GNN选择中,两种变体的SAT(k-subtree和k-subgraph SAT)始终显著提高了基础GNN的性能,这表明结构感知方法的表达能力得到了显著提升。

超参数k的选择对SAT模型的性能有显著影响。图 3a 展示了在ZINC数据集上,使用PNA和不同k值的k-subtree和k-subgraph提取器时,测试MAE如何变化。结果表明,包含结构信息可以显著提高性能,k=3时性能最佳。与仅使用绝对位置编码的Transformer相比,结构感知注意力在性能上取得了显著提升,如图 3b所示。

除了性能提升外,SAT模型还提供了比仅具有绝对位置编码的经典Transformer更好的模型解释性。通过在Mutagenicity数据集上训练SAT模型和具有CLS读出的Transformer,并可视化[CLS]节点与其他节点之间的注意力分数,如图 4所示。SAT模型能够识别出更多与突变性相关的化学基团(例如NO2和NH2),并且注意力分数更稀疏、更具信息性。

这些实验结果不仅证明了SAT模型在图表示学习任务中的有效性,还展示了其在模型解释性方面的优势,为未来的研究和应用提供了有价值的参考。

https://arxiv.org/pdf/2202.03036v3

GitHub - BorgwardtLab/SAT: Official Pytorch code for Structure-Aware Transformer.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1542514.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能的前景与未来就业市场:机遇、挑战与社会影响

随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面,它不仅引领着技术革新的浪潮,更在无声中重塑着我们的就业市场和社会结构。站在这个时代的交汇点上,我们不禁要问:人工智能将…

Web Components之继承

我们在使用Web Components自定义组件的时候,我们需要继承HTMLElement这个浏览器内置对象,但是如果我要一些高级封装,给组件内置一些方法的话。我们就需要使用继承的方式,在父类中实现基本功能的封装。 1 父类的封装 以下是我的继…

Java多线程(1)—线程基础

一、关于线程 1.1 简介 计算机线程(Thread)是操作系统能够进行运算调度的最小单位。线程的优势在于提高了程序的效率和响应能力,尤其在处理 I/O 操作或多任务时。多线程编程能够充分利用多核处理器的计算能力,达到更高的性能。 …

Spring 源码分析

Spring 源码版本 4.2.8.RELEASE Bean 生命周期 动态代理 代理模式 优点: 在不修改目标对象的功能前提下,能通过代理对象对目标功能扩展缺点: 代理对象需要与目标对象实现一样的接口,所以会有很多代理类,一旦接口增加方法,目标对…

Apifox 「定时任务」操作指南,解锁自动化测试的新利器

定时任务是按照预设时间自动执行的任务,它可以有效解决一些常见问题,比如频繁执行的回归测试和大规模的接口测试,这些任务需要在固定时间点或间隔周期内自动运行,以确保软件的持续集成和持续交付过程中的稳定性和可靠性。通过使用…

Windows下 批量重命名文件【bat实现】-两个小问题

Windows下 批量重命名文件【bat实现】_bat批量重命名文件ren-CSDN博客 上面是原来的教程,我遇到了两个小问题,问题及解决如下: ①dir/b>rename.csv : 无法将“dir/b>rename.csv”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。…

【每天学个新注解】Day 2 Lombok注解简解(一)—@Data、@Build、@Value

Data 相当于同时使用了 Getter 、Setter 、RequiredArgsConstructor、ToString、EqualsAndHashCode 1、如何使用 需要同时使用Getter 、Setter 、RequiredArgsConstructor、ToString、EqualsAndHashCode注解一个Bean的时候。 2、代码示例 例: Data public cla…

CCC SPAKE2+流程解析

1、SPAKE2流程及SCP03通道介绍 SPAKE2流程发生在CCC车主配对过程中的Phase2。 SPAKE2流程为车辆和手机之间的数据交换建立了一个安全通道SCP03。 那这个SCP03通道是干啥的? 我们可以先简单的理解为:建立安全通道前,车辆和手机之间交互的AP…

剖解反转链表

剖解反转链表 思路: 1.若链表为空或者只存在一个节点,就无需反转,直接返回head 2.若存在多个节点 首先将head.next给到cur,并将head.next置为null 剩余的节点就利用头插法,反转链表 class Solution {public ListNo…

基于SpringBoot+Vue+MySQL的特色旅游网站系统

系统展示 用户前台界面 管理员后台界面 系统背景 随着旅游业的蓬勃发展,人们对旅游体验的需求日益多样化与个性化。传统的旅游信息查询与预订方式已难以满足现代游客的需求。因此,我们开发了这款基于SpringBootVueMySQL的特色旅游网站系统。该系统旨在通…

MySQL高阶1917-Leetcodify好友推荐

目录 题目 准备数据 分析数据 总结 题目 为 Leetcodify 用户推荐好友。我们将符合下列条件的用户 x 推荐给用户 y : 用户 x 和 y 不是好友,且用户 x 和 y 在同一天收听了相同的三首或更多不同歌曲。 注意,好友推荐是单向的&#xff0c…

web前端字段大小写下划线转换工具

文章目录 前言一、如何使用?二、相关代码总结 前言 程序员在敲代码的过程中都要命名一些字段,但是Java语言对字段的命名规范和sql命名规范不一样,如下图所示,这种机械性的转换工作很劳神费力,为了省点劲写了一个web小…

pdf怎么编辑修改内容?试试这四款工具!

作为一个经常探索各种办公软件的人,今天我打算和大家聊聊一个我们工作中经常会遇到的问题——编辑PDF文件。我们都知道,PDF文件以其格式稳定、不易被篡改而受到青睐,但这也意味着一旦需要修改内容,就变得相当棘手。不过&#xff0…

设计模式之类结构模式例题

答案:B A 知识点: 设计模式中类结构模式分别是:工厂方法模式,适配器模式,模板方法模式,解释器模式 记忆方法:公司里有个模特小姐姐,公是工厂模式,司是适配器模式&…

Mapper代理

文章目录 Mapper代理路径一定要写对Mapper代理方式加载配置文件 (包扫描的方式) Mapper代理 好像就是能 包名.方法。 反正就是防止硬编码,更灵活,更适用。 路径一定要写对 Mapper代理方式加载配置文件 (包扫描的方式…

fiddler抓包08_抓Android手机请求

课程大纲 手机抓包,电脑端的设置和IOS端相同,设置一次即可,无需重复设置。 前提:电脑和手机连接同一个局域网 土小帽电脑和手机都连了自己的无线网“tuxiaomao”。 Step1. 电脑端设置 ① 打开Fiddler - 开启抓包(F12…

Windows下如何定时执行自定义任务

目录 一.前言二.设置定时自动执行自定义任务 一.前言 本文环境是Windows11系统。 有时候我们希望能够在Windows下定时自动执行自定义任务,比如检测数据库服务的状态。那在Windows下怎么定时自动执行自定义任务,这篇文章介绍一种方法。 二.设置定时自动…

计算机毕业设计推荐-基于python的电子图书阅读推荐平台【源码+文档+讲解】

💖🔥作者主页:毕设木哥 精彩专栏推荐订阅:在 下方专栏👇🏻👇🏻👇🏻👇🏻 实战项目 文章目录 实战项目 一、基于python的电子图书阅读推…

吴津雨银洁刘雅雯获得国际超模大赛四川总决赛网络组三甲

9月8日众人期盼已久的都江堰杯2024国际超模大赛四川总决赛在三遗之城都江堰落下帷幕。国际超模大赛已经举办第12个年头,每年为时尚界、模特界输送无数的优秀时尚模特人才,让世界超模中出现更多的中国面孔。大赛在全球已经布局多个国家及地区,…

项目第七弹:消费者管理模块

项目第七弹:消费者管理模块 一、为何要有这个模块?二、消费者是否需要持久化?三、怎么设计?1.如何抽象描述?1.回想一下基于生产消费模型的线程池2.如何组织3.消息处理与确认问题的解决4.自动确认标志5.消费者代码 2.队…