HiGPT:异构图语言模型的突破

人工智能咨询培训老师叶梓 转载标明出处

人工智能领域的一大挑战是如何从海量复杂的数据中提取有价值的信息,特别是在处理异构图数据时。异构图由多种类型的节点和边组成,它们之间的相互关系丰富而复杂。传统的图神经网络(GNNs)在处理这类数据时,往往受限于其对特定图结构的依赖,难以适应新的、未见过的数据集。这限制了模型在不同领域和任务中的泛化能力。为了解决这一问题。由香港大学与百度公司联合研究团队提出的HiGPT模型,一个无需针对下游数据集进行微调即可学习的通用大型图模型,为这一问题提供了新的解决方案。

HiGPT模型的核心在于其创新的异构图指令调整范式。该模型通过引入上下文异构图分词器,能够捕捉不同异构图中的语义关系,从而实现模型的自适应。HiGPT还整合了大量异构图指令,使模型能够有效理解复杂的关系异构性,并区分各种类型的图标记。

为了应对模型微调中的数据稀缺问题,研究团队引入了思想混合(Mixture-of-Thought, MoT)指令增强范式。通过生成多样化和信息丰富的指令,有效缓解了数据不足的问题。

论文链接:https://arxiv.org/abs/2402.16024

代码链接:https://github.com/HKUDS/HiGPT

方法

图 1 为 HiGPT 模型的整体架构。HiGPT 利用了一个异构图标记器来将图数据转换为模型可以理解的形式,并通过指令调整技术来提高对图结构和关系的理解和泛化能力。

为了使HiGPT能够适应各种异构图场景,研究者提出了上下文异构图分词器。这种方法能够捕捉不同异构图中存在的多样语义关系,确保统一的处理方式。分词器由两个核心组件构成:上下文参数化异构投影器参数分配器上下文投影器利用语言对异构图中不同的节点和边类型进行编码,以促进模型的适应性。同时,参数分配器动态地为分词器分配特定的参数。为了优化分词器的性能并将其无缝集成到HiGPT框架中,研究者采用了简化的文本-图对比学习框架进行预训练。这一预训练过程直接将分词器纳入HiGPT框架,并有效地与大型语言模型(LLM)集成。这种方法增强了分词器的能力,并确保其在整个模型架构中的顺畅运作。

给定一个异构图G,具有特征矩阵X和邻接矩阵A,异构图分词器的目标是编码异构图的隐藏表示,记为H。这是通过函数H = HG-Tokenizer(X, A)实现的,其中𝑓𝑇𝑖表示节点类型𝑇𝑖的隐藏维度。HG-Tokenizer可以采用各种背景HGNN架构实现,如HetGNN、HAN或HGT。然而,这些异构图神经网络的泛化能力受到其固有设计的约束,其中包括针对特定异构图预先定义的参数学习。因此,训练好的HGNN不能直接应用于其他未见过的异构图,这与实现HG-Tokenizer的统一编码目标相悖。

研究者介绍了一种轻量级的文本-图对比对齐范式,用于预训练提出的异构图分词器。这种方法旨在对齐语言和异构结构的建模能力,使分词器与语言模型更好地协作。研究者考虑了表示为C的原始文本内容,其中C = 𝑐𝑖 ∈ R𝑙𝑖 ×𝑑, 1 ≤ 𝑖 ≤ 𝑁,𝑁表示异构图节点X的总数。在这种方法中,采用了对比标签y和交叉熵函数CE(·)。实现采用了多层普通变换器作为LM-Tokenizer(·)。

HiGPT的目标是使语言模型能够直接为下游任务生成预测,这些任务涉及未见过的异构图和相应的指令。自然语言指令首先被分词器编码成文本嵌入,记为XI = LM-tokenizer(instruction)。为了对齐维度,研究者采用了一个投影器,将图标记映射到与文本嵌入相同的维度,由XG = 𝑓P(H)给出,这可以是一个简单的线性层。对于长度为𝐿的序列,研究者确定了生成目标输出XO的概率。

为了使语言模型能够有效区分不同类型的异构图标记和每种类型内的特定节点,基于自然语言指令,研究者提出了使用由异构图-指令对组成的大型“语料库”进行指令预训练。这种方法使微调后的HiGPT具备了对同质和异构图结构的全面理解。

为了定制化语言模型针对特定异构图任务的推理能力,研究者提出了异构性感知微调。这种方法涉及在初始指令预训练阶段之后进行有监督学习,使用特定任务的指令。这能够细化LLM的性能,并将其适应于目标任务对异构图的具体要求。

在异构图学习的实际情况中,数据稀缺常常构成挑战。特别是在使用异构图来模拟推荐系统中的冷启动用户/项目时,用户交互数据的稀疏性限制了监督信号的可用性。为了解决数据稀疏性问题,研究者提出通过纳入增强的图指令来增强HiGPT。借鉴先前的工作,研究者引入了一种新的异构图指令调整方法。这种方法利用提示工程技术,特别是思想混合(Mixture-of-Thought, MoT),来生成多样化和信息丰富的指令。目标是有效克服数据稀缺带来的挑战。图2显示如何通过思维混合(MoT)策略来增强图指令,以解决数据稀缺问题。通过纳入增强的图指令,研究者期望模型增强能够有效处理数据稀疏性。

研究者关注于设计和优化提示,以有效利用语言模型。研究者采用了几种技术来增强语言模型:链式思考(Chain-of-Thought, CoT)、思维树(Tree-of-Thought, ToT)、小组讨论(PanelGPT)和生成知识提示(Generated Knowledge Prompting, GKP)。通过利用这些技术,研究者的目标是增强异构图指令,特别是在数据有限的情况下。

异构图指令调整的提示

研究者利用七种指令增强策略,每种策略为每个问题-答案对生成七个增强的指令,纳入了思想混合(MoT)的特点。然而,像ChatGPT这样的闭源语言模型可能会产生错误答案,导致指导有误。为了克服这个问题,研究者提出将先验知识,特别是正确答案,纳入提示中。这使得LLM能够模拟生成正确答案,并使用不同的MoT方法产生中间推理步骤。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。9月22日晚,实战专家1小时讲解让您轻松上手,学习如何使用 Llama Factory 微调模型。

加助理微信提供直播链接:amliy007,29.9元即可参加线上直播分享,叶老师亲自指导,互动沟通,全面掌握Llama Factory,关注享粉丝福利,限时免费CSDN听直播后的录播讲解。
 

LLaMA Factory 支持多种预训练模型和微调算法。它提供灵活的运算精度和优化算法选择,以及丰富的实验监控工具。开源特性和社区支持使其易于使用,适合各类用户快速提升模型性能。

实验

研究者们对HiGPT模型进行了全面的评估,以回答几个关键的研究问题:

RQ1:HiGPT在少量样本(few-shot)和零样本(zero-shot)情况下的表现如何与基线方法比较?

RQ2:HiGPT的关键组成部分在不同设置中对其整体性能的贡献程度如何?

RQ3:是否可以利用HiGPT的通用异构性知识,仅通过图指令示例实现图内上下文学习,而无需任何模型优化?

实验在三个基准数据集上进行,即IMDB、DBLP和ACM。IMDB数据集专注于在线电影和电视节目,包含4278部电影、2081名导演和5257名演员。每部电影被归类为动作、喜剧或剧情之一。DBLP数据集包括4057名作者、14328篇论文、7723个术语和20个出版场所,作者分布在数据库、数据挖掘、人工智能和信息检索四个研究领域。ACM数据集包含3025篇论文、5835名作者和56个主题,论文被分类为数据库、无线通信和数据挖掘三个类别。

为了确保所有数据集中节点的特征维度一致,使用预训练的Sentence-BERT将每种类型的节点编码到标准化维度。对于有监督的少量样本节点分类,随机选择每个类别的1、3、5、10、20、40或60个标记节点作为训练集,并保留1000个节点用于验证和测试。评估指标包括Micro-F1、Macro-F1和AUC。

为了全面比较性能,评估了来自三个不同类别的各种最新方法:代表性的同构图神经网络(包括SAGE和GAT)、利用异构图消息传递机制的方法(如HAN、HGT和HetGNN),以及专注于异构图学习的自监督技术(如HGMAE、DMGI和HeCo)。

在三个数据集上执行节点分类任务,探索了少量样本和零样本设置。在少量样本设置中,模型在IMDB数据集上训练,样本数从1到60不等,并在包含1000个样本的IMDB测试集上评估。在零样本设置中,模型在IMDB数据集上以相同的样本数训练,并在分别包含1000个样本的DBLP和ACM数据集上测试。

表2 展示了在有监督和零样本设置中的节点分类实验结果。"-std"和"-cot"分别表示标准测试提示(直接答案)和具有链式思考(Chain-of-Thought, CoT)特性的提示。HiGPT在少量样本设置中一致性地超越了最新的基线,在零样本设置中也显示出显著的改进。

为了评估所提出模块的有效性,逐一移除了HiGPT中的关键技术。结果总结在表3中。消融变体"w/o S1"通过仅在下游任务数据上直接调整指令生成,而"w/o HG"变体则排除了引入异构图标记。这些测试表明,HiGPT在不同样本设置下,尤其是在样本有限的场景下(例如1或3个样本),始终优于这些变体。这归功于引入的图标记,使LLM能够从上下文图中提取高维异构结构信息,显著提高了LLM的准确性。

图内上下文学习(ICL)是一种使用带有任务示例的提示来适应新任务的方法,无需梯度更新。通过向不同IMDB数据集训练的模型添加训练集中的示例,进行了全面测试。"-ICL-1"和"-ICL-2"分别表示一个和两个示例,而"-ICL-DBLP"表示在ACM测试提示之前包含DBLP示例。结果显示,即使只有一个示例,大多数使用图ICL的1-shot模型在有监督和零样本设置中一致性地优于60-shot模型。

图3 展示了HiGPT的图内上下文学习效果,揭示了即使在只有少量训练样本的情况下,通过图内上下文学习,HiGPT也能显著提高其在不同数据集上的泛化能力。

HiGPT的研究不仅推动了异构图学习领域的技术进步,也为未来在更广泛的应用场景中实现有效的信息提取和知识发现提供了新的可能性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1523508.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

年薪80万,成功入职字节跳动!

前言: 最近AI相关就业岗位爆了。。。无论是**华为、**百度、阿里、字节等互联网巨头,还是中小型的科技公司都在高薪挖 AI 人才。 上周找 字节的面试官朋友(职级3-1)要来了几套高质量AI****内部资料和2024吴恩达机器学习资料。既…

DeepMind MuJoCo——生成动态场景中的物体运动视频,模拟物理现象和动作生成

一、DeepMind MuJoCo介绍 DeepMind MuJoCo(Multi-Joint dynamics with Contact)是一个由 DeepMind 开发的高效物理仿真引擎,专门用于模拟具有复杂物理交互的机器人和物理系统。MuJoCo 能够在实时和非实时环境下进行高精度的物理仿真&#xf…

护眼台灯哪个牌子最好?五款央视公认最好的护眼灯分享

小时候,对正确用眼知识一无所知,也不明白何种光线环境对眼睛最为友善,结果如今的近视度数已濒临千度大关。虽然早已习惯佩戴眼镜的生活,但近视所带来的诸多不便仍旧在日常生活中无处不在。因此,对于家中孩子的视力健康…

开源的工作流系统突出优点总结

当前,想要实现高效率的办公,可以一起来了解低代码技术平台、开源的工作流系统的相关特点和功能优势。作为较受职场喜爱的平台产品,低代码技术平台拥有可视化才做界面、灵活、好维护操作等多个优势特点,在推动企业流程化办公的过程…

掀起社交娱乐新浪潮!AI如何应用到短视频APP?

随着人工智能技术的迅速发展和全球社交媒体用户的增长,AI视频生成应用正逐渐成为短视频社交媒体中的关键工具。AI工具不仅可以提高内容的创造效率,还能为用户带来全新的互动体验。 人工智能(AI)已经成为我们日常生活和工作中不可或…

街机 CAPCOM CPS2 中英文名字与驱动对照表

Part.I 简介 本文列举了街机 CPS2 中游戏的中英文名字与其驱动的对照,以帮助诸位更快地找到自己想玩的游戏。 注意:汉化版的街机模拟器 Kawaks 中游戏的中文名字是根据英文直译的,并不是习惯性的中文叫法。比如『三国志』英文名为『Warriors…

django企业开发实战-学习小结

写在前面 初次阅读此书是三年前,当时没经历过完整的项目 觉得这书就是扯淡 后来经历过项目加班与毒打 今天再翻开此书 觉得实乃不可多得之物 花些时间啃下来吧 django版本 3.2 本博客开源项目地址 kimsmith/django企业实战 (gitee.com) 有的代码因为版本混乱报错…

(一)SVG行业组件库描述

SVG教程 https://m.runoob.com/svg/菜鸟教程SVG 教程..https://m.runoob.com/svg/ 1、SVGO 1.1 konw是什么 用于优化SVG文件的Node.js库和命令行应用程序。 SVG文件,特别是那些从矢量编辑器导出的文件,通常包含大量冗余信息。这包括编辑器元数据、注…

51单片机-LED点阵屏实验(动态显示数据静态显示)

第一步喝口汤 个人理解:首先,这个LED点阵屏类似于数码的段选操作,这个LED点阵屏第一步就是利用595芯片来扩充IO,单片595就是能够把一个字节数据通过串行输入(一个IO输入),并行输出(…

【微信小程序】搭建项目步骤 + 引入Tdesign UI

目录 创建1个空文件夹,选择下图基础模板 开启/支持sass 创建公共style文件并引入 引入Tdesign UI: 1. 初始化: 2. 安装后,开发工具进行构建: 3. 修改 app.json 4. 使用 5. 自定义主题色 创建1个空文件夹,选择下…

谈谈 JS 中new的原理与实现

new 做了那些事?new 返回不同的类型时会有什么表现?手写 new 的实现过程 new 关键词的主要作用就是执行一个构造函数、返回一个实例对象,在 new 的过程中,根据构造函数的情况,来确定是否可以接受参数的传递。下面我们通…

python图像类型分类汇总

图型所在包样例例图热图seabornimport matplotlib.pyplot as plt import seaborn as sns sns.heatmap(df.isnull()) plt.show() Bitmap Bitmap import numpy as np # 获取数据 fraud data_df[data_df[Class] 1] nonFraud data_df[data_df[Class] 0] # 相关性计算 cor…

使用 import-linter 让你的 Python 项目架构更整洁

对于活跃的大型 Python 项目而言,维持架构的整洁性是一件颇具挑战的事情,这主要体现在包与包、模块与模块之间,难以保持简单而清晰的依赖关系。 一个大型项目,通常包含数以百记的子模块,各自实现特定的功能&#xff0…

【路径规划】在MATLAB中使用粒子群优化(PSO)进行最优移动机器人路径规划

摘要 本文介绍了使用粒子群优化(Particle Swarm Optimization, PSO)算法实现移动机器人的路径规划。PSO是一种基于群体智能的优化算法,通过模拟粒子群体在搜索空间中的迭代更新,找到全局最优路径。本文通过MATLAB仿真展示了PSO在…

python-小理帮老师改错

题目描述 老师给小理发了一封电子邮件,任务如下。 写一个程序,给你 n 个数,输出 X。 Xnum1^p1​​num2^p2​​⋯numn^pn​​ num1​,num2​,⋯⋯,numn​ 都是整数,p1​,p2​&#xf…

重大突破 谷歌DeepMind展示GenRM技术:AI推理能力的新里程碑

引言: 近日,谷歌DeepMind团队在arxiv平台上发表了一项突破性论文,正式推出了GenRM技术,这一创新成果显著提升了AI在复杂任务处理中的能力表现,再次跨越了技术界限,为人工智能的推理能力树立了崭新的标杆。 …

HMI触屏网关-VISION如何和OPC UA服务端通信

上文:HMI触屏网关-VISION如何与Node-red通信-CSDN博客 1. 准备工作 1.1. 创建OPC UA服务端 在与OPC UA服务端进行通信时,首先要确认服务端已就绪,本示例使用辅助软件1模拟OPC UA服务端。 1.2. 创建模拟点位 1.3. 测试通信 辅助软件2&…

【C语言从不挂科到高绩点】10-C语言中数组 01

Hello!彦祖们,俺又回来了!!!,继续给大家分享 《C语言从不挂科到高绩点》课程!! 本节课开始重点给大家讲讲C语言中的数组 本套课程将会从0基础讲解C语言核心技术,适合人群: 大学中开…

苹果手机显示“连接iTunes”是什么意思?

在日常使用苹果手机的过程中,有时我们可能会遇到屏幕突然显示“连接iTunes”的提示,这让不少用户感到困惑和不安。今天,我们就来深度解析一下这个提示的含义,并为大家提供详细的解决方案。 一、显示“连接iTunes”的含义 当苹果…

CasaOS系统本地安装Gopeed高速下载软件并实现异地远程访问下载文件

文章目录 前言1. 更新应用中心2.Gopeed安装与配置3. 本地下载测试4. 安装内网穿透工具5. 配置公网地址6. 配置固定公网地址 前言 本文主要介绍如何在轻NAS系统CasaOS小主机中安装支持全平台的高速下载器Gopeed,并结合内网穿透工具配置公网地址实现远程访问本地主机…