5.将扩散模型应用于具有特殊结构的数据

        虽然扩散模型在图像和音频等数据应用领域中取得了巨大的成功,但他们不一定能无缝地转移到其他模态上。在许多重要的领域,数据有特殊的结构。为了让扩散模型有效运作,必须考虑并处理这些特殊结构。比如,经典扩散模型所依赖的分数的函数仅在连续装据域才有定义,而对于离散型数据没有定义,或者数据位于低维流形式上时,就会出现问题。为了应对这些挑战,扩散模型必须以各种方式进行调整。
5.1 离散数据
        大多数扩散模型都是针对连续数据域的,因为DDPM中使用的高斯噪动连续性数据,并不适合作为噪声加入离散数据;而SGM和ScoreSDE所要求的分函数也只在连续数据域中定义。分数函数的定义是数据概率密度函数的对数的导数,而离散数据则无法定义分数函数,因为离散数据没有概率密度函数。为了克服这一困难,一些人设计了可以生成离散数据的扩散模型。VQ-Difusion先用VQ-VAE将image 的特征空间离散化成 token,后将前向过程中加入的高斯噪声替换为在离散数据空间上的随机游走,或一个随机蔽(mask)操作。每个image 的 token 有_a{t}+\beta _{t}的概率保持之前的值,有K\beta _{t}的概率从K个类别中进行重采样。利用前向转移核的马尔可夫性可以类似地解析计算出q(xt-1|x0,_x{t})。由于离散数据不能定义分数函数,VQ-Difusion 使用神经网络来直接预测原始样本对,然后通过匹配q(xt-1|x0,xt)和p\Theta(xt-1|x0\Lambda,xt)进行训练。更多转移矩阵的选择可以参考D3PM,包括一致的转移核、具有吸收状态转移核、离散化高斯转移核或基于嵌入距离的转移核。
        Campbell 等人提出了第一个离散扩散模型的连续时间框架,在连续时间的视角下,前向马尔可夫链的轨迹由每个时刻t的转移速率矩阵Rt(x,y)决定。简单来说,Rt是马尔可夫链转移概率关于时间的微分,给定了Rt就决定了前向马尔可夫链的转移矩阵。类似于ScoreSDE,Campbel 等人证明了存在逆向转移速率矩阵,由其导出的逆向连续时间马尔可夫链能够完全恢复原始数据分布。类似于分数函数在逆向SDE的作用,在此视角下唯一需要学习的就是逆向转移速率矩阵。Campbel等人还推导出了学习逆向转移速率矩阵和生成数据对数似然的关系式,并以此作为目标函数来学习逆向转移速率矩阵,从而提高模型的似然值。Campbel等人还提出了适用于离散数据的高效采样器,同时提供了关于样本分布和真实数据分布之间误差的理论分析。
        从随机微分方程的视角看,Liu等人在“Learning Diffusion Bridges onConstrained Domains”中提出了可以学习分布于特定区域的扩散模型。根据随机分析领域中的一个重要定理--“Doob's h-transform”,只需适当调整 SDE的漂移项,就可以令SDE的解以“概率一”存在特定区域中。另外,还可以把这个区域设置为离散空间,这样经过调整的扩散模型就可以直接生成存在于该空间的离散变量了。所以扩散模型只需学习SDE中的漂移系数即可,Liu等人还设计了一种漂移系数的参数化方法,并基于E-M 算法设计了一种优化方法,并利用Girsanov定理将损失函数写为Lz损失。
5.2 具有不变性结构的数据
        很多领域的数据具有不变性的结构。例如,图(Graph)具有置换不变性,即交换对图节点的标记顺序并不改变图本身的结构;而点云是平移和旋转不变的,因为平移和旋转并不改变点云中点的相对位置。在扩散模型中,这些不变性常常被忽略,这可能导致次优的性能。为了解决这个问题,一些人给扩散模型增强了处理数据不变性的能力。Niu 等人率先提出了用扩散模型生成具有置换不变性的图的方案,这种方法适用于无向无权图,即生成无向无权图的邻接矩阵。该模型的前向过程向邻接矩阵的上三角矩阵,加入独立的高斯噪声来保证加噪矩阵也是对称的,然后使用神经网络来拟合加嗳矩阵的分数的数(有良定义的)。类似地,采样过程也是在经典扩散模型的基础上将其改为对称的形式。Niu等人证明了如果生成过程中使用的分数模型是置换不变的,那么生成的样本也是置换不变的,并采用了称为EDP-GNN的置换等变图神经网络来估计分数函数,实验结果表明,使用EDP-GNN来参数化噪高得分模型可以生成置换不变的无向无权图。
        GDss通过提出一个连续时间的图扩散过程,进一步拓展、改进了上述方法为了同时生成图的邻接矩阵和节点特征,GDSS通过一个随机微分方程系统对节点性集(X)和邻接矩阵(A)的联合分布进行同时建模。在前向过程中,原始数据(X,A)被一个随机微分方程系统联合扰动,生成过程使用逆向的随机微分方程系统来恢复数据结构。生成过程中需要估计联合布(Xt,At)的分数函数。与Score SDE类似,使用线性的漂移系数且扩散系数与数据无关。在扩散过程中(Xt,At)是互相关联的,GDSS使用偏分数函数可以对这种关联性进行建模,使其可以表达整个图的扩散过程。另外,有两种图神经网络来估计偏分数函数,其中使用信息传递操作和注意力机制来保证置换不变性。
        同样,shi等人和xu等人使扩散模型能够产生对平移和旋转不变的分子构象。例如,xu等人说明,如果马尔可夫链以一个不变先验作为初分布且转移核等变的,那么其产生的边际分布也具有置换不变性。这可以用来在分子构象生成中证适当的数据不变性。只要我们设计的先验分布和转移核都有相应的不变性,那么我们就可以建立一个扩散模型来生成具有平移和旋转不变的分子构象。Xu等人选择了一种平移和旋转不变的噪声分布,并设计了一种具有相同不变性的信息传递神经网络。其中eij表示节点特征,dij表示节点距离,N(i)表示节点i的邻居节点,在这里包括距离小于阈值\tau的所有节点。Фm、Фh、Фx是神经网络。在每层神经网络中,先计算相邻节点之间的信息传递mij,然后再根据mij更新节点特征hl+1和位置特征xl+1。经过L层网络后,使用x^{l}为最后输出,预测加入的噪声。该网络的不变性可以通对整代法证明。如果h^{l}是平移、旋转不变的且x^{l}是等变的,那么{_m{ij}}^{l+1}就是平移、旋转不变的,进一步可推出h^{l+1}是不变的、x^{l+1}是等变的。那么最终的预测结果x^{l}就是平移,旋转等变的,保证了逆向过程转移核也是等变的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1558491.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

「JVS更新日志」低代码、智能BI、逻辑引擎10.9功能更新说明

项目介绍 JVS是企业级数字化服务构建的基础脚手架,主要解决企业信息化项目交付难、实施效率低、开发成本高的问题,采用微服务配置化的方式,提供了 低代码数据分析物联网的核心能力产品,并构建了协同办公、企业常用的管理工具等&am…

SDUT数据结构与算法第二次机测

目录 7-1 括号匹配 7-2 后缀式求值 7-3 表达式转换 7-4 【模板】KMP字符串匹配 比较详细注释和图解请看KMP——字符串匹配-CSDN博客,(点击链接可跳转)一看就会 7-5 约瑟夫环(押题,重要) 7-6 单调栈&a…

迪士尼数据泄露事件:全面审视数据安全策略与未来防护方向

迪士尼数据泄露事件概述 一、 事件背景以及影响 在全球数字化转型加速的浪潮中,数据安全已成为企业运营不可忽视的基石。 华特迪士尼公司,作为全球知名的娱乐传媒巨头,其数据泄露事件无疑为业界敲响了警钟。此次事件不仅揭示了数据保护的严…

Pymysql cur.fetchall() 返回 None

大家在pymysql 的 cur.fetchall() 函数通常用于获取执行 SQL 查询后的所有结果。该函数返回一个包含查询结果的元组列表。如果 cur.fetchall() 返回 None,可能是由于以下多种问题导致的。 1、问题背景 在使用 Pymysql 库连接到 MySQL 数据库时,遇到这样…

YOLOv5改进——普通卷积和C3模块更换为GhostConvV2卷积和C3GhostV2模块

目录 一、GhostNetV2核心代码 二、修改common.py 三、修改yolo.py 三、建立yaml文件 四、训练 一、GhostNetV2核心代码 在models文件夹下新建modules文件夹,在modules文件夹下新建一个py文件。这里为GhostV2.py。复制以下代码到文件里面。 # TODO: ghostnetv…

好用的免费录屏软件推荐,让软件操作教程制作不再困难

录屏软件就像是我们做教程或者玩游戏时的“小助手”,它能帮我们把屏幕上的东西都记录下来,让视频看起来更高大上。今天我就给你推荐三款免费的好货,用它们做教程,保证让你轻松又开心。 1. 福昕录屏大师 虫洞 https://www.foxits…

【读书笔记·VLSI电路设计方法解密】问题4:今天的设计环境中使用的主要工艺技术是什么

主流的工艺技术是互补金属氧化物半导体(CMOS)技术。其他技术还包括双极性、双极CMOS(biCMOS)、绝缘体上硅(SOI)和砷化镓(GaAs)。 在CMOS技术中,"互补对称"指的…

SD入门教程一:Stable Diffusion 基础(技术篇)

前言 在开篇的时候就大致讲了SD和VAE,那么今天我们具象化地再来讲讲Stable Diffusion(稳定扩散)。 严格说来它是一个由几个组件(模型)构成的系统,而非单独的一个模型。我以最常见的文生图为例,…

大型保险公司进行营销活动时,如何与外部客户实现文件安全外发?

大型保险公司为了吸引新客户、维护老客户、提升品牌形象以及推广特定的保险产品,会定期向外部客户或潜在客户发送营销文件。在客户签单后,保险公司会将客户相关的签单个人文件发送给客户。因此,大型保险公司内部存在较为频繁且重要的文件安全…

安装DNS

在 CentOS 7 上安装并配置 BIND 以实现 DNS 的正向和反向解析可以按照以下步骤进行: 安装 BIND 打开终端并运行以下命令来安装 BIND 及其工具: yum install bind bind-utils -y配置 BIND 编辑主配置文件: 使用文本编辑器打开 BIND 的主配…

电商价格监测的创新之路

在当今数字化高速发展的时代,电商如汹涌的浪潮席卷了商业的每一个角落。品牌们在这片广阔的电商海洋中奋力前行,而价格监测则成为了他们手中至关重要的罗盘。 力维网络以其专业的价格监测服务,为品牌在电商之海的航行点亮了一盏明灯。然而&a…

多节点网络流量监控与网络性能优化的利器——轻松实现高效管理

目录 为什么网络性能监控如此重要? 多节点网络流量监控如何优化网络性能? 实例:AnaTraf如何帮助企业解决网络故障 了解更多 随着企业网络规模的不断扩大,维护网络性能的复杂性日益增加。如何实时监控网络流量、快速排查网络故…

网安加·百家讲坛 | 潘继平:AI赋能DevOps平台:全面提升代码安全性

作者简介:潘继平,中国软协项目管理专委会专家,深圳市软件行业协会特聘专家。华为土耳其研究所外聘高级项目顾问,负责华为云应用生态圈产品线研发管理。曾为华为全球技术服务中心、华为制造IT以及华为流程IT解决方案提供等多个部门…

(二)、CT系统硬件构成

简单来说分为以下几个步骤来描述整个CT系统的运行流程: X射线管和探测器环绕被测物体,准直器进行高度准直X射线。X射线穿过被测物料时发生衰减,其中有两个探测器,一个是参考探测器记录和测量来自X射线管的辐射强度,另…

【C语言从不挂科到高绩点】28-数组综合运用

Hello!彦祖们,俺又回来了!!!,继续给大家分享 《C语言从不挂科到高绩点》课程!! 数组是我们在C语言学习过程中比较重要的一个知识点,也是在今后的学习与开发过程中经常会用到的技能,…

明达IO:赋能工业机器人新未来

摘要: 明达技术以其卓越的分布式IO(MR30)与一体式IO(MR20)产品,为工业机器人行业提供了完美的信号交互解决方案。在集群式机器人应用场景中,MR30分布式IO以其稳定性能和自由热插拔功能&#xf…

“跨时空拥抱”风靡TikTok,这款AI视频工具借势变现20万美金,你也来看看吧!

用AI生成跨时空拥抱最近悄悄在海外翻红,还带火了一款AI视频产品。 8月28日,TikTok博主“iammskira”发布了一条配文为“用AI实现了拥抱我的妈妈,因为她已经不在人世了”的短视频教程,在TikTok上走红。 视频中,AI不仅…

Java毕业设计:Java社区物品置换网站系统毕业设计源代码作品和开题报告

博主介绍:黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程&#xff…

xss-labs靶场第五关测试报告

目录 一、测试环境 1、系统环境 2、使用工具/软件 二、测试目的 三、操作过程 1、注入点寻找 2、使用hackbar进行payload测试 3、绕过结果 四、源代码分析 五、结论 一、测试环境 1、系统环境 渗透机:本机(127.0.0.1) 靶 机:本机(127.0.0.…

如何下载和安装CLion,图文详解

一、下载 登录JetBrains官网,下载最新版本的Clion,Clion目前没有社区版,都是专业版。 二、安装 1、启动Clion安装程序,下一步。 2、修改安装目录,下一步。 3、创建桌面快捷方式,更新PATH变量&#xff0…