Normal-GS: 3D Gaussian Splatting with Normal-Involved Rendering 论文解读

看这篇论文之前可以看一下Ref-NeRF:https://arxiv.org/pdf/2112.03907

目录

​编辑

一、概述

二、相关工作

1、辐射场

2、3DGS在几何和外观上的应用

三、Normal-GS

1、3DGS

2、引入法线的策略

3、训练过程

4、损失函数

四、实验

1、渲染质量的量化对比实验

2、Synthetic-NeRF数据集上的法线一致性对比和可视化

3、不同模块的消融实验

4、可视化  


一、概述

        该论文提出了一种法线集成到3DGS模型Normal-GS,用于高质量的渲染和准确的法线估计,同时保持实时性能。核心是使用基于物理的渲染方程来建模法向量和入射光照之间的相互作用。

(1)我们提出了一个新的方法,基于3DGS外观建模上的法线信息,以平衡外观和几何建模之间的良好平衡。

(2)直接考虑法向量和入射光照之间的相互作用,从物理渲染方程的角度建模,重新参数化了表面颜色,使用法向量和设计的集成定向照明向量(IDIV)的乘积来表示。

(3)采用基于锚点的3DGS来隐式编码局部共享的IDIV,以节省内存使用并简化优化。

(4)利用优化的法向量和集成定向编码(IDE)来准确建模镜面效果,进一步提高渲染质量和法向量精度。

二、相关工作

1、辐射场

        辐射场的发展,从NeRF到3DGS,NeRF发展包括在复杂光照,不同材料条件上增强渲染质量,多视角到稀疏视角,有无相机姿态,大场景的可扩展性等多领域。然而隐式表示的NeRF依赖于多层感知器来计算三维位置和射线方向的密度和辐射,需要大量计算,而导致效率难以满足实用性。

        3DGS通过引入三维高斯函数,采用快速光栅化来显式建模三维场景,实现有竞争性的实时渲染。并且在这一发展中诞生了3D生成,物理模拟,稀疏视图重建(用与实时渲染)。

        Scaffold-GS利用特征锚定,值剪枝,量化技术,挖掘空间关系等创新来减少3DGS的内存占用,从而提高存储效率和保真度呈现。

2、3DGS在几何和外观上的应用

        3DGS几何和外观方面的应用有表面重建和逆渲染两部分。几何和外观是3D重建的中心,3DGS的离散性和显式性质会造成有噪声的底层几何性质。

        表面重建部分:SuGaR考虑从3DGS中进行了细化网格提取的初步尝试,并在对其高斯核和实际表面轮廓对齐中应用正则化。另外为了更好地定义几何性质,考虑将3DGS转化到2DGS和GS Surfels。这种方法会将正则化用于深度和法线渲染。虽然上面的方法改进了表面重建,因为缺少几何和外观之间清晰的关系,而牺牲了渲染保真度。

        逆渲染部分:目的是将场景元素分离为材质、照明和几何。但这种方式挑战了传统渲染方程比如利用蒙特卡洛积分,基于点的光线追踪,baking方法来处理复杂的积分问题。也经常依赖于简化模型Disney BRDF和如split-sum的近似方法。但这类简化模型都存在较低渲染质量,较低的PSNR,而无法匹配3DGS。

        近期的Gsdf,Deferredgs考虑引入对于法线的渲染,Gsdf考虑从一个额外的隐式表面场中蒸馏几何信息来实现延迟渲染,Deferredgs通过一个双分支结构同时增强几何精度和渲染质量,使用3DGS来进行外观渲染,用隐式神经场来进行集合集成。但这两种方法都添加额外的网络受训练速度阻碍。

        Disney BRDF:(感觉比较好玩,搜了一下)Disney BRDF是一种基于物理的着色模型,由Brent Burley和华特迪士尼动画工作室开发。它旨在提供更逼真的材质外观,并可以在实时渲染中使用。Disney BRDF模型包括漫反射、镜面反射和其他复杂的光学效果,可以更好地模拟真实世界材质的外观。与之前的着色模型相比,Disney BRDF提供了更加物理准确的光照计算,从而产生更逼真的渲染效果。这种基于物理的着色模型在游戏和电影行业中广泛使用,成为了业界的标准之一。

三、Normal-GS

1、3DGS

        对于3DGS的空间位置来说,高斯核的定义由高斯核中心\mu和协方差矩阵\Sigma构成。

                ​​​​​​​        ​​​​​​​        G(p)=exp(-\frac{1}{2}(p-\mu)^T\Sigma ^{-1}(p-\mu)) 

        协方差\Sigma由旋转矩阵R和缩放矩阵构成S

                ​​​​​​​        ​​​​​​​        \Sigma=RSS^TR^T

        对于每一个像素的3DGS的颜色信息受到颜色值c和不透明度\alpha影响。其中高斯分布将被快速光栅化到图像平面,形成二维高斯溅射G'(x)。对于颜色和不透明度的定义如下:

                                C(x)=\sum_{i \in N}c_i\sigma_i \prod _{j=1}^{i-1}(1-\sigma_j), \quad \sigma_i=\alpha_iG_i'(x)

        其中,N表示覆盖当前像素的二维高斯溅射数量,采用启发式密集化和剪枝策略来解决潜在的重建不足和过度重建,确保渲染图像的多视图一致性。

        对于3D高斯球谐函数c_i,首先(l,m)代表球谐函数SH的度和阶数,相应的系数定义为Y_l^m,k_l^m\omega_{view}表示观看方向,3DGS使用最大度为3,高斯球谐函数定义为:

                ​​​​​​​        ​​​​​​​        c(\omega_{view})=\sum_{l=0}^3\sum_{m=-l}^lk_l^mY_l^m(\omega_{view})

        对于标准的3DGS中颜色信息独立于表面法线,优化表面颜色时,表面发现不会受到反向传播过程收到梯度信息,而这种独立性,导致破坏了同时提供图像质量和法线估计的能力。

2、引入法线的策略

基于物理的渲染

        表面法线:Surfel normal,表面法线可以准确描述物体的几何形状,在三维重建中可以通过估计表面法线来更好地捕捉物体表面的细节信息,提高重建精度。另外对于在光照计算有关键作用,通过考虑表面法线和光线的关系,对于实现逼真的渲染效果非常重要。

        引入法线的目的:通过在3DGS中引入表面法线,使得渲染质量和几何精度得到更好的平衡,另外通过建模法线与入射光线的相互作用,可以更加准确地模拟漫反射和镜面反射效果,提高渲染质量。

        兰伯特定律:反射光的强度与表面法线和光线之间的角度余弦成比例。

        在该论文中,考虑基于物理的表面渲染原理(兰伯特定律),将表面点的出辐射L_{out}建模为入射光与法线的函数。对于每一个三维点,\omega_o=-\omega_{view},颜色函数定义为:

        ​​​​​​​        c(\omega_{view})=L_{out}(\omega_o)=L_E(\omega_o)+\int _{\Omega+}L_{in}(\omega_i)(\omega_i \cdot n)f_r(\omega_i,\omega_o)d\omega_i

        其中L_E是向发光辐射亮度,表面自身发出的辐射亮度(不太理解,说是会通过输入参数传递给着色器,来满足渲染过程中考虑物体自身发光特性的参数)。

        积分项表示上半球\Omega_+方向入射的辐射亮度经过f_r(\cdot),即BRDF函数后从入射光线反射后得到的信息。

        (\omega_i \cdot n)表示入射光与表面法线n的点积,表示入射光线与表面法线之间的夹角。这个几何衰减因子会对入射光在表面的反射起到权重贡献作用,当入射光与表面法线垂直时,(\omega_i \cdot n)该值为0,表示入射光不会对表面法线产生贡献,当入射光线与表面法线平行时,(\omega_i \cdot n)该值为1,表示入射光完全贡献到表面反射。

        发射辐射L_E: 指物体自身发出的辐射,即物体表面的自发光。

        入射辐射L_{in}:指从其他方向照射到物体表面的辐射,即物体表面接收到的外部光照。

        入射光方向\omega_i,反射光方向\omega_o

基于朗伯物体合并方向性的照明分量

        朗伯物体:朗伯物体是一种理想化的表面材质模型,其特点是反射光线与入射角无关,只与表面法线有关。

        首先考虑理想情况下只包含朗伯物体漫反射渲染方程

        对于这一部分,我们省略了发射辐射L_E,并且简化了入射辐射部分的BRDF函数为一个反射率k_D

        此时我们定义该漫反射渲染方程为(略复杂版):

        ​​​​​​​        L_D=\int_{\Omega^+} L_{in}(\omega_i)\cdot k_D \cdot (\omega_i \cdot n)d \omega_i=k_D \int_{\Omega^+} L_{in}(\omega_i)(\omega_i \cdot n)d \omega_i

        之后,我们考虑不引入复杂的积分,将法向量n提出来,L_D就变成了法向量和一个积分项点积的形式,我们定义后面的积分项为“集成定向照明向量(IDIV)”,它捕捉了入射光照的方向信息。通过这种方式,法向量n被显式引入到渲染过程中,使得反向传播中,颜色梯度可以传递给法向量,增强了几何信息的优化。

        我们定义该漫反射渲染方程为(精简化):

                        L_D=k_D \cdot n \cdot [\int_{\Omega^+} L_{in}(\omega_i)\omega_i d \omega_i]

        合并方向性的照明分量IDIV(integrated directional illumination vector)定义为:

                        l=\int_{\Omega^+} L_{in}(\omega_i)\omega_i d \omega_i

基于非朗伯物体的镜面反射颜色分量

        首先引入镜面反射矢量计算公式,假设材料是一个理想的镜面,所以反射光与法线的点积应该是1,所以满足下图的情况。n \cdot \omega_o=1

        但是由于现实情况下,镜面反射的BRDF函数复杂,并不完全遵循这种规律,但是反射方向的计算仍然满足上面式子:

        ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​                ​​​​​​​\omega_r=2(\omega_o \cdot n)n-\omega_o 

        从Ref-NeRF中引入集成方向编码(Integrated Directional Encoding,IDE),用于建模镜面反射的颜色,传统的NeRF中处理光泽表面会存在伪影,而IDE考虑从反射向量作为输入,而不是一般的从视角向量作为输入,更好地插值反射光照,得到更为平滑的结果。

        IDE的编码内部也是一组球谐函数,只不过他不是在高斯分布,而是在vMF分布中。

        vMF分布(von Mises-Fisher):建模反射向量分布的概率分布,分布中心为反射向量,分布的集中度参数\kappa由空间MLP输出,作为表面粗糙度。粗糙度越大,\kappa越小,分布越宽。

        IDE编码定义为:

                                IDE(\omega_r,\kappa)=\left \{ \mathbb{E}_{\omega\sim vMF(\omega_r,\kappa)}[Y_l^m(\omega)]:(l,m) \in \mathcal{M}_L \right \}

        其中,\mathcal{M}_L=\left \{ (l,m):l=1,...,2^L,m=0,...,l \right \}球谐函数的维数和阶。

        vMF分布可以定义为:

        ​​​​​​​        ​​​​​​​        ​​​​​​​        \mathbb{E}_{\omega\sim vMF(\omega_r,\kappa)}[Y_l^m(\omega)]=A_l(\kappa)Y_l^m(\omega_r)

        其中,A_l(\kappa)\approx exp(-\frac{l(l+1)}{2 \kappa}),这是一个近似解。

        镜面反射的分量通过将IDE编码向量\phi_{IDE}(\omega_r),法线n,视角向量f_v通过一个\theta函数(该函数信息没有介绍,希望appendix写一下)得到。

        镜面反射分量定义:

                ​​​​​​​        ​​​​​​​        L_S=\theta(\phi_{IDE},n,f_v)

总结颜色信息

        在论文中,使用基于朗伯物体合并方向性的照明分量基于非朗伯物体的镜面反射颜色分量的加和作为替代原有3DGS中3D高斯球谐函数的新的颜色信息。

        另外,此时的颜色信息可以经过法向量传播梯度信息,因为后面介绍到损失函数中法向量只影响颜色信息这一部分,且法向量只在L_D项,那么一定有反向传播过程中下式成立:

                                \frac{dL}{dn}=\frac{dL}{dc} \cdot \frac{dc}{dn} =\frac{dL}{dc} \cdot (k_D \cdot L)

3、训练过程

        训练过程分为三部分:初始化三维高斯分布,预测高斯核的法线和深度,通过深度法线损失来正则化模型。

        初始化三维高斯分布:首先输入图像利用Structure-from-Motion来生成稀疏点云,并通过以训练好的3DGS来初始化三维高斯分布。

        预测高斯核的法线和深度:利用anchor-based的GS方法Scaffold-GS和全局MLP来预测高斯核的法线(利用SDF的梯度作为曲面法线)和深度信息,之后根据3DGS快速光栅化来得到深度图像和法线图像\mathcal{N}

        通过深度-法线损失来正则化模型:根据深度图的梯度\nabla_{(u,v)}D和图像空间梯度计算交叉积得到\mathcal{N}_D,深度-法线正则化损失定义为:L_N=1-\mathcal{N}_D \cdot \mathcal{N}

4、损失函数

        损失函数由三部分组成,分别是训练过程的三步。

        第一阶段:3DGS的光度损失

        第二阶段:Scaffold-GS的体积正则化损失

        第三阶段:Normal-GS的深度-法线正则化损失

四、实验

1、渲染质量的量化对比实验

        证明了Normal-GS在几何和外观两个方面的平衡性,但是不一定是SOTA。

2、Synthetic-NeRF数据集上的法线一致性对比和可视化

        证明该方法确实在法线方面取得了效果。

3、不同模块的消融实验

        证明流程中的IDIV,L_S的有效性。

4、可视化  

参考文献:https://arxiv.org/abs/2410.20593

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/10456.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux探索学习】第十弹——Linux工具篇(五):详解Linux 中 Git 工具的使用与相关知识点

Linux学习笔记:https://blog.csdn.net/2301_80220607/category_12805278.html?spm1001.2014.3001.5482 前言: Git 是一个分布式版本控制系统,广泛应用于软件开发中。它能够有效地管理项目的源代码,支持多种工作流,帮…

【系统文档】系统安全保障措施,安全运营保障,系统应急预案,系统验收相关资料(word原件)

一、身份鉴别 二、访问控制 三、通信完整性、保密性 四、抗抵赖 五、数据完整性 六、数据保密性 七、应用安全支撑系统设计 软件资料获取及全资料学习获取:本文末个人名片或进主页。

Windows Server修改 SID 操作说明

操作场景 Windows操作系统对计算机和用户的识别是通过安全标识符(SID)进行区分。由于基于同一镜像生产的云服务器实例 SID 相同,会引起无法入域的问题。如果您需要搭建 Windows 域环境,则需要通过修改 SID 以达到入域的目的。 本…

Java项目实战II基于Spring Boot的疗养院管理系统设计与实现(开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、文档参考 五、核心代码 六、源码获取 全栈码农以及毕业设计实战开发,CSDN平台Java领域新星创作者,专注于大学生项目实战开发、讲解和毕业答疑辅导。获取源码联系方式请查看文末 一、前言 随着人口老…

Canny边缘检测中Hysteresis Thresholding(滞后阈值)名字的由来

Hysteresis Thresholding直译是滞后阈值。注意区分hysteresis、heuristic、hypothesis。 Hysteresis:在物理学中指滞后现象。 Canny边缘检测中滞后阈值这个名字来源于物理学中的滞后现象。通过设置两个不同的阈值来决定哪些像素属于边缘。这两个阈值分别是高阈值&…

[ Linux 命令基础 6 ] Linux 命令详解-权限和用户管理命令

🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 _PowerShell ,很高兴认识大家~ ✨主攻领域:【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 🎉点赞➕评论➕收藏 养成习…

# ubuntu创建新用户和它的家目录

ubuntu创建新用户和它的家目录 一、使用 useradd命令创建新用户和它的家目录: 1、命令如下: #sudo useradd -r -m -s /bin/bash userName #如:sudo useradd -r -m -s /bin/bash zhangsan2、命令参数解释 -r : 建立系统账号。 -m : 自动建…

网线类别线芯含义和传输距离以及水晶头制作标准

网线八芯每根的含义: 网线的八根线芯,也被称为RJ45网线中的8芯,网线采用8根线芯,这八根线芯各自承担着特定的功能。这8根线芯被分为4对,每对以特定的方式绞合在一起,8芯网线主要是为了减少电磁信号的相互干…

HTB:Sightless[WriteUP]

目录 连接至HTB服务器并启动靶机 使用nmap对靶机TCP端口进行开放扫描 继续使用nmap对靶机开放的TCP端口进行脚本、服务扫描 首先尝试对靶机FTP服务进行匿名登录 使用curl访问靶机80端口 使用浏览器可以直接访问该域名 使用浏览器直接访问该子域 Getshell 横向移动 查…

Golang | Leetcode Golang题解之第554题砖墙

题目: 题解: func leastBricks(wall [][]int) int {cnt : map[int]int{}for _, widths : range wall {sum : 0for _, width : range widths[:len(widths)-1] {sum widthcnt[sum]}}maxCnt : 0for _, c : range cnt {if c > maxCnt {maxCnt c}}retur…

斯坦福泡茶机器人DexCap源码解析:涵盖收集数据、处理数据、模型训练三大阶段

前言 因为我司「七月在线」关于dexcap的复现/优化接近尾声了,故准备把dexcap的源码也分析下。​下周则分析下iDP3的源码——为队伍「iDP3人形的复现/优化」助力 最开始,dexcap的源码分析属于此文《DexCap——斯坦福李飞飞团队泡茶机器人:带…

高中数学:概率-随机实验、样本空间、随机事件

文章目录 一、随机实验二、样本空间三、随机事件例题 四、事件运算 一、随机实验 二、样本空间 三、随机事件 例如 样本空间 Ω { a , b , c , d , e , f } 则,事件 A { a , b , c } ,是一个随机事件 事件 B { d } 是一个基本事件 样本空间Ω\{a,b,c…

w~大模型~合集21

我自己的原文哦~ https://blog.51cto.com/whaosoft/12459590 #大模型~微调~用带反馈的自训练 面对当前微调大模型主要依赖人类生成数据的普遍做法,谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。大模型微调非得依赖人类数据吗?用带反馈的自训…

利用 Vue.js 开发动态组件的实战指南

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 Vue.js 是现代 Web 开发中非常流行的框架,以其渐进式架构和组件化设计受到广泛欢迎。组件化开发是 Vue.js 的核心优势…

Jmeter中的配置原件(一)

配置原件 1--CSV Data Set Config 用途 参数化测试:从CSV文件中读取数据,为每个请求提供不同的参数值。数据驱动测试:使用外部数据文件来驱动测试,使测试更加灵活和可扩展。 配置步骤 准备CSV文件 创建一个CSV文件&#xff0c…

MCU的OTA升级(未完-持续更新)

1.术语 ISP : In-System Programming 在系统编程,是一种通过MCU(微控制器单元)上的内置引导程序(BootLoader)来实现对芯片内部存储器(如Flash)进行编程的技术。 华大目前对应的ISP IAP&…

让redis一直开启服务/自动启动

文章目录 你的redis是怎么打开的黑窗不能关?必须要自动启动吗?再说说mysql 本文的所有指令都建议在管理员权限下打开cmd控制台 推荐的以管理员身份打开控制台的方式 Win R 打开运行 输入cmdShift Ctrl Enter 你的redis是怎么打开的 安装过redis的朋友都知道, redis的安…

从认识 VNode VDOM 到实现 mini-vue

前言 现有框架几乎都引入了虚拟 DOM 来对真实 DOM 进行抽象,也就是现在大家所熟知的 VNode 和 VDOM,那么为什么需要引入虚拟 DOM 呢?下面就一起来了解下吧!!! VNode & VDOM VNode 和 VDOM 是什么&am…

vue项目实战

1.项目文件夹添加(结构如下) 2.页面构建 安装路由 npm install react-router-dom 3.页面基本模板 router文件夹下index.js的模板 // 引入组件 import Login from "../views/login"; // 注册路由数组 const routes [{// 首页默认是/path: …

SD-WAN跨境加速专线:打造无缝、高效的全球社交媒体营销网络

在数字化时代,电子商务与社交媒体的融合已成为不可逆转的趋势。亚马逊,作为全球领先的电子商务平台,近期与Facebook、Instagram、Snapchat、Pinterest和TikTok等社交媒体巨头携手,推出了一项革命性的无缝购物体验。这一创新举措不…