高斯泼溅击碎NeRF速度壁垒:实时3D渲染的新范式

GitHub May 2026
⭐ 21857
来源:GitHub归档:May 2026
一个GitHub上的开源仓库,正式终结了神经辐射场(NeRF)在新视角合成领域的主导地位。graphdeco-inria/gaussian-splatting项目引入3D高斯泼溅方法,用显式的各向异性3D高斯椭球体取代NeRF的隐式神经网络,实现了超过30帧每秒的实时渲染。

graphdeco-inria/gaussian-splatting仓库拥有超过21,800颗星,是Inria一篇突破性论文的官方实现,从根本上重新思考了3D场景的表示与渲染方式。传统的NeRF方法虽然能生成惊艳的新视角,但由于需要沿每条射线查询神经网络,渲染单帧需要数分钟到数小时。高斯泼溅颠覆了这一范式,将场景显式表示为一组各向异性的3D高斯椭球体——每个椭球体由位置、协方差矩阵(控制形状和方向)、不透明度以及用于视角相关颜色的球谐系数定义。这些高斯体随后通过一个快速、可微分的基于图块的栅格化器直接投影到图像平面上。

技术深度解析

3D高斯泼溅的核心,是摒弃了定义NeRF家族的隐式神经表示。场景不再由一个多层感知器(MLP)近似的连续体积场表示,而是被离散化为一系列显式的3D高斯基元。每个高斯体由以下参数定义:

- 位置(μ): 椭球体在3D空间中的中心。
- 协方差矩阵(Σ): 一个3x3对称矩阵,定义椭球体的形状、尺度和方向。关键在于,该矩阵被参数化为旋转矩阵(四元数)和缩放向量,确保在优化过程中矩阵保持半正定。
- 不透明度(α): 控制透明度的标量。
- 球谐(SH)系数: 通常最高到3阶(每个颜色通道16个系数),实现视角相关的颜色效果。

渲染管线才是魔法发生的地方。该方法不使用光线步进,而是采用基于图块的可微分栅格化器。图像被划分为16×16像素的图块。对于每个图块,使用快速的GPU排序算法构建一个投影到该图块上的高斯体列表。然后,对于每个像素,可见的高斯体按深度排序,并从前往后进行alpha合成——这与多边形栅格化中的传统alpha混合完全一致。这比NeRF逐射线的MLP评估快数个数量级。

自适应密度控制是防止场景过于稀疏或臃肿的秘密武器。在训练过程中,算法监控每个高斯体位置的梯度。如果梯度幅度超过阈值(表明高斯体位置不佳),则该高斯体会被分裂(如果它较大)成两个更小的高斯体,或者沿梯度方向克隆(如果它较小)。相反,不透明度低于阈值的高斯体会被剪除。这使得表示能够自动为复杂区域(如头发或树叶)分配更多高斯体,而为均匀区域(如墙壁)分配更少高斯体。

基准性能: 原始论文在Mip-NeRF 360数据集上报告了以下结果,该数据集是评估无界360°场景的黄金标准:

| 方法 | PSNR ↑ | SSIM ↑ | LPIPS ↓ | 训练时间 | 渲染帧率 (FPS) |
|---|---|---|---|---|---|
| 3D高斯泼溅 | 27.22 | 0.815 | 0.214 | ~25分钟 | 30-40 |
| Mip-NeRF 360 | 27.03 | 0.792 | 0.237 | ~48小时 | <0.1 |
| Instant NGP | 26.74 | 0.780 | 0.247 | ~15分钟 | ~10 |
| Plenoxels | 26.41 | 0.768 | 0.260 | ~20分钟 | ~15 |

数据要点: 高斯泼溅在实现最高PSNR和SSIM分数的同时,渲染速度比Mip-NeRF 360快300-400倍。训练时间与Instant NGP相当,但渲染速度快3-4倍,使其成为首个将最先进质量与实时性能相结合的方法。

GitHub上已涌现出多个衍生仓库。gaussian-splatting(原始仓库)拥有21.8k颗星。nerfstudio(nerfstudio-project/nerfstudio)迅速将高斯泼溅作为核心模型集成,使其对非专业人士也可用。sugar(sugar-gaussian/sugar)通过添加正则化项鼓励高斯体与表面对齐,将方法扩展到表面重建。gsplat(nerfstudio-project/gsplat)提供了栅格化器的独立、优化CUDA实现,正被许多下游项目使用。

关键参与者与案例研究

论文背后的Inria团队——Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler和George Drettakis——是计算机图形学领域的知名人物。Drettakis领导Inria的GRAPHDECO研究小组,该小组在推动实时渲染边界方面有着悠久历史。他们之前在3D点云渲染和可微分渲染方面的工作直接为这一创新奠定了基础。

案例研究:Luma AI – 以基于NeRF的3D捕捉应用闻名的初创公司Luma AI,已公开承认了这一转变。其最新产品Luma Dream Machine使用高斯泼溅作为实时3D场景编辑和生成功能的底层表示。这是一个战略性的转向:NeRF对于交互式编辑来说太慢,而高斯体则能实现即时反馈。

案例研究:NVIDIA – NVIDIA的研究部门一直在积极探索用于自动驾驶模拟的高斯泼溅。其神经重建团队发布了一个分支,将高斯体与其Omniverse平台集成,实现了包含动态对象的复杂驾驶场景的实时模拟。以60 FPS渲染场景的能力对于感知系统的闭环测试至关重要。

案例研究:Polycam – 流行的3D扫描应用Polycam将高斯泼溅导出作为高级功能。用户可以用手机视频捕捉一个房间,应用将其重建为一个splat文件,可在移动设备上实时查看。这使高质量3D内容创作走向大众。

更多来自 GitHub

Nerfstudio统一NeRF生态:模块化框架大幅降低3D场景重建门槛nerfstudio-project/nerfstudio仓库已迅速成为神经辐射场(NeRF)研发的核心枢纽。凭借超过11500颗GitHub星标,该框架直击一个关键痛点:NeRF实现的碎片化。在Nerfstudio出现之前,从InstanMr. Ranedeer AI Tutor:一个提示词,统治所有个性化学习Mr. Ranedeer AI Tutor 是一个专为 GPT-4 设计的开源提示词,能将模型转化为可定制、可交互的智能导师。由用户 jushbjj 创建,该提示词在单一文本块内定义了人格角色(Mr. Ranedeer)、课程结构以及自适应提示词即代码:GPT-Image2 如何用工程化思维重塑AI艺术生成freestylefly/awesome-gpt-image-2 仓库在GitHub上迅速积累了超过5000颗星,定位为基于GPT的图像生成领域的工业级提示词引擎与模板库。该项目的核心创新在于系统性地逆向工程了370多个成功图像提示词,将其查看来源专题页GitHub 已收录 1718 篇文章

时间归档

May 20261282 篇已发布文章

延伸阅读

Nerfstudio统一NeRF生态:模块化框架大幅降低3D场景重建门槛由nerfstudio-project推出的开源框架Nerfstudio,正以模块化、协作友好的管线重塑神经辐射场开发流程。它简化了多种NeRF变体的训练、可视化与部署,让研究人员和开发者都能轻松上手。Mr. Ranedeer AI Tutor:一个提示词,统治所有个性化学习一个名为 Mr. Ranedeer AI Tutor 的 GPT-4 提示词,正以零代码门槛重塑个性化教育。它凭借精妙的提示工程,模拟出一套完整的教学系统,在 GitHub 上狂揽近 3 万星。AINews 深入拆解其机制、局限与市场冲击。提示词即代码:GPT-Image2 如何用工程化思维重塑AI艺术生成一个名为 freestylefly/awesome-gpt-image-2 的开源项目,正将提示词工程变成一门可编码、可模板化的严谨学科。凭借5012颗GitHub星标和370多个逆向工程案例,它承诺让高质量AI图像生成走向大众——但这是否MOSS-TTS-Nano:0.1B参数模型,让语音AI跑进每一颗CPU一款名为MOSS-TTS-Nano的全新开源模型,仅凭0.1B参数即可实现实时多语言语音生成,体积小到无需GPU,在标准CPU上就能流畅运行。这一突破大幅降低了边缘语音应用的门槛,从嵌入式助手到本地网页演示,皆可轻松驾驭。

常见问题

GitHub 热点“Gaussian Splatting Shatters NeRF's Speed Barrier: Real-Time 3D Rendering's New Paradigm”主要讲了什么?

The graphdeco-inria/gaussian-splatting repository, with over 21,800 stars, represents the official implementation of a breakthrough paper from Inria that fundamentally rethinks how…

这个 GitHub 项目在“how to install and run 3D Gaussian Splatting on Windows”上为什么会引发关注?

At its core, 3D Gaussian Splatting abandons the implicit neural representation that defined the NeRF family. Instead of a continuous volumetric field approximated by a multi-layer perceptron (MLP), the scene is discretiz…

从“3D Gaussian Splatting vs NeRF for VR rendering”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 21857,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。