news 2026/4/29 2:21:31

刚刚,李飞飞世界模型新成果发布

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
刚刚,李飞飞世界模型新成果发布

李飞飞空间智能独角兽World Labs再度传来新消息——开源3D高斯溅射渲染引擎Spark 2.0。

距离新模型Marble 1.1&1.1-Plus发布不到一个周,李飞飞空间智能独角兽World Labs再度传来新消息——

开源3D高斯溅射渲染引擎Spark 2.0

我们为3D高斯溅射(3D Gaussian Splatting)打造了可流式传输的LoD系统,重新定义了web 3D渲染的可能性。

Spark 2.0基于Three.js构建,用户可以通过WebGL2,将包含1亿+splats(3D高斯点/泼溅点)的超大规模3D世界,流式传输到任意设备上,包括桌面、iOS、Android、VR。

例如下面的Coit Tower场景由超4000万个splats构成,却能在浏览器中实现完全交互:

在官方Blog中还有更多3D场景可以点开体验:

传统3D建模通过带纹理映射的三角形,一块一块拼出物体的表面。

3D高斯溅射(3D Gaussian Splatting)则采用数百万个半透明椭球体(也就是splats),通过这些椭球体的色彩融合,呈现出超写实的细节效果:

什么是splat?

每一个splat都由位置、XYZ三轴缩放、旋转角度、颜色、不透明度这5个属性定义。

将splat渲染到屏幕上最常见的方法是画家算法(painter’s algorithm)。

就像画画时先画远处的、再画近处的,把几百万个小椭球按从远到近的顺序排好,一层一层叠上去,实时算出最终画面。

这就像是数字版点彩画,只不过用的是3D高斯分布轮廓来作画。

对于这项成果,李飞飞第一时间给到了评论:

Spark 2.0现已可在任意设备上流式渲染超1亿splats!能为基于网页的3D高斯溅射渲染开源生态贡献力量,我深感自豪!

Spark系统设计

Spark前身是World Labs开发的一款内部3D高斯溅射渲染引擎。

彼时市面上的web渲染引擎均存在明显短板,例如,部分引擎一次只能正确渲染一个3D高斯溅射对象;部分引擎无法不能动态动画化splats;还有些引擎基于小众3D框架开发,或采用尚未普及的WebGPU技术,导致设备兼容性受限。

这款内部渲染引擎曾亮相于团队2024年发布的大型世界模型研究预览,以及早期场景展示项目Lofi Worlds。

为了让更多开发者都能打造交互式3D高斯溅射web体验,团队整合技术积累,在去年开源了一款通用型3D高斯溅射渲染引擎。

当时名字还叫做Forge,量子位当时也有介绍,后改名Spark。

Spark基于主流THREE.js框架构建而成。同时,团队将技术底座定为WebGL2,这是目前唯一能在几乎所有设备上稳定运行的3D web API。

团队表示,Spark的研发过程始终与Marble同步推进。

官方Blog中详细介绍了Spark的技术细节。

全新Spark 2.0实现了超大规模3D高斯溅射场景在网页端的预处理、流式加载与跨设备渲染。

关键在于融合了三项技术:

  • 细节层次技术(LoD,Level-of-Detail):预先生成不同分辨率的splats数据,并根据相机视角智能筛选需要渲染的splats子集。对于距离过远、肉眼无法分辨细节的区域,减少渲染的splats数量,从而显著提升渲染性能。
  • 渐进式流式加载(Progressive Streaming):采用“从粗到精”的加载策略,优先下载能最优化当前视角细节的数据。随着数据逐步下载,场景会不断细化,实现流畅的渐进式呈现。
  • 虚拟内存(Virtual Memory):为splats页表分配固定的GPU内存池,根据用户在场景中的位置,自动置换3D高斯溅射数据块。借助这一技术,即使是通过网络获取的海量跨对象splats数据,也能被高效访问。

下面具体来看。

Level-of-Detail

在计算机图形学领域,Level-of-Detail是处理大型3D场景的经典方案就是。它能根据物体与观察者的距离,自动调整渲染细节。当需要提升帧率时,可以降低细节等级;当用户静止观察时,则可以提高细节等级,呈现更精细的画面。

Level-of-Detail的典型应用是Mipmap纹理映射:

将一张纹理图片逐级下采样,生成一组分辨率依次减半的纹理金字塔,最顶层是单个像素。这一技术能确保在任意距离下,都能快速采样到与屏幕像素尺寸匹配的纹理数据。

Level-of-Detail的实现方案可分为离散型与连续型两大类。

离散型方案需要预先生成多套不同splat数量的模型版本,再根据物体包围盒与相机的距离,切换渲染不同版本。这种方法存在明显缺陷:

当用户在场景中移动时,模型细节的突然切换会产生“跳变”伪影;同时,将splats分块处理时,块与块之间的边界也会清晰可见。

Spark采用的是连续型Level-of-Detail,核心是为所有splats构建一个层级化结构——Level-of-Detail Gaussian splat tree

Spark会沿着该树的边界,精准筛选出最适合当前视口的splats子集,实现平滑无断层的细节过渡。

Spark 2.0内置了两种Level-of-Detail Gaussian splat tree生成算法:

  • Tiny-LoD算法:一种快速且轻量的算法,默认用于网页端的实时生成场景。
  • Bhatt-LoD算法:一种高精度算法,默认用于命令行工具的离线处理场景。

这两种算法均为无训练依赖的方案,无需参考图像或其他额外输入数据,直接对3D高斯溅射数据进行处理即可。除此之外,Spark也兼容其他第三方生成算法,例如NanoGS。

Progressive Streaming

Spark 2.0定义了一种全新的文件格式——.RAD(全称Radiance Fields,辐射场)。该格式不仅能有效压缩3D高斯溅射数据,还支持随机访问流式加载,实现了场景的渐进式精细化渲染,完美适配网络传输场景。

采用RAD格式后,3D高斯溅射对象能立即以一个包含64Ksplats的粗糙版本呈现,随后系统会根据用户视角,优先获取用于优化可见区域细节的数据块,实现动态的优先级调整。

LoD splat tree本质上是一个四维结构:包含三维空间维度与一维细节层次维度。

要实现流式加载的渐进式精细化渲染,必须将LoD splats ,以合理的方式划分到RAD文件的各个数据块中。

实现这一目标的策略有很多,Spark采用的策略核心是空间邻近性优先:

将三维空间递归划分为更小的区域,每个数据块都会按“从大到小”的顺序,填充对应空间区域内的splats,确保每个数据块都能最大化呈现该区域的细节。

Virtual Memory

虚拟内存是一种经典的内存管理技术,通过划分固定大小的内存页,构建页表映射关系,用有限的物理内存,模拟出容量巨大的虚拟内存空间。

Spark 2.0将这一技术创新性地应用于3D高斯溅射渲染:

它会在GPU中预先分配一个固定大小的内存池(容量为1600万个splats),并构建一套页表映射机制,将GPU中的 64K splats“内存页”,与RAD文件中的64K泼溅点数据块一一对应。

数据块的加载与置换规则如下:

  • 根据LoD splat trees的遍历结果,将高优先级的数据块加载到空闲的GPU内存页中。
  • 当GPU内存池被占满,且需要加载新的高优先级数据块时,会采用LRU算法,将优先级最低的内存页中的数据块置换出去。

Spark的这一设计具备极高的灵活性:它支持同时加载多个RAD文件,并让这些文件共享同一个GPU内存池。对于每个RAD文件,Spark都会维护两套映射关系:从数据块到内存页的映射,以及从内存页到文件和数据块的反向映射。

在对多个细节层次泼溅树进行遍历时,Spark会统一记录所有文件的数据块访问顺序,最终生成一个全局数据块优先级列表,从而实现跨所有3D高斯溅射对象的加载与存储优化。

官方Blog中还介绍了更多技术细节,感兴趣的童鞋传送门在这里:

https://www.worldlabs.ai/blog/spark-2.0#lod-splat-tree

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 15:46:29

P2-VUE3-从零构建:Element Plus的Layout栅格与Container容器布局实战

1. 从零开始搭建Vue3项目环境 作为一个刚接触Vue3的前端开发者,我清楚地记得第一次看到Element Plus组件库时的惊艳感。它就像是一个设计精美的乐高套装,让我们可以快速搭建出专业级的页面布局。不过在开始使用Element Plus之前,我们需要先准…

作者头像 李华
网站建设 2026/4/16 15:45:10

AI 应用开发全景图:从模型到 Agent,完整技术链路深度解析

核心观点:AI 应用开发不是堆砌技术名词,而是构建一条从模型选择到 Agent 智能体的完整价值交付链路。 一、引言:为什么你需要这张"全景图" 很多 AI 学习者都有这样的困惑: “学了很多 AI 名词,还是做不出项目;会调用模型接口,还是搭不起业务闭环;做了几个 D…

作者头像 李华
网站建设 2026/4/16 15:41:45

Spyglass CDC检查实战:从约束到验证的完整流程解析

1. Spyglass CDC检查入门指南 第一次接触Spyglass CDC检查时,我也被各种专业术语搞得晕头转向。但经过几个实际项目的磨练后,我发现只要掌握几个关键步骤,就能轻松应对大多数跨时钟域问题。Spyglass作为业界公认的CDC验证黄金标准&#xff0…

作者头像 李华
网站建设 2026/4/16 15:41:43

Cursor Pro终极免费方案:三分钟搞定设备限制破解

Cursor Pro终极免费方案:三分钟搞定设备限制破解 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial re…

作者头像 李华