酷家乐战略转向空间智能:为物理世界构建AI基础设施

April 2026
world modelembodied AI归档:April 2026
作为“杭州六小龙”中首家上市公司,酷家乐正将其核心战略从设计软件转向空间智能基础设施。依托旗下旗舰平台酷家乐积累的海量结构化3D数据,该公司旨在构建理解并与物理世界交互的基础AI模型。此举标志着酷家乐正从工具供应商转型为AI时代空间理解的底层架构师。

酷家乐正在经历一场重新定义其上市后发展轨迹的根本性变革。这家以云端室内设计与渲染平台酷家乐闻名的公司,正将其积累的核心资产——数十亿个高度结构化的房间、建筑及家具3D空间模型——战略性地重新定位为下一代空间AI模型的训练语料库。这一战略转向使公司超越了面向设计师的软件即服务(SaaS)模式,进入了基础AI基础设施的竞技场。其核心理念在于:尽管大型语言模型(LLMs)已掌握文本处理,Sora等生成式视频模型也在推进视觉合成,但AI仍缺乏对三维物理世界(包括其几何结构、物理特性、语义信息及功能属性)稳健而直观的理解。物理世界具有固有的逻辑、规则与约束,而酷家乐的海量数据集恰好封装了这些人类关于空间布局、功能性与美学的集体智慧。通过基于此数据训练基础模型,酷家乐的目标是创建一种“空间世界模型”,使AI能够理解、推理甚至生成符合物理规律与功能逻辑的合理空间。这一定位使其与专注于文本的OpenAI、专注于图像的Midjourney,以及专注于视频的Runway ML形成了差异化竞争。其潜在应用场景远不止家居设计,将延伸至建筑自动化、机器人环境交互、虚拟现实内容生成乃至城市数字孪生等领域。此次转型也反映了中国科技企业从应用层创新向基础层核心技术攻坚的战略升级。

技术深度解析

酷家乐向空间智能转型背后的技术雄心,是构建一个能够将原始3D几何数据转化为机器可理解的、丰富的空间表征的基础模型。这远远超越了计算机辅助设计(CAD)或建筑信息模型(BIM)。其目标是创建一个空间世界模型——一个能够内化物理环境固有规则、关系与可能性的神经网络。

架构与数据流水线: 整个过程始于酷家乐专有的数据湖。每个用户创建的设计不仅是一个多边形集合,更是一个附带着元数据的结构化对象图:尺寸、材料属性、功能类别(如“餐椅”、“厨房水槽”)、制造商数据,甚至行为标注(沙发用于坐,门可以打开)。这些数据在语义标签的丰富程度上,比来自激光雷达扫描或摄影测量的原始点云数据高出数个数量级。该流水线主要包括:
1. 数据统一化: 将数百万个设计归一化到一致的坐标系和模式中。
2. 图神经网络预训练: 将一个房间视为一个图,其中节点是对象(家具、墙壁、电器),边是空间关系(“在…之上”、“相邻于”、“面向”)。类似SceneGraphNet(其内部架构可能受开源项目启发)的模型学习预测缺失物体或标记物理上不可能的布局。
3. 物理信息神经网络: 将基础物理定律(重力、碰撞、材料应力)整合到模拟层中,使模型能够推理稳定性、承重及人机交互。
4. 多模态融合: 将空间图与文本描述(用户设计笔记)、图像(渲染视图)以及未来可能加入的视频漫游相关联,将语言锚定在3D结构中。

一个关键的技术挑战是表征学习。如何为Transformer编码一个3D空间?现有方法包括体素网格神经辐射场以及三平面表征(如NVIDIA的GET3D所用)。酷家乐的早期研究论文暗示了一种混合方法:使用稀疏体素八叉树进行高效的大规模场景表征,并结合隐式神经场实现高保真细节。

相关的开源基准与代码库: 该领域发展迅速,学术界与大科技公司正推动开源创新。酷家乐工程师必定关注或贡献的关键代码库包括:
* ThreeDWorld: 一个用于交互式物理环境的高性能、逼真模拟平台。它是具身AI任务的基准。
* Habitat-Sim: Facebook AI Research的可扩展3D模拟器,专注于具身智能体的导航与交互。
* OmniObject3D: 一个包含高质量纹理网格的大规模3D物体数据集,对于训练精细的物体识别与操作模型至关重要。

| 空间表征方法 | 优势 | 劣势 | 最佳适用场景 |
| :--------------------- | :--------------------------------------- | :------------------------------------------- | :----------------------------------- |
| 体素网格 | 简单,易于CNN处理,显式几何 | 内存密集(立方增长),分辨率低 | 早期场景解析,碰撞检测 |
| 点云 | 内存高效,保留精确几何 | 无序,缺乏拓扑结构,无表面信息 | 原始传感器数据(LiDAR),配准 |
| 网格 | 渲染轻量,显式表面 | 难以用AI编辑,不可微分 | 最终资产输出,游戏引擎 |
| 神经辐射场 | 逼真的视图合成,连续表征 | 训练/推理慢,无物理属性 | 新视角合成,可视化 |
| 隐式神经表征 | 紧凑,连续,高细节 | 黑盒,难以提取显式规则 | 高保真3D重建,生成式AI |

数据启示: 构建空间智能基础的最佳技术栈并非单一表征,而是一个分层系统。酷家乐很可能采用网格/体素进行符号推理和物理模拟,并利用神经场进行生成任务和真实感渲染,这需要大量的工程工作来桥接这些不同表征。

主要参与者与案例分析

酷家乐并非在真空中运作。对物理世界建模的竞赛是AI主导权的核心战场,吸引了巨头、资金雄厚的初创公司和学术联盟。

现有的巨头:
* NVIDIA: 凭借其Omniverse平台,在基础设施层无疑是领导者。Omniverse是一个基于通用场景描述的协作与模拟平台,旨在成为3D工作流程的“操作系统”。NVIDIA的优势在于其从硬件(GPU)到软件的全栈管道,以及对工业数字孪生的专注。其生成式AI工具如GET3DMagic3D,直接与生成式3D内容创建领域竞争。

相关专题

world model15 篇相关文章embodied AI80 篇相关文章

时间归档

April 20261545 篇已发布文章

延伸阅读

OpenAI的Sora转向:从视频生成器到世界模型基座OpenAI近期对其视频生成模型Sora的战略调整,远不止于产品优化。这是一次从打造独立工具,转向为未来世界模型构建视觉核心的深思熟虑之举。此举标志着OpenAI的雄心:成为复杂多模态AI系统的基础设施提供者。Tencent's Strategic Pivot: How AGI is Forcing a Complete Rewrite of Its Investment PlaybookAn in-depth AINews analysis reveals Tencent is undergoing a fundamental strategic shift, moving away from its legacy inv北点数字发布Spark AI Cloud 2.0:为城市与产业锻造新一代AI操作系统北点数字正式推出Spark AI Cloud 2.0平台,标志着其从基础AI服务商向“AI系统工程”提供商的战略跃迁。该平台旨在构建一个能自主优化区域基础设施、能源与经济活动的AI驱动操作系统,为城市与工业园区提供全局智能解决方案。Embodied AI's Deployment Era: From Selling Robots to Delivering Measurable ResultsThe embodied intelligence industry is undergoing a paradigm shift, moving decisively from laboratory demonstrations to r

常见问题

这次公司发布“Koolab's Pivot to Spatial Intelligence: Building AI's Foundation for the Physical World”主要讲了什么?

Koolab is undergoing a fundamental transformation that redefines its post-IPO trajectory. The company, best known for its Kujiale cloud-based interior design and rendering platform…

从“Koolab Kujiale spatial intelligence vs NVIDIA Omniverse”看,这家公司的这次发布为什么值得关注?

The technical ambition behind Koolab's spatial intelligence pivot is to construct a foundational model that translates raw 3D geometry into a rich, machine-understandable representation of space. This goes far beyond com…

围绕“How does Koolab's 3D data train AI for robots”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。