技术深度解析
星源智的核心产品是一个世界模型(World Model)——一种能够学习物理世界动态表征的神经架构,使机器人能够预测其动作的后果并进行规划。这远超传统机器人控制系统(依赖显式物理模型和手工编码规则)。世界模型从数据中学习:视频流、传感器读数、动作序列,构建起因果关系的内部模拟。
架构概览
该系统很可能采用潜在动力学模型(Latent Dynamics Model)方法,类似于DeepMind的DreamerV3或Google DeepMind最新的UniSim。其架构包含三个关键组件:
1. 编码器(Encoder):将高维感官输入(RGB视频、深度信息、触觉)压缩为紧凑的潜在状态。
2. 转移模型(Transition Model):根据当前状态和动作预测下一个潜在状态。这是“世界模型”的核心——它学习物理规律、物体恒存性和接触动力学。
3. 策略/控制器(Policy / Controller):利用世界模型通过“想象”未来轨迹来规划动作,选择能最大化奖励函数或任务完成度的轨迹。
一个关键的创新是使用等变神经网络(Equivariant Neural Networks),它尊重空间对称性(平移、旋转)——这是机器人学中一个已知挑战:为一个机械臂方向学习的策略应能泛化到其他方向。星源智团队已发表了关于SE(3)-等变扩散模型(SE(3)-equivariant diffusion models)用于机器人操作的论文,相关代码以`se3-diffusion-policy`仓库形式发布在GitHub上(目前约1200星)。该仓库实现了一个基于扩散的策略,输出以点云观测为条件的6自由度末端执行器位姿,在RLBench基准测试上取得了最先进的结果。
基准测试表现
| 基准测试 | 指标 | 星源智(报告值) | 基线(此前SOTA) | 提升幅度 |
|---|---|---|---|---|
| RLBench(10个任务) | 成功率(%) | 87.3 | 76.1(ACT) | +11.2个百分点 |
| MetaWorld(ML10) | 平均回报 | 94.5 | 88.2(DreamerV3) | +6.3 |
| RoboSuite(4个任务) | 任务完成率(%) | 91.0 | 82.4(RT-2) | +8.6个百分点 |
| 真实世界抓取放置 | 成功率(%) | 95.2 | 89.0(BC-Z) | +6.2个百分点 |
数据要点: 星源智的世界模型在模拟基准测试上实现了比此前SOTA两位数的提升,并在真实世界任务中取得了6.2个百分点的有意义增益。这表明其等变架构和基于扩散的规划确实在推动技术前沿,而不仅仅是针对基准测试进行优化。
关键技术差异化
与大多数使用行为克隆(Behavior Cloning)(模仿人类演示)或强化学习(Reinforcement Learning)(在模拟中试错)的具身AI系统不同,星源智的世界模型实现了对新颖物体和环境的零样本泛化(Zero-shot Generalization)。该模型学习了底层物理规律——质量、摩擦、关节运动——因此当它看到一个新物体时,能够推理其行为方式。这正是机器人学的圣杯:一个无需为每个新任务重新训练的机器人。
---
关键参与者与案例分析
团队背景
星源智由来自清华大学人工智能研究院和北京智源人工智能研究院(BAAI)的一群研究人员创立。创始团队包括刘伟博士(前BAAI机器人部门负责人)和陈宇轩博士(CogView文生图模型的核心贡献者)。这一渊源至关重要:BAAI同样孵化了智谱AI,这解释了“下一个智谱”的称号。该团队与中国AI生态系统有着深厚联系,并能接触到顶尖人才。
投资方解析
本轮融资的构成引人注目:
| 投资方类型 | 代表机构 | 战略逻辑 |
|---|---|---|
| 财务VC | 松禾资本、创东方、华控基金 | 纯财务回报;押注品类定义者 |
| 国资 | 中车资本、北京工业投资、国军创新投资、江西金控 | 国家AI战略;产业政策协同 |
| 产业方 | 亿嘉和(汽车零部件)、恒兴集团(制造业)、奇安信(网络安全) | 潜在部署合作伙伴;获取真实世界数据 |
数据要点: 对于一家成立仅10个月的初创公司而言,国资与产业资本的混合配置并不常见。这表明星源智不仅仅是一个研究实验室——它拥有清晰的部署路径,可应用于制造业、物流,甚至国防领域。中车资本(中国最大列车制造商的投资部门)的参与尤其具有深意:用于工业机器人的世界模型可以自动化列车装配、检测和维护流程。
竞争格局
| 公司 | 专注领域 | 融资额 | 关键技术 | 状态 |
|---|---|---|---|---|
| 星源智 | 世界模型(大脑) | ~1.4亿美元(10个月) | SE(3)-等变扩散 | 隐秘/早期产品 |
| Physical Intelligence(美国) | 机器人基础模型 | ~4亿美元 | π0(视觉-语言-动作模型) | 产品化阶段 |
| 银河通用(Galbot) | 具身智能操作 | ~1.2亿美元 | 基于仿真的强化学习 | 商业化早期 |
| 星动纪元(Star Dynamics) | 人形机器人本体+大脑 | ~1亿美元 | 全身运动控制 | 原型测试 |
数据要点: 星源智是唯一一家纯粹聚焦于“大脑”而非机器人本体的中国初创公司。这使其成为潜在的平台级玩家——如果世界模型成功,它可以为任何机器人提供动力,从工业机械臂到人形机器人。然而,这也意味着它面临来自Physical Intelligence等美国公司的直接竞争,后者拥有更雄厚的资金,并采用类似的方法论。