清华系AI创业公司,一年内让机器人真正走进工厂

June 2026
embodied AI归档:June 2026
一家成立仅一年的清华系具身智能创业公司,已获得头部车企的产线订单,将AI驱动的机器人部署到真实制造环境中。这标志着行业从人形机器人炒作转向实用型智能生产力的关键转折。

在人形机器人演示视频充斥市场的喧嚣中,一家年轻的清华系创业公司实现了许多人认为需要数年才能达成的目标:获得顶级汽车制造商的真实产线订单。这家成立仅12个月的公司,已部署了一支由AI驱动的机械臂集群,它们能够理解自然语言指令,并实时适应动态变化的工厂车间环境。其核心创新在于一种紧密集成的架构,将大语言模型(LLM)与实时运动控制栈深度融合,相当于为机器人赋予了用于推理的“大脑”和用于精确、自适应运动的“小脑”。工程师无需为每个零件变体或位置偏移重写代码,系统即可解读高级指令并自主调整。

技术深度解析

这家创业公司的秘诀并非新的人形形态,而是一种新颖的控制架构,它弥合了高级语言与底层扭矩指令之间的语义鸿沟。顶层是一个经过微调的LLM——考虑到清华背景,很可能是Qwen或GLM系列的变体——充当机器人的“任务规划器”。当操作员说:“从传送带A拿起发动机缸体,放在夹具B上,避开焊接臂”,LLM会解析指令,将其分解为子任务(定位、接近、抓取、移动、放置),并生成一个符号化计划。

但真正的工程挑战在于将这个计划与现实世界连接起来。该系统采用了一个“数字孪生”层,它与真实机器人并行运行物理仿真。这使得LLM可以在任何物理运动发生之前,在仿真环境中测试其计划。如果该计划会导致碰撞或违反关节限位,仿真会拒绝它,LLM则重新规划。这个“仿真到现实”循环以约10 Hz的频率运行,足以满足大多数装配任务的需求。

在规划器之下,一个实时运动控制器以1 kHz的频率运行,使用模型预测控制(MPC)来处理实际动力学。关键的创新是一个学习到的残差模型,用于补偿未建模的摩擦、间隙和零件变异性。这个残差通过一个小型神经网络在线更新,该网络观察指令轨迹与实际轨迹之间的误差。经过几个生产周期,机器人会“学习”其环境的特定特性——一个略微偏移的传送带、一个磨损的夹爪垫——并相应地进行调整。

对于对开源生态系统感兴趣的读者,最接近的公开参考是 ros2_control 框架结合 moveit2 运动规划库。一个更高级的研究仓库是 dex-hand (github.com/real-stanford/dex-hand),它拥有超过2000颗星,展示了基于强化学习的灵巧操作。另一个相关项目是 robosuite (github.com/ARISE-Initiative/robosuite),一个拥有3500+颗星的仿真框架,许多创业公司用它来训练操作策略。

| 组件 | 技术 | 更新频率 | 关键功能 |
|---|---|---|---|
| 任务规划器 | 微调LLM(很可能是Qwen-14B) | ~2 Hz | 自然语言解析,符号化任务分解 |
| 数字孪生 | 基于PyBullet/Isaac Gym | 10 Hz | 碰撞检测,计划验证 |
| 运动控制器 | 模型预测控制(MPC) | 1 kHz | 实时轨迹执行 |
| 自适应层 | 小型神经网络(残差模型) | 100 Hz | 在线误差补偿,环境自适应 |

数据要点: 多速率架构(2 Hz规划 vs 1 kHz控制)是关键洞察。它将LLM缓慢、灵活的推理与控制器快速、精确的执行解耦,同时实现了适应性和工业级精度。

关键参与者与案例研究

虽然提示中未提及该创业公司的具体名称,但清华背景指向了若干关键人物和机构。清华大学人工智能研究院(THUAI)的高阳教授实验室一直是具身智能研究的热土,在仿真到现实迁移和语言条件操作方面成果丰硕。另一位有影响力的研究者是孙富春教授,其团队在灵巧抓取和机器人多模态感知方面发表了大量论文。

汽车客户很可能是比亚迪、蔚来或小鹏等中国电动汽车制造商,它们都在积极推进产线自动化。例如,比亚迪一直在部署来自国内外供应商的机器人,其工厂以高产品混合度著称——这正是柔性自动化的绝佳测试场景。

该领域的竞品方案包括:

| 公司 | 产品 | 方法 | 部署阶段 |
|---|---|---|---|
| 清华创业公司(未具名) | AI驱动机械臂系统 | LLM + MPC + 自适应残差 | 获得车企产线订单 |
| Covariant (美国) | Covariant Brain | 基于强化学习的视觉拣选 | 100+仓库部署 |
| Robust.AI (美国) | Carter协作机器人 | LLM + 导航栈 | 物流试点项目 |
| Agility Robotics (美国) | Digit人形机器人 | 双足运动 + 操作 | 在Amazon、GXO试点 |
| Figure AI (美国) | Figure 01人形机器人 | LLM + 全身控制 | 在BMW试点 |

数据要点: 清华创业公司专注于非人形、任务特定的机械臂并集成LLM,使其在制造业中相比人形机器人竞争对手具有成本和可靠性优势。当Figure和Agility追逐“通用”梦想时,这家创业公司已经通过一个定义明确的单一用例产生了收入。

行业影响与市场动态

这份订单验证了许多投资者一直犹豫不决的论点:具身智能无需用两条腿走路也能创造价值。全球

相关专题

embodied AI175 篇相关文章

时间归档

June 20261425 篇已发布文章

延伸阅读

机器人学界悄然达成共识:ICRA与CVPR 2025上的具身基础模型浪潮在ICRA与CVPR 2025上,机器人研究者们悄然达成共识:未来属于具身基础模型。大语言模型、世界模型与实时视频生成正被整合进统一的机器人大脑,使机器人能够从单次人类演示中实现零样本泛化。代码生成与机器人抓取:AI 战场的新两极AI 产业正悄然分化:大语言模型以代码生成为试金石,具身智能则以抓取能力为基准。一家名为 Original Mind 的公司已双线布局,试图构建一座连接符号推理与物理交互的统一架构。OneModel 1.7隐式通路:重塑具身智能的“脑-体”直连架构沃恩机器人发布OneModel 1.7,在潜在空间中构建了一条直接的“隐式通路”,彻底摒弃了传统的感知-规划-执行流水线。机器人无需显式的逐步推理,即可从场景理解直接跃迁至正确动作的执行。OneModel 1.7隐式通路:让AI从“看见”到“动手”再无鸿沟沃恩机器人发布OneModel 1.7,一款面向具身智能的基础模型,其核心创新在于在潜在空间中引入“隐式通路”。这一架构突破使视觉感知能直接生成精准运动指令,绕开传统翻译层,彻底打通理解与行动之间的关键断层。

常见问题

这次公司发布“How a Tsinghua AI Startup Put Robots to Work in Real Factories in Just One Year”主要讲了什么?

In a development that cuts through the noise of humanoid robot demos, a young Tsinghua-linked startup has achieved what many thought would take years: a real production line order…

从“Tsinghua embodied AI startup factory order 2025”看,这家公司的这次发布为什么值得关注?

The startup's secret sauce is not a new humanoid form factor, but a novel control architecture that bridges the semantic gap between high-level language and low-level torque commands. At the top sits a fine-tuned LLM—lik…

围绕“LLM motion control robot architecture”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。