技术深度解析
COSMO-Agent的核心创新在于将CAD-CAE优化问题形式化为部分可观测马尔可夫决策过程(POMDP)。状态空间包括当前CAD模型参数(如尺寸、圆角半径、孔位)、最新CAE仿真结果(如最大von Mises应力、温度梯度、流速)以及设计约束。动作空间由一组高级几何编辑操作组成——例如`extrude`、`cut`、`fillet`、`chamfer`、`scale`和`move`——每个操作均由连续或离散值参数化。奖励函数是设计目标(如最小化质量、最大化刚度、最小化峰值温度)与违反约束惩罚项(如最大应力低于屈服强度、几何可制造性)的加权组合。
智能体架构基于Transformer大语言模型(Llama 3.1 70B的微调变体),并增加了工具使用层。LLM接收当前状态的文本描述(由结构化数据生成),输出文本形式的动作指令,由CAD内核(开源几何内核Open CASCADE Technology)和CAE求解器(CFD用OpenFOAM,FEA用CalculiX)解析并执行。仿真结果再转换回文本,输入下一轮迭代。这种“文本输入-文本输出”接口使LLM能够利用其预训练的推理能力,而无需直接处理原始网格或张量数据。
一项关键的算法贡献是混合强化学习方法:使用近端策略优化(PPO)进行策略学习,并结合一个学习到的动力学模型(小型神经网络),该模型能在运行昂贵的CAE仿真之前预测动作结果。这种基于模型的组件使智能体能够剪枝无前景的动作,在基准测试中将所需仿真次数减少约60%。训练在64块NVIDIA A100 GPU集群上进行,历时两周,使用了涵盖结构支架、散热器和流体通道的15,000个合成设计问题数据集。
| 基准测试 | 传统人工工作流 | COSMO-Agent (强化学习) | 提升倍数 |
|---|---|---|---|
| 支架减重(目标:最大应力 < 250 MPa) | 3.2周(平均) | 8.1小时 | 28倍 |
| 散热器热优化(目标:最高温度 < 85°C) | 4.1周(平均) | 11.3小时 | 24倍 |
| 流体通道压降最小化 | 5.5周(平均) | 14.7小时 | 26倍 |
| 成功率(满足所有约束) | 78%(专家) | 82%(智能体) | +4% |
数据要点: 该表显示,COSMO-Agent相比传统人工工作流实现了24-28倍的速度提升,同时成功率略高于专家水平。这表明强化学习智能体不仅加速了迭代,还更彻底地探索了设计空间,避免了人类的认知偏见。然而,82%的成功率意味着仍有18%的设计未能满足约束,凸显了进一步改进的必要性。
对于感兴趣的读者,底层工具信息如下:Open CASCADE Technology仓库(github.com/Open-Cascade-SAS/OCCT)拥有超过2,300颗星,提供了所使用的几何内核。OpenFOAM(github.com/OpenFOAM/OpenFOAM-dev,3,800+星)处理CFD,而CalculiX(github.com/CalculiX/CalculiX,1,200+星)提供FEA。COSMO-Agent代码库本身尚未公开,但团队已表示计划进行开源发布。
关键参与者与案例研究
COSMO-Agent的开发是清华大学人工智能研究院与工业AI初创公司SimAI Technologies(化名,为保持匿名性而使用)的合作成果。清华大学的李伟博士是首席研究员,此前从事机器人操作的强化学习研究,并将该专业知识引入几何设计领域。这家由前达索系统工程师创立的初创公司,提供了专有的CAD-CAE集成层以及航空航天和汽车设计领域的领域专业知识。
一个值得关注的案例研究涉及某商用窄体喷气式飞机发动机支架的优化。原始设计重4.2公斤,安全系数为1.8。使用COSMO-Agent,团队设定了减重30%同时保持安全系数至少1.5的目标。智能体在12小时内探索了超过2,000种设计变体——这一任务若由三人工程师团队完成,大约需要6周时间。最终设计重2.9公斤(减重31%),安全系数为1.52,关键在于其几何形状是非直觉的:一种晶格状内部结构,由于智能体学会规避的制造约束,传统拓扑优化并未提出过这种方案。
| 解决方案提供方 | 方法 | 核心优势 | 核心劣势 | 示例产品 |
|---|---|---|---|---|
| COSMO-Agent (清华大学 + SimAI) | 强化学习 + LLM工具调用 | 24-28倍加速,超越专家成功率 | 18%失败率,代码尚未开源 | 发动机支架、散热器、流体通道 |