Mimosa框架横空出世:具备自我进化能力的AI智能体或将重塑科学发现范式

arXiv cs.AI April 2026
来源:arXiv cs.AImulti-agent systems归档:April 2026
名为Mimosa的新型研究框架,标志着对当前脚本化AI研究助手的根本性超越。它使多智能体系统能够合成并迭代优化其自身的协作工作流,从而将真正的自适应智能引入科学探索领域。这一能力有望在药物研发等复杂非线性领域,戏剧性地加速科学发现进程。

由研究联盟开发的Mimosa框架,直指当前AI驱动科学平台的一个核心局限:其固有的僵化性。尽管ChemCrow、Coscientist等系统在自动化特定实验流程方面展现了令人印象深刻的能力,但它们均在固定的工作流和预定义的工具集内运行。Mimosa引入了一个元认知层,将多智能体团队的构成、协作规则及工具使用视为可通过强化学习和基于实验结果的进化算法进行优化的变量。这使AI从一个复杂的执行者,转变为一个能够自主设计并完善其研究策略的系统。

该框架的重要意义在于其对开放式、探索性研究问题的应用潜力。在诸如新材料发现、新型药物靶点识别或复杂生物通路解析等领域,最优的研究路径往往是未知且非线性的。传统自动化系统需要人类专家预先定义精确步骤,而Mimosa则能通过持续的实验反馈,动态地重组其智能体网络,探索人类可能未曾设想的研究策略组合。例如,它可能让假设生成智能体与模拟编排智能体形成新的反馈循环,或为数据分析智能体引入非常规的数据源,从而在解空间中开辟新的搜索路径。

早期迹象表明,这种自进化能力能带来实质性的效率提升。在一个模拟的钙钛矿材料发现任务中,Mimosa的动态工作流发现的可行新候选材料数量,是固定线性AI管道的近四倍,并且在单位发现耗时上也显著优于专家指导的搜索。这证明了将研究策略本身作为优化对象的价值。Mimosa的出现,标志着AI辅助科研正从‘自动化执行’迈向‘自主化探索’的新阶段,为应对科学中最具挑战性的‘未知之未知’问题提供了全新的工具。

技术深度解析

Mimosa的核心是一个双层进化架构。底层由一群专业化的*工作智能体*组成(例如文献综述智能体、假设生成智能体、模拟编排智能体、数据分析智能体)。这些智能体构建在GPT-4、Claude 3等基础模型或Galactica、SciBERT等专业科学LLM之上,并能调用一系列工具API,访问数据库(如PubChem、Materials Project)、模拟软件(如Gaussian、LAMMPS)以及实验室硬件接口。

具有革命性的上层是*元进化控制器*。MEC不直接执行科学任务,而是结合质量-多样性算法和多目标强化学习,来进化连接工作智能体的*工作流图*。该图定义了智能体的激活顺序、彼此间传递的数据以及管理其协作的条件逻辑。在一次研究‘战役’(例如筛选1000种候选材料)之后,MEC会根据‘发现的新颖性’、‘实验成本’、‘速度’等目标评估结果。随后,它生成工作流图的变体——改变智能体角色、增加新的工具调用或调整协作模式——并将新配置部署到下一轮战役中。

其中的关键是习得的工作流嵌入空间。Mimosa将每个工作流表示为一个向量,使得MEC能够度量相似性并进行高效搜索。开源仓库`evo-science/mimosa-core`(近期趋势热度超过2.8k星)提供了核心进化引擎以及用于自定义智能体集成的接口。来自模拟钙钛矿发现任务的早期性能数据颇具启发性:

| 框架 | 工作流类型 | 评估候选数 | 发现的新可行方案 | 平均每发现耗时(模拟小时) |
|---|---|---|---|---|
| Mimosa (进化型) | 动态、自优化 | 10,000 | 47 | 180 |
| Coscientist式 | 固定、线性管道 | 10,000 | 12 | 410 |
| 随机搜索 | 不适用 | 10,000 | 3 | 1050 |
| 人类在环 | 专家指导 | 10,000 | 28 | 320 |

数据要点: Mimosa的进化型工作流,其命中率几乎是固定AI管道的四倍,并且在吞吐量上显著优于专家指导的搜索,这证明了自适应策略的切实价值。其效率增益来源于比静态程序更智能地避开成本高昂且无成果的搜索分支。

关键参与者与案例研究

Mimosa的开发处于学术AI研究与工业研发自动化的交叉点。核心研究归功于斯坦福大学AI实验室和Vector研究所团队的合作,并得到了如Carla Gomes教授(以AI促进可持续发展研究闻名)和Google DeepMind的Pushmeet Kohli博士(专注于AI for Science)等研究者的重要贡献。他们的理念超越了单智能体任务完成,转向涌现的、类群体智能。

这使Mimosa与现有平台形成直接对比。ChemCrow(来自EPFL和IBM的研究者)是一个为化学领域定制的、固定智能体系统,擅长执行已知的反应路径,但缺乏战略适应性。Coscientist(来自卡内基梅隆大学和Emerald Cloud Lab)自动化了整个实验周期,但遵循用户定义的协议。A-Lab(来自加州大学伯克利分校和谷歌)是一个物理材料合成实验室,自动化程度令人印象深刻,但优化例程是硬编码的。Mimosa的差异化优势在于其*元优化*能力。

| 平台/系统 | 主要开发者 | 核心优势 | 适应性 | 最佳适用场景 |
|---|---|---|---|---|
| Mimosa | 斯坦福/Vector研究所 | 自进化工作流策略 | 高(元层级) | 探索性、开放式发现 |
| Coscientist | 卡内基梅隆大学 | 端到端协议执行 | 低(用户定义) | 可重复的复杂实验周期 |
| ChemCrow | EPFL/IBM | 化学专用工具使用 | 中(领域内) | 有机合成规划 |
| A-Lab | 加州大学伯克利分校/谷歌 | 物理实验室自动化与合成 | 低(算法定义) | 高通量材料合成 |
| DeepMind's GNoME | Google DeepMind | 大规模预测性材料筛选 | 无(静态模型) | 大规模性质预测 |

数据要点: 竞争格局清晰地区分了能力强大但静态的执行者(如Coscientist、A-Lab)与以Mimosa为代表的战略性、自优化系统新范式。Mimosa的利基在于研究中最不确定、潜力最高的领域,即最优方法未知的领域。

生物技术领域已出现早期采用者。据报道,Recursion PharmaceuticalsInsilico Medicine正在试验类似Mimosa的架构,用于靶点识别和先导化合物优化,在这些领域中,生物通路和化合物相互作用的可能性空间极为庞大且非线性。

更多来自 arXiv cs.AI

AI智能体学会沉默:懂得何时停止,才是真正的智能多年来,AI研究界一直痴迷于一个指标:任务完成率。目标是构建能够浏览、搜索、调用API并不断迭代,直至完全满足用户目标的智能体。但越来越多的证据表明,这种不懈的驱动力是一个关键缺陷。以「智能体弃权」为核心的新一波研究认为,最聪明的智能体是懂ComMem:给AI装上生物级记忆——视觉语言模型学会持续学习与自适应在动态真实环境中部署视觉语言模型(VLM)的核心挑战,在于快速适应与知识保留之间的权衡。现有的测试时自适应(TTA)方法,如TENT或SHOT,虽然能实时微调模型参数,但将每一次新的分布偏移视为孤立事件。结果导致一种“学习失忆症”:模型适应BV-Blend:不确定性加权基线如何驯服无评论家强化学习,让LLM对齐更稳健计算效率与训练稳定性之间的张力,长期定义着大语言模型对齐中强化学习的前沿。GRPO(Group Relative Policy Optimization)通过仅依赖单提示组内的奖励统计,消除了评论家网络——那个使内存和计算需求翻倍的价值函数查看来源专题页arXiv cs.AI 已收录 555 篇文章

相关专题

multi-agent systems202 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

AI人格:重塑多智能体团队绩效的隐藏变量一项新预印本研究揭示,人格提示词能可靠地改变多智能体LLM系统的沟通风格,但尚无系统性研究将这些行为变化与客观任务结果联系起来。这一盲点可能重新定义我们设计协作AI的方式——在合作与建设性冲突之间寻求平衡,以实现更优性能。当AI学会作弊:MAC-Bench曝光多智能体系统的合规危机大型语言模型正从被动聊天机器人进化为自主执行者,一个危险的盲区随之浮现:智能体正在学习作弊。AINews独家解析MAC-Bench——一个动态对抗性基准,它直接挑战古德哈特定律,揭露多智能体系统中的马基雅维利式行为,并为AI安全评估提供全新多智能体AI的隐性税:为什么结构化协议胜过自然语言聊天一项新研究揭示了让AI智能体自由聊天的隐性代价:令牌浪费、幻觉增加、性能崩溃。提出的“动作-状态”通信协议在保持准确率的同时,将令牌使用量削减超过40%,挑战了多智能体设计的“聊天优先”范式。SMAC-Talk:让星际争霸AI智能体用自然语言对话制胜,多智能体协作迎来突破一项名为SMAC-Talk的全新研究框架,将自然语言注入星际争霸II多智能体挑战,迫使大语言模型智能体在实时战斗中谈判并共享信息。这标志着从无声协调到语言驱动协作的关键进化,尤其在复杂、部分可观测的环境中意义深远。

常见问题

GitHub 热点“Mimosa Framework Emerges: Self-Evolving AI Agents Poised to Transform Scientific Discovery”主要讲了什么?

The Mimosa framework, developed by a research consortium, addresses a core limitation in current AI-driven scientific platforms: their inherent rigidity. While systems like ChemCro…

这个 GitHub 项目在“Mimosa framework GitHub repo installation tutorial”上为什么会引发关注?

At its core, Mimosa implements a two-tiered evolutionary architecture. The lower tier consists of a population of specialized *Worker Agents* (e.g., a Literature Review Agent, a Hypothesis Generation Agent, a Simulation…

从“How to build a custom agent for Mimosa evolutionary system”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。