语言即实验协议：AI代理如何自动化科学发现

几十年来，自动化实验室的承诺一直被一个瓶颈所束缚：研究人员必须编写代码。要进行高通量筛选或复杂合成，科学家必须同时是程序员和系统集成师，精通Python、REST API以及机械臂、液体处理器和读板机的晦涩配置语言。这排除了绝大多数领域专家——生物学家、化学家、材料科学家——他们拥有最深厚的“该测试什么”的知识，却缺乏实现它的工程能力。由多家AI实验室和硬件制造商联合开创的一种新架构打破了这一障碍。其核心是一个大型语言模型（LLM）与一个“协议编译器”紧密耦合，后者将自然语言——例如“对化合物X针对酶Y进行剂量反应曲线测试，使用8个浓度，每个浓度三重复”——映射为形式化的、机器可读的实验协议。这一突破意味着，科学家只需用日常语言描述实验意图，系统便能自动完成从意图解析、资源调度到仪器控制的全部流程，使实验设计速度提升10倍以上，跨厂商设备集成时间从数周缩短至数小时。

技术深度解析

这一突破建立在三层架构之上，它弥合了人类语言与机器控制之间的语义鸿沟。

第一层是自然语言接口（NLI），通常是一个经过微调的LLM（例如GPT-4或Llama 3的变体），它接收研究人员的指令，例如“对化合物X针对酶Y进行剂量反应曲线测试，使用8个浓度，每个浓度三重复”。LLM必须解析意图，提取实体（化合物、酶、浓度、重复次数），并解决歧义（例如“室温”与“25°C”）。

第二层是协议编译器，这是一个新颖的组件，它将解析后的意图翻译成形式化的、机器可读的协议。这不是简单的查找；它涉及对仪器能力、资源可用性和实验约束的推理。编译器使用基于图的表示，其中节点是操作（移液、孵育、测量），边是依赖关系。它必须处理并行性——例如，在培养箱预热的同时准备一块96孔板。这一层通常利用符号推理引擎（如SAT求解器或基于约束的调度器）来优化序列并避免死锁。

第三层是仪器抽象层（IAL）。历史上，每个实验室设备——无论是Hamilton STAR液体处理器、Thermo Fisher培养箱还是Molecular Devices读板机——都使用自己的协议（例如SiLA2、LADS或专有API）。IAL提供了一个统一接口，本质上是一个“通用驱动程序”，协议编译器以此为编译目标。这是最困难的工程挑战：来自不同供应商的设备具有不同的错误代码、时序容差和校准要求。IAL必须处理实时反馈（例如，移液器吸头未能吸取液体）并动态调整协议。

该领域一个值得注意的开源项目是LabGraph（GitHub: labgraph/labgraph，约2.8k星标），它提供了一个基于图的执行引擎用于实验室自动化，但需要手动定义协议。新架构更进一步，通过从自然语言生成图来推进。另一个相关仓库是PyLabRobot（GitHub: pyLabRobot/pylabrobot，约1.5k星标），它为常见实验室硬件提供基于Python的控制，但仍然需要编码。这里的创新在于LLM到图的桥梁。

性能基准测试：

| 指标 | 传统（手动编码） | 新AI代理架构 | 改进幅度 |
|---|---|---|---|
| 设置96孔板ELISA检测的时间 | 4小时（编码+调试） | 25分钟（自然语言+验证） | 10.5倍 |
| 每100次操作的错误率 | 8%（人为编码错误） | 2%（LLM误解+运行时检查） | 减少4倍 |
| 每位研究人员每周的实验数量 | 3 | 10 | 3.3倍 |
| 跨厂商设备集成时间 | 2周（每台新设备） | 2小时（通过IAL配置） | 80倍 |

数据要点： 最显著的提升在于跨厂商集成时间——80倍的改进——这直接解决了实验室自动化中的“巴别塔”问题。错误率的降低虽然显著，但仍凸显出LLM误解依然是一个风险，需要人在回路中进行验证。

关键参与者与案例研究

多个实体正在竞相将这一架构商业化，各自采取不同的策略。

Emerald Cloud Lab 长期以来一直提供完全远程、软件控制的实验室，但其界面历史上需要Python脚本。他们最近宣布了“Emerald Voice”，一个自然语言覆盖层，允许研究人员说出“对样本集B运行标准PCR协议”并使其执行。他们的优势在于现有的基础设施——他们拥有仪器，并且可以将LLM与其专有控制软件紧密耦合。然而，他们的封闭生态系统限制了现有硬件实验室的采用。

Strateos（前身为Transcriptic）采取了不同的方法：他们提供“实验室即服务”API，其新的AI代理充当一个“管家”，将自然语言翻译成API调用。他们瞄准的是希望将常规检测外包的制药公司。他们的关键差异化因素在于对数据溯源性的关注——每条指令都被记录，从而为监管合规创建了可验证的监管链。

OpenTrons 以其价格实惠的OT-2液体处理器而闻名，已发布了“Opentrons AI”的测试版，该版本与其Python API集成。由于他们的硬件更简单（单通道移液器，无复杂机器人），翻译问题更容易解决。他们将其定位为教育实验室和小型生物技术公司的工具，价格低于10,000美元。

Google DeepMind 已发表了关于用于科学推理的“思维图谱”的研究，虽然他们尚未宣布产品，但他们在AlphaFold和AlphaProteo上的工作表明，他们将实验室自动化视为一个自然的延伸。他们的方法很可能会涉及

时间归档

延伸阅读

常见问题

这次公司发布“Language as Lab Protocol: How AI Agents Are Automating Scientific Discovery”主要讲了什么？

For decades, the promise of automated laboratories has been held hostage by a single bottleneck: the need for researchers to write code. To run a high-throughput screening or a com…

从“AI agent lab automation open source protocol compiler”看，这家公司的这次发布为什么值得关注？

The breakthrough rests on a three-layer architecture that bridges the semantic gap between human language and machine control. The first layer is the Natural Language Interface (NLI), typically a fine-tuned LLM (e.g., a…

围绕“Emerald Cloud Lab vs Strateos natural language interface comparison”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。