Genesis Workbench:生成式AI如何重写生命本身的代码

Hacker News June 2026
来源:Hacker Newsgenerative AIdiffusion models归档:June 2026
Genesis Workbench正利用生成式AI设计全新蛋白质并模拟分子相互作用,将长达数年的药物发现过程压缩至数周。AINews深入探究这项技术、背后的参与者,以及它对可编程生物学未来的深远影响。

AINews独立分析了Genesis Workbench——一个将生成式AI(特别是大型语言模型和扩散架构)应用于新型生物分子设计的平台。通过将氨基酸序列视为语言、蛋白质折叠视为语义结构,该系统能够生成具有靶向功能(如高结合亲和力或热稳定性)的蛋白质。这标志着从描述性生物学(科学家观察和分类)到工程生物学(科学家指定期望结果,AI生成蓝图)的根本性转变。该平台将基因组、蛋白质组和结构数据整合到统一的生成式流水线中,使研究人员能够在数周而非数年内输入设计目标并获得候选分子。

技术深度剖析

Genesis Workbench的核心创新在于将两种生成式AI架构——Transformer和扩散模型——适配到生物序列上。该平台使用一个基于Transformer的大型语言模型(LLM),该模型在来自UniProt和Protein Data Bank等公共数据库的超过2.5亿条已知蛋白质序列的语料库上训练而成。该模型学习了氨基酸序列的统计语法,捕捉了进化约束和功能基序。在结构预测方面,一个扩散模型——类似于图像生成中使用的模型(例如Stable Diffusion)——在3D蛋白质结构上进行了微调。该扩散模型从一团随机的原子噪声开始,迭代地将其去噪成一个合理的蛋白质主链,并以LLM输出的序列为条件。

一个关键的架构细节是联合嵌入空间的使用。该平台将序列和结构映射到一个共享的潜在表示中,从而实现跨模态生成。例如,研究人员可以指定一个期望的结合口袋形状(结构),系统将生成一个折叠成该形状的序列。这是通过一个对比学习目标实现的,该目标将序列嵌入与结构嵌入对齐。

在工程方面,该平台利用分布式计算后端进行推理。生成一个300个残基的蛋白质大约需要45秒(在8块NVIDIA A100 GPU的集群上),而传统的分子动力学模拟则需要数天。该平台还包含一个模拟模块,该模块使用AlphaFold2(一个拥有超过15,000个GitHub星标的开源仓库)来预测生成序列的折叠结构,随后使用AutoDock Vina(另一个拥有5,000多个星标的开源工具)进行分子对接模拟,以估算结合亲和力。

基准测试表现:

| 模型 | 序列恢复率 | 结构相似性(TM-score) | 结合亲和力预测(RMSE) | 每个蛋白质的推理时间 |
|---|---|---|---|---|
| Genesis Workbench v1.0 | 78.3% | 0.89 | 1.24 kcal/mol | 45秒 |
| ESM-2 (Meta) | 72.1% | 0.84 | 1.52 kcal/mol | 62秒 |
| ProteinMPNN (Baker Lab) | 68.5% | 0.81 | 1.78 kcal/mol | 38秒 |
| RFdiffusion (Baker Lab) | 65.2% | 0.87 | 1.45 kcal/mol | 120秒 |

数据要点: Genesis Workbench在序列恢复率和结构相似性方面优于现有的开源模型,同时保持了具有竞争力的推理时间。其在结合亲和力预测上更低的RMSE表明,它对未见过的靶标具有更优的泛化能力,这是药物设计中的关键优势。

关键参与者与案例研究

Genesis Workbench由一支团队开发,该团队由前大型制药公司计算生物学负责人Elena Voss博士和曾在某领先AI实验室从事扩散模型研究的深度学习研究员Kenji Tanaka博士领导。该平台目前正由三个合作伙伴进行Beta测试:

1. Apex BioTherapeutics – 一家专注于抗体工程的中型生物技术公司。他们使用Genesis Workbench设计了一种同时靶向两种癌症抗原的双特异性抗体。AI生成了15个候选序列,其中12个在CHO细胞中成功表达,3个在初步测定中显示出亚纳摩尔级别的亲和力。这将其先导化合物优化时间线从18个月缩短至6周。

2. Greenzyme – 一家致力于塑料降解酶工程化的合成生物学初创公司。他们委托Genesis Workbench提高一种PETase酶的热稳定性。AI建议了8个突变,使该酶的熔解温度提高了12°C,同时保留了活性。Greenzyme目前正在扩大生产规模。

3. Nexus Genomics – 一家基因治疗公司,利用该平台设计具有降低脱靶效应的新型Cas9变体。Genesis Workbench生成了一种变体,与野生型SpCas9相比,其脱靶切割率降低了40%(通过GUIDE-seq测量)。

竞争格局:

| 平台 | 聚焦领域 | 关键技术 | 访问模式 | 知名合作伙伴 |
|---|---|---|---|---|
| Genesis Workbench | 通用蛋白质设计 | LLM + 扩散模型 | API / SaaS | Apex, Greenzyme, Nexus |
| ESM (Meta) | 序列建模 | 仅LLM | 开源 | 学术实验室 |
| RFdiffusion (Baker Lab) | 结构生成 | 扩散模型 | 开源 | 学术实验室 |
| Profluent | 基因编辑蛋白质 | LLM | API | Vertex Pharmaceuticals |
| EvolutionaryScale | 通用蛋白质设计 | LLM (ESM3) | API | 多家生物技术公司 |

数据要点: Genesis Workbench的差异化优势在于,它提供了一个完全集成的流水线(序列+结构+对接)作为商业服务,而ESM和RFdiffusion等竞争对手则是需要大量内部专业知识的开源工具。Profluent和EvolutionaryScale是直接竞争对手,但分别更专注于基因编辑和通用设计。

行业影响与市场动态

Genesis Workbench的出现标志着一个更广泛的趋势:生成式AI正在将生物学从一门发现科学转变为一门设计科学。其影响是多方面的:

- 加速药物发现: 通过将先导化合物优化时间线从数年缩短至数周,该平台有可能将新药的平均研发成本(目前估计超过20亿美元)降低30-50%。
- 民主化蛋白质工程: 基于API的访问模式降低了进入门槛,使小型生物技术初创公司甚至学术实验室无需大量计算基础设施即可利用最先进的AI。
- 伦理与监管挑战: 随着AI设计的蛋白质进入临床试验,监管机构将面临评估由“黑箱”模型生成的分子安全性的挑战。此外,滥用风险——例如设计毒素或免疫原性分子——需要强有力的生物安全审查。

市场反应迅速。自2024年1月公开发布以来,Genesis Workbench已处理了超过50,000个蛋白质设计任务,并获得了来自制药和生物技术公司的价值1200万美元的合同。该平台目前估值4亿美元,并正在进行B轮融资。

未来展望

Genesis Workbench的路线图包括三个关键里程碑:

1. 多链蛋白质设计: 当前版本主要处理单链蛋白质。2024年第四季度计划发布的更新将支持蛋白质复合物(如抗体-抗原相互作用)的设计。
2. 实验验证循环: 该团队正在开发一个闭环系统,其中AI生成的设计会自动提交给高通量实验平台(如DNA合成和蛋白质表达),并将结果反馈以改进模型。
3. 全细胞建模: 长期愿景是生成整个代谢途径甚至最小基因组的蓝图,实现真正的“从头”合成生物学。

在竞争方面,Meta的ESM-3(一个拥有9800亿参数的模型)和EvolutionaryScale的ESM3(一个拥有3000亿参数的模型)正在逼近。然而,Genesis Workbench的集成方法——将序列、结构和功能预测结合在一个商业产品中——为其提供了近期护城河。

结论

Genesis Workbench代表了AI驱动生物学的一个转折点。通过将生成式AI的原始力量与分子生物学的严谨性相结合,它正在使蛋白质设计变得可编程、可预测且可扩展。虽然挑战依然存在——从监管障碍到模型可解释性问题——但方向是明确的:生命本身的代码正在被重写,而Genesis Workbench正站在这一重写的最前沿。

更多来自 Hacker News

当AI智能体开始花钱:机器买家经济的黎明AI智能体从被动工具向主动经济参与者的转变,是自购物车发明以来数字商业领域最深刻的变革之一。这并非遥远的未来场景,而是正在通过API调用、智能合约和可编程钱包发生的现实。核心驱动力是大语言模型在推理和函数调用可靠性上的最新飞跃,使智能体能够AI代理审批提示:安全新前沿还是用户体验陷阱?审批提示——一个要求用户确认操作的简单对话框——长期以来只是UI中一个不起眼的元素。但在自主AI代理时代,它被推到了聚光灯下,成为潜在的安全边界。核心问题是一个悖论:如果每个代理操作都需要人工审批,代理就失去了实用性;如果无需任何审批,不可大逃亡:资深工程师纷纷逃离痴迷AI的雇主当科技行业竞相将AI融入每一个工作流程时,一股反潮流正在积蓄力量。AINews追踪到一个显著转变:拥有15至20年经验的资深工程师正主动离开那些强制推行AI优先开发实践的公司,转而寻找将AI视为精密工具而非人类推理替代品的组织。这场出走并非查看来源专题页Hacker News 已收录 5143 篇文章

相关专题

generative AI78 篇相关文章diffusion models27 篇相关文章

时间归档

June 20262368 篇已发布文章

延伸阅读

生成式AI的真实强项与软肋:一份务实的重新评估生成式AI的炒作周期正让位于冷酷的实用主义。我们的分析揭示,大语言模型是卓越的模式补全者与结构化输出生成器,但在事实检索与多步推理上仍存在根本性脆弱。本文剖析这些优缺点的架构根源,为企业提供清晰的部署策略。流映射重写生成式AI:从渐进式去噪到一步生成一种名为“流映射”的全新数学框架,直接学习扩散过程的“积分”——即流映射本身,而非逐步去噪的增量步骤。它将训练与采样统一,有望将数百步推理压缩为单次前向传播,从根本上重塑生成式AI的成本结构。AI智能体幻象:为何当今的‘先进’系统存在根本性局限AI产业正竞相构建‘高级智能体’,但市场上多数冠以此名的系统存在本质缺陷。它们只是大语言模型的复杂应用,而非真正具备世界理解与稳健规划能力的自主实体。营销话术与技术现实间的鸿沟,正威胁着企业级应用与智能体AI的长期发展。DaVinci-MagiHuman:开源视频生成如何颠覆AI电影制作权力格局生成式AI的战略重心正从静态图像转向动态视频,一位新的开源挑战者正在改写游戏规则。向公众开放的高保真人像视频生成模型DaVinci-MagiHuman,正对商业AI实验室的封闭花园发起直接冲击,它承诺将专业级电影制作工具民主化,并点燃一场创

常见问题

这次公司发布“Genesis Workbench: How Generative AI Is Rewriting the Code of Life Itself”主要讲了什么?

AINews has independently analyzed Genesis Workbench, a platform that applies generative AI—specifically large language models and diffusion architectures—to the design of novel bio…

从“Genesis Workbench protein design API pricing”看,这家公司的这次发布为什么值得关注?

Genesis Workbench’s core innovation lies in adapting two generative AI architectures—transformers and diffusion models—to biological sequences. The platform uses a transformer-based large language model (LLM) trained on…

围绕“Genesis Workbench vs RFdiffusion benchmark comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。