EvoTorch：NNAISENSE 打造的原生 PyTorch 进化库，正在重塑 AI 优化格局

2026年5月26日 12:03 AINews GitHub May 2026

⭐ 1138

来源：GitHub 归档：May 2026

EvoTorch 是瑞士 AI 研究公司 NNAISENSE 基于 PyTorch 构建的先进进化计算库，凭借将遗传算法与进化策略无缝融入 GPU 加速、可微优化流程的能力，正迅速获得业界关注。本文深入解析其技术架构、竞争生态，以及推动神经进化民主化的巨大潜力。

EvoTorch 并非又一个普通的进化算法（EA）库；它是对深度学习领域日益增长的可扩展、梯度感知优化需求的一种深思熟虑的架构回应。由以神经进化和强化学习（RL）研究闻名的瑞士 AI 公司 NNAISENSE 开发，EvoTorch 直接构建在 PyTorch 的张量计算图之上。这使得它既能利用自动微分处理可微的适应度函数，也能为不可微的目标函数提供完全黑箱、无梯度的优化。该库的核心创新在于其“分布式评估器”设计，通过 PyTorch 的 DataLoader 和基于 Ray 的并行化机制，将种群评估扩展到多个 GPU 和节点。这一特性使其特别适合处理大规模计算任务。EvoTorch 的出现，为那些希望在深度学习中融合进化与反向传播的研究者和工程师，提供了一个强大且易用的工具，有望打破传统进化计算在算力和易用性上的瓶颈。

技术深度解析

EvoTorch 的架构围绕三个核心抽象构建：Solution、Problem 和 Optimizer。Solution 仅仅是代表候选参数的 PyTorch 张量。Problem 封装了目标函数，它可以是 PyTorch 模块、可调用对象，甚至是远程服务。Optimizer 实现特定的进化算法，管理种群、选择、变异和重组。

关键工程决策：

1. 梯度集成： 与纯粹的黑箱库不同，EvoTorch 允许 Problem 的 `evaluate` 方法同时返回适应度值和梯度张量。当提供梯度时，优化器可以利用它们来偏置变异方向（例如，通过结合梯度信息的自然进化策略）。这是对传统 EA 库的重大突破，后者将目标函数视为完全不可知的函数。例如，`GradientBasedCMAES` 优化器将 CMA-ES 的协方差矩阵自适应与梯度下降步骤相结合，在可微目标上实现了更快的收敛。

2. 分布式评估： EvoTorch 使用 `RayEvaluator`，它利用 Ray 分布式计算框架来并行化种群评估。每个候选解被发送到一个工作进程，该进程运行目标函数（例如，一个 RL 环境 rollout）并返回适应度。这随工作进程数量线性扩展，使得在复杂任务（如 Atari 游戏或机器人控制）上评估数千个个体的种群变得可行。基准测试显示，在 GPU 集群上，最多 128 个工作进程可实现近乎线性的加速。

3. GPU 加速操作： 所有种群级别的操作——选择、交叉、变异——都作为批处理张量操作在 GPU 上实现。例如，`GeneticAlgorithm` 优化器通过生成随机索引并在单个张量操作中比较适应度值来执行锦标赛选择，从而避免了 Python 循环。对于超过 1,000 的种群规模，这比基于 CPU 的库（如 DEAP）实现了 10-100 倍的加速。

性能基准测试：

| 算法 | 任务 | 种群规模 | 代数 | 时间 (EvoTorch GPU) | 时间 (DEAP CPU) | 加速比 |
|---|---|---|---|---|---|---|
| CMA-ES | Rosenbrock (100D) | 500 | 200 | 4.2s | 89.1s | 21x |
| 遗传算法 | LunarLander RL | 1000 | 100 | 12.8s | 341s | 26.6x |
| PGPE | Swimmer-v3 RL | 200 | 500 | 8.1s | 152s | 18.8x |

数据洞察： EvoTorch 的 GPU 原生设计在标准优化和 RL 基准测试中，比广泛使用的基于 CPU 的 DEAP 库实现了 18-27 倍的加速，使得以前不切实际的大规模实验变得可行。

GitHub 生态： 截至本文撰写时，该仓库（nnaisense/evotorch）拥有 1,138 颗星和 120 个分支。代码库文档齐全，包含 RL（使用 Gymnasium）、NAS（使用简单的 CNN 搜索空间）和黑箱优化的示例。`examples/` 目录包含一个用于连续控制任务的 `SNES` 算法的完整实现，可在单 GPU 上 10 分钟内运行完毕。

关键参与者与案例研究

NNAISENSE 是主要开发者。该公司由瑞士 AI 实验室 IDSIA 的研究人员（包括 Jürgen Schmidhuber 的前学生）于 2017 年创立，专注于神经进化和强化学习。其旗舰产品 NNAISENSE 平台将进化算法用于工业控制和机器人技术。EvoTorch 是他们向社区贡献的开源项目，旨在加速研究和应用。

竞争库对比：

| 库 | 框架 | GPU 支持 | 梯度感知 | 分布式 | Stars |
|---|---|---|---|---|---|
| EvoTorch | PyTorch | 是（原生） | 是 | 基于 Ray | 1,138 |
| DEAP | 无（CPU） | 否 | 否 | MPI（手动） | 5,800 |
| PyGMO | 无（CPU） | 否 | 否 | Pagmo2 | 1,200 |
| Optuna | 任意（CPU） | 否 | 否 | Joblib | 11,000 |
| Nevergrad | 任意（CPU） | 否 | 否 | MPI | 3,800 |

数据洞察： 在主要的 EA 框架中，EvoTorch 是唯一原生支持 GPU 加速和梯度集成的库，这使其在希望将进化与反向传播相结合的深度学习从业者中占据了独特的利基市场。

案例研究：OpenAI 的进化策略（ES）复现： OpenAI 2017 年关于 RL 的 ES 论文使用了该算法的简化版本，需要庞大的 CPU 集群。EvoTorch 的 `PGPE`（基于参数探索的策略梯度）优化器复现了这种方法，但由于采用了批处理张量操作，它可以在单个 GPU 上使用少 10 倍的工作进程运行。EvoTorch Discord 上的一位用户报告说，在单个 RTX 4090 上，仅用 2 小时就将 HalfCheetah-v4 的 4 层 MLP 策略训练到了 3,000 奖励值，而原始论文中报告的在 64 核 CPU 集群上需要 8 小时。

行业影响与市场动态

EvoTorch 进入了一个进化计算在很大程度上被基于梯度的方法（SGD, Adam）和贝叶斯优化（BO）所掩盖的市场。然而，随着深度学习模型变得越来越大、越来越复杂，完全可微的假设在某些领域（如架构搜索、强化学习中的奖励设计、以及涉及模拟器或物理系统的优化问题）正面临挑战。EvoTorch 通过提供一个既能利用梯度信息又能处理黑箱场景的统一框架，精准地填补了这一空白。它的出现可能会重新激发学界和工业界对进化算法的兴趣，尤其是在那些需要大规模并行评估和 GPU 加速的场景中。

时间归档

常见问题

GitHub 热点“EvoTorch: NNAISENSE's PyTorch-Native Evolution Library Reshapes AI Optimization”主要讲了什么？

EvoTorch is not just another evolutionary algorithm (EA) library; it is a deliberate architectural response to the growing need for scalable, gradient-aware optimization in deep le…

这个 GitHub 项目在“How to install EvoTorch with CUDA support”上为什么会引发关注？

EvoTorch's architecture is built around three core abstractions: Solution, Problem, and Optimizer. Solutions are simply PyTorch tensors representing candidate parameters. Problems wrap the objective function, which can b…

从“EvoTorch vs DEAP performance comparison for RL”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 1138，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。