微软Archai平台发布:将神经架构搜索“工业化”,赋能全球AI研究者

GitHub April 2026
⭐ 483
来源:GitHub归档:April 2026
微软近日推出开源平台Archai,旨在加速神经架构搜索(NAS)研究进程。该框架通过提供工业级的可复现性与高效实验流程,有望显著降低自动化神经网络设计的门槛,让研究人员和工程师能更便捷地为特定任务与硬件寻找最优模型架构。

微软发布的Archai平台,是对自动化机器学习(AutoML)子领域——神经架构搜索(NAS)的一次重要投入,标志着该技术正走向民主化与工业化。NAS专注于通过算法自动发现最优神经网络架构,但长期以来,该领域研究受限于实验周期漫长、代码实现不一致导致结果难以复现、以及新想法与现有方法对比所需工程开销巨大等痛点。Archai的诞生,正是为了系统性地解决这些问题。与以往零散的研究代码库不同,Archai定位为一个统一、可用于生产环境的框架。它集成了DARTS、ProxylessNAS、Once-for-All等多种前沿NAS算法,并将其置于模块化、可扩展的流水线中。其核心价值在于为NAS研究提供端到端的解决方案,从定义搜索空间、运行搜索算法,到训练评估与硬件性能剖析,全部囊括其中。通过标准化实验流程、内置优化训练例程、支持分布式训练以及关键的检查点与实验恢复功能,Archai致力于将研究人员从繁琐的工程工作中解放出来,将精力集中于算法创新本身。此举不仅可能大幅提升NAS领域的研究效率与协作透明度,也预示着微软正通过构建开源基础设施,来吸引顶尖人才、影响研究方向,并确保最先进的网络架构能与其Azure AI云平台及HoloLens等边缘设备生态顺畅兼容。

技术深度解析

Archai的架构设计围绕清晰的职责分离构建,这是其实现可复现、高速研究的首要技术创新。框架由以下几个核心模块构成:

1. 搜索空间: 定义所有可能的神经网络算子与连接组合的“宇宙”。Archai提供了预定义的搜索空间(例如针对卷积网络),同时也允许研究者通过灵活的领域特定语言(DSL)定义自定义空间,这对于探索新颖的基于单元(cell-based)或宏观架构至关重要。
2. 搜索算法: 一个可插拔的模块,承载各类NAS策略。它内置了基于梯度的方法(如DARTS)、强化学习方法以及进化算法等实现。模块化设计意味着更换搜索算法只需对流水线其余部分做最小改动。
3. 训练与评估: 这是Archai兑现“快速”研究承诺的环节。它集成了优化的训练例程、分布式训练支持,以及一个关键特性:检查点与可恢复性。失败的实验可以重启,中间模型会被保存,从而避免了计算资源的灾难性浪费。
4. 基准测试与性能剖析: 平台包含一系列工具,用于评估所发现架构的性能,不仅限于准确率,还包括在目标硬件(CPU、GPU、移动端NPU)上的延迟、内存占用和浮点运算次数(FLOPs)。这使得NAS研究超越了纯学术指标,迈向实际部署标准。

在底层,Archai基于PyTorch构建,并为效率而精心设计。例如,其对DARTS的实现包含了对双层优化过程中内存使用的优化。一个显著的技术亮点是其对可复现性的专注。通过提供严格控制随机种子、数据加载和训练超参数的标准化流水线,Archai旨在终结那个因未公开的工程技巧导致报告性能无法复现的、不可复现的NAS论文时代。

尽管来自Archai团队的完整基准数据仍在陆续发布中,我们可以从其设计目标推断性能收益。下表估算了Archai旨在为研究者带来的、相较于典型的从零开始的研究实现而言的比较优势。

| 研究活动 | 典型的临时性实现 | 使用Archai框架 | 提升倍数(预估) |
|---|---|---|---|
| 实现新NAS算法 | 2-4周 | 2-5天(接入模块) | 设置速度提升4-8倍 |
| 与3种基线方法进行基准对比 | 1-2周(集成难题) | 1-2天(标准化API) | 对比速度提升5-10倍 |
| 复现论文结果 | 通常不可能 | 通过共享配置实现高置信度 | 从0%到>90%的可复现率 |
| 在移动设备上剖析模型 | 手动、易出错 | 通过内置剖析器自动化 | 消除手动工作 |

数据启示: 预期的效率提升并非在于原始计算速度——搜索本身依然成本高昂——而在于研究速度。Archai极大地缩短了“首次实验所需时间”和“进行公平对比所需时间”,这两者正是算法研究中真正的瓶颈。

关键参与者与案例研究

NAS领域拥有多位关键参与者,各自采取不同的战略。Archai作为来自工业实验室的开源、研究优先的框架加入战局。

* Google: 作为先驱,早期推出了NASNet、AmoebaNet等工作,并通过Google Cloud AutoML Vision/NLP以及以设备为中心的MorphNet,将NAS深度集成到其产品生态中。其战略基本是闭环的,专注于为TensorFlow和TPU部署优化架构。
* MIT/Han Lab: Once-for-All (OFA) 网络和ProxylessNAS算法(现已包含在Archai中)源于此。他们的研究重点是硬件感知的效率,以及训练一个无需重新训练即可适配不同硬件约束的单一超网。
* AWS (亚马逊): 提供SageMaker AutoPilot,自动化整个ML流程,包括模型架构选择,但对用户抽象掉了NAS细节。这是一种黑盒化、服务导向的方法。
* 独立开源项目: 微软亚洲研究院的NNI (Neural Network Intelligence) 是一个更广泛的AutoML工具包,包含NAS组件。虽然NNI覆盖面更广,但Archai专门且深度聚焦于NAS,在该细分领域提供了更精密的工具。

Archai的案例研究,本质上就是微软自身对它的使用。该平台很可能支撑着微软内部为优化部署于Azure AI以及HoloLens等边缘设备上的模型而进行的研究。其开源发布是一个经典的“构建平台,培育社区”战略。通过将Archai确立为NAS研究的标准框架,微软得以吸引顶尖人才、影响研究方向,并确保最先进的架构能与其云和边缘平台轻松兼容。

| 框架/平台 | 主导方 | 核心特点 | 战略定位 |
|---|---|---|---|
| Archai | 微软 | 开源、研究优先、模块化、强调可复现性与端到端流程 | 打造NAS研究标准框架,赋能社区,反哺自身生态 |
| Google Cloud AutoML / MorphNet | Google | 紧密集成TensorFlow/TPU,产品化、闭环优化 | 将NAS能力作为云服务与设备优化工具输出 |
| Once-for-All / ProxylessNAS | MIT Han Lab | 学术驱动,硬件感知,超网与高效搜索算法 | 前沿算法创新,关注部署效率 |
| SageMaker AutoPilot | AWS | 全流程自动化黑盒服务,降低用户使用门槛 | 作为托管ML服务的一部分,提供易用性 |
| NNI | 微软亚洲研究院 | 全面的AutoML工具包,涵盖NAS、超参调优等 | 提供广泛的自动化机器学习能力 |

更多来自 GitHub

Mobile-MCP:打破AI代理与智能手机的壁垒,开启自主移动交互新纪元GitHub仓库 mobile-next/mobile-mcp 因解决了AI代理工具链中的一个显著空白而迅速走红,已获得超过4500颗星。该项目是一个专门为移动自动化设计的模型上下文协议服务器,支持跨iOS、Android、模拟器及真实设备Eclipse Codewind 归档:IDE-容器集成早期愿景的终局剖析Eclipse Codewind 是 Eclipse 基金会旗下的开源项目,旨在弥合本地开发环境与云原生容器化部署目标之间的鸿沟。其核心理念优雅而直接:开发者只需在 Visual Studio Code 或 Eclipse Theia 等 Eclipse Codewind 归档事件:一个 IDE 插件的消亡如何揭示云原生开发的深层逻辑eclipse-archived/codewind-eclipse 代码库代表了一次善意但最终未获成功的尝试,其目标是弥合传统桌面 IDE 开发模式与云原生、容器优先的工程需求之间的鸿沟。该插件基于最初由 IBM 倡导的开源 Codewin查看来源专题页GitHub 已收录 668 篇文章

时间归档

April 20261096 篇已发布文章

延伸阅读

ProxylessNAS 深度解析:直接神经架构搜索如何重塑边缘AIProxylessNAS 通过摒弃传统架构搜索中引入偏差的代理任务,实现了自动化神经网络设计的范式转变。该方法能直接针对特定硬件目标进行优化,产出的模型效率比人工设计高出2-3倍。其开源实现为理解这一变革性技术提供了实践入口。Mobile-MCP:打破AI代理与智能手机的壁垒,开启自主移动交互新纪元开源项目 mobile-next/mobile-mcp 正在打破AI代理面临的根本性障碍:智能手机屏幕。通过为移动设备实现模型上下文协议,它为大型语言模型直接感知和操控iOS与Android应用提供了标准化通道。这一基础设施标志着AI助手向Eclipse Codewind 归档:IDE-容器集成早期愿景的终局剖析Eclipse 基金会将 Codewind 项目归档,标志着一项将容器化开发深度集成至 IDE 的宏伟愿景悄然落幕。本文深度解析:为何这款曾直击开发者痛点的云原生效率工具最终未能存活,其遗产又将如何影响开发者体验的未来走向。Eclipse Codewind 归档事件:一个 IDE 插件的消亡如何揭示云原生开发的深层逻辑Eclipse 基金会决定将 Codewind for Eclipse IDE 插件归档,这标志着开发者工具领域一个静默却关键的转折点。该项目曾致力于将云原生应用开发直接带入 Eclipse IDE,其停止活跃开发凸显了将现代化容器化工作流

常见问题

GitHub 热点“Microsoft's Archai Platform Democratizes Neural Architecture Search for AI Researchers”主要讲了什么?

Microsoft's Archai represents a significant investment in democratizing and industrializing Neural Architecture Search (NAS), a subfield of automated machine learning (AutoML) focu…

这个 GitHub 项目在“How does Microsoft Archai compare to Google AutoML for custom model design?”上为什么会引发关注?

Archai's architecture is built around a clean separation of concerns, which is its primary technical innovation for enabling reproducible and fast research. The framework is structured into several core modules: 1. Searc…

从“Can Archai be used for neural architecture search on a budget with limited GPUs?”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 483,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。