Covenant-72B完成训练,开启去中心化AI新时代

Hacker News March 2026
来源:Hacker Newsdecentralized AIopen source AIlarge language model归档:March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

随着Covenant-72B预训练阶段的成功完成,AI发展格局已到达一个关键的转折点。这一成就标志着迄今为止规模最大的、去中心化协作构建尖端大语言模型的努力取得了圆满成功,整个项目完全在传统企业超大规模数据中心框架之外运行。该项目通过协调一个由自愿参与的全球分布式计算节点组成的网络,完成了720亿参数模型的训练,为另一种AI未来提供了强有力的概念验证。

Covenant-72B的成功完成,解决了去中心化机器学习固有的一系列复杂技术挑战。其核心创新不在于新颖的模型架构,而在于协调层——一套使异构、全球分布的硬件能够进行稳定高效训练的协议、框架和激励机制。项目结合了具有鲁棒性检查点的异步训练技术、确保参与者正确执行分配训练任务的新型可验证计算协议,以及基于可验证工作单元和数据质量奖励贡献的代币激励系统,克服了延迟、节点流失、硬件差异和信任问题。

其结果是,一个720亿参数模型的训练轨迹和最终基准测试性能首次证明,去中心化协调能够达到此前仅中心化集群才具备的稳定性。这验证了一套基于弹性与自愿参与而非物理基础设施资本支出的AI开发新技术栈。

技术分析

Covenant-72B预训练的完成是一项巨大的工程壮举,解决了去中心化机器学习固有的一系列复杂技术挑战。核心创新不在于新颖的模型架构,而在于协调层——一套使异构、全球分布的硬件能够进行稳定高效训练的协议、框架和激励机制。

传统大模型训练依赖于单一数据中心内紧密耦合、高带宽的互连,以在数千个相同的GPU之间同步梯度。Covenant项目必须克服延迟、节点流失(参与者加入和离开)、硬件差异和信任问题。它通过结合具有鲁棒性检查点的异步训练技术、一种确保参与者正确执行分配训练任务的新型可验证计算协议,以及一个基于可验证工作单元和数据质量奖励贡献的代币激励系统,实现了这一目标。

一个关键突破是开发了一种容错的分布式优化器,能够处理显著的延迟和部分更新而不会发散。这使得即使网络中有相当一部分节点暂时离线或速度缓慢,模型也能取得进展。此外,该项目实施了先进的数据路由和分片技术,以确保在不可信节点间训练数据的隐私和完整性,这是处理预训练所需多样化数据集的必要条件。

其结果是,一个720亿参数模型的训练轨迹和最终基准测试性能首次证明,去中心化协调能够达到此前仅中心化集群才具备的稳定性。这验证了一套基于弹性与自愿参与而非物理基础设施资本支出的AI开发新技术栈。

行业影响

Covenant-72B的成功在AI行业引发了震动,挑战了其基本的经济和运营假设。多年来,主流叙事一直是构建前沿AI需要数十亿美元的数据中心资本投入,这为除了资金最雄厚的公司和国家之外的所有参与者创造了难以逾越的护城河。这个项目打破了这种叙事,证明可以调动集体、分布式的资源来实现类似的结果。

最直接的影响是访问的民主化。独立研究人员、学术机构和较小的初创公司现在有了一条可行的途径,可以在不需要企业赞助或云服务积分的情况下,为前沿规模的模型开发做出贡献并从中受益。这降低了进行新颖研究和专业化微调的门槛,可能释放一波在利基和垂直应用领域的创新浪潮,而这些应用对于通用的企业模型来说是不经济的。

透明度和可审计性成为其固有特性。

更多来自 Hacker News

多智能体 AI 系统革命性重塑自动化漏洞发现格局网络安全格局正经历由多智能体大语言模型系统驱动的根本性变革。传统的漏洞扫描严重依赖静态签名和基于规则的引擎,往往产生高误报率,需要大量人工分类并延误修复工作,导致安全团队负担过重且响应滞后。新兴范式引入了协作式 AI 智能体,战略性地在扫描Webflow 祭出“代理优先”架构,无代码 Web 开发迎来范式革命Webflow 正在执行一次基础设施的根本性 pivot,其战略重心已从视觉设计工具转向成为新兴代理经济的首要编排层。这一转型重新定义了网站的本质:从静态的展示层转变为动态的、机器可读的接口,具备自主协商交易的能力。通过直接将语义元数据嵌入后 Web 时代:AI Agent 弃用 HTTPS 转向轻量级协议支撑人工智能的数字基础设施正在经历一场静默却深刻的转型,这场变革虽未大张旗鼓,却影响深远。随着自主 Agent 成为在线信息的主要消费者,专为人类视觉消费设计的现代 Web 遗留架构正日益显得过时,无法适应自动化流程的高吞吐要求。沉重的 J查看来源专题页Hacker News 已收录 4054 篇文章

相关专题

decentralized AI56 篇相关文章open source AI195 篇相关文章large language model59 篇相关文章

时间归档

March 20262347 篇已发布文章

延伸阅读

Edster本地AI智能体集群崛起,挑战云端主导的自治系统格局开源项目Edster通过实现复杂多智能体集群完全在本地硬件上运行,开启了AI自治的新范式。这一进展直接挑战了以云为中心的AI服务模式,为探索去中心化智能系统的开发者和研究者提供了前所未有的隐私保护、成本控制与定制化能力。Meshcore架构崛起:去中心化P2P推理网络能否挑战AI霸权?一种名为Meshcore的新型架构框架正引发关注,它提出了一种颠覆集中式AI云服务的激进替代方案。通过将消费级GPU和专用芯片组织成点对点推理网络,其旨在实现大语言模型的民主化访问、大幅降低成本并培育以隐私为核心的应用生态。家庭GPU革命:分布式计算如何重塑AI基础设施民主化格局一场静默的革命正在全球科技爱好者的地下室与游戏房中酝酿。受SETI@home精神遗产启发,新兴分布式计算平台正汇聚闲置消费级GPU算力,为AI时代构建去中心化的超级计算机。这场运动有望打破超大规模云服务商的垄断,让计算资源回归大众。Routstr协议:去中心化AI推理能否挑战云计算霸权?一项名为Routstr的新协议正试图通过创建一个去中心化的推理计算市场,颠覆由巨头主导的集中式AI基础设施格局。它通过点对点网络连接闲置GPU资源与AI开发者,承诺在显著降低成本的同时,增强系统对云寡头垄断的抵御韧性。

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。