Covenant-72B完成訓練,開啟去中心化AI新時代

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

隨著Covenant-72B預訓練階段的成功完成,AI發展格局已到達一個關鍵的轉折點。這項成就標誌著迄今為止規模最大的、去中心化協作構建尖端大語言模型的努力取得了圓滿成功,整個項目完全在傳統企業超大規模資料中心框架之外運行。該項目通過協調一個由自願參與的全球分散式計算節點組成的網絡,完成了720億參數模型的訓練,為另一種AI未來提供了強有力的概念驗證。

Covenant-72B的成功完成,解決了去中心化機器學習固有的一系列複雜技術挑戰。其核心創新不在於新穎的模型架構,而在於協調層——一套使異構、全球分佈的硬體能夠進行穩定高效訓練的協定、框架和激勵機制。項目結合了具有魯棒性檢查點的異步訓練技術、確保參與者正確執行分配訓練任務的新型可驗證計算協定,以及基於可驗證工作單元和資料品質獎勵貢獻的代幣激勵系統,克服了延遲、節點流失、硬體差異和信任問題。

其結果是,一個720億參數模型的訓練軌跡和最終基準測試性能首次證明,去中心化協調能夠達到此前僅中心化叢集才具備的穩定性。這驗證了一套基於彈性與自願參與而非實體基礎設施資本支出的AI開發新技術棧。

技術分析

Covenant-72B預訓練的完成是一項巨大的工程壯舉,解決了去中心化機器學習固有的一系列複雜技術挑戰。核心創新不在於新穎的模型架構,而在於協調層——一套使異構、全球分佈的硬體能夠進行穩定高效訓練的協定、框架和激勵機制。

傳統大模型訓練依賴於單一資料中心內緊密耦合、高頻寬的互連,以在數千個相同的GPU之間同步梯度。Covenant項目必須克服延遲、節點流失(參與者加入和離開)、硬體差異和信任問題。它通過結合具有魯棒性檢查點的異步訓練技術、一種確保參與者正確執行分配訓練任務的新型可驗證計算協定,以及一個基於可驗證工作單元和資料品質獎勵貢獻的代幣激勵系統,實現了這一目標。

一個關鍵突破是開發了一種容錯的分散式優化器,能夠處理顯著的延遲和部分更新而不會發散。這使得即使網路中有相當一部分節點暫時離線或速度緩慢,模型也能取得進展。此外,該項目實施了先進的資料路由和分片技術,以確保在不可信節點間訓練資料的隱私和完整性,這是處理預訓練所需多樣化資料集的必要條件。

其結果是,一個720億參數模型的訓練軌跡和最終基準測試性能首次證明,去中心化協調能夠達到此前僅中心化叢集才具備的穩定性。這驗證了一套基於彈性與自願參與而非實體基礎設施資本支出的AI開發新技術棧。

行業影響

Covenant-72B的成功在AI行業引發了震動,挑戰了其基本的經濟和運營假設。多年來,主流敘事一直是構建前沿AI需要數十億美元的資料中心資本投入,這為除了資金最雄厚的公司和國家之外的所有參與者創造了難以逾越的護城河。這個項目打破了這種敘事,證明可以調動集體、分散式的資源來實現類似的結果。

最直接的影響是訪問的民主化。獨立研究人員、學術機構和較小的新創公司現在有了一條可行的途徑,可以在不需要企業贊助或雲服務積分的情況下,為前沿規模的模型開發做出貢獻並從中受益。這降低了進行新穎研究和專業化微調的門檻,可能釋放一波在利基和垂直應用領域的創新浪潮,而這些應用對於通用的企業模型來說是不經濟的。

透明度和可審計性成為其固有特性。

More from Hacker News

GPT-Rosalind:OpenAI的生物學AI如何重新定義科學發現OpenAI's introduction of GPT-Rosalind signals a definitive strategic turn in artificial intelligence development. Rather代理疲勞危機:AI編碼助手如何破壞開發者的心流狀態The initial euphoria surrounding AI-powered coding assistants has given way to a sobering reality check across the devel鵜鶘策略:筆記型電腦上的 350 億參數模型如何重新定義 AI 邊緣前線The recent demonstration of a 35-billion parameter model, colloquially referenced in community discussions as the 'PelicOpen source hub2021 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

Routstr協議:去中心化AI推理能否挑戰雲端運算的主導地位?一個名為Routstr的新協議正試圖顛覆中心化的AI基礎設施格局,它創建了一個用於推理計算的去中心化市場。通過點對點網絡將閒置的GPU資源與AI開發者連接起來,Routstr承諾能顯著降低成本,同時提供更靈活的運算能力。主權AI革命:個人計算如何重新掌握智能創造AI發展的核心正從集中式數據中心轉向分散式的個人計算環境。主權AI——即個人在消費級硬體上訓練並控制強大模型的概念——正從邊緣想法轉變為可觸及的現實,這主要得益於演算法的進步。MiniMind 的純 PyTorch GPT 訓練,讓大型語言模型開發民主化一個名為 MiniMind 的新開源專案,正在挑戰「訓練大型語言模型需要專有、工業級基礎設施」的觀念。它提供了一個完全使用標準 PyTorch 編寫、功能完整的端到端 GPT 訓練流程,為研究人員和開發者提供了一個透明的藍圖。Local Cursor的寧靜革命:本地AI代理如何重新定義數位主權人工智慧領域正經歷一場靜默卻深刻的轉變。開源框架Local Cursor的出現,挑戰了主導業界的雲端優先基礎範式。這股邁向裝置端智慧的趨勢,有望帶來前所未有的數位主權與隱私控制。

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。