技術分析
Covenant-72B預訓練的完成是一項巨大的工程壯舉,解決了去中心化機器學習固有的一系列複雜技術挑戰。核心創新不在於新穎的模型架構,而在於協調層——一套使異構、全球分佈的硬體能夠進行穩定高效訓練的協定、框架和激勵機制。
傳統大模型訓練依賴於單一資料中心內緊密耦合、高頻寬的互連,以在數千個相同的GPU之間同步梯度。Covenant項目必須克服延遲、節點流失(參與者加入和離開)、硬體差異和信任問題。它通過結合具有魯棒性檢查點的異步訓練技術、一種確保參與者正確執行分配訓練任務的新型可驗證計算協定,以及一個基於可驗證工作單元和資料品質獎勵貢獻的代幣激勵系統,實現了這一目標。
一個關鍵突破是開發了一種容錯的分散式優化器,能夠處理顯著的延遲和部分更新而不會發散。這使得即使網路中有相當一部分節點暫時離線或速度緩慢,模型也能取得進展。此外,該項目實施了先進的資料路由和分片技術,以確保在不可信節點間訓練資料的隱私和完整性,這是處理預訓練所需多樣化資料集的必要條件。
其結果是,一個720億參數模型的訓練軌跡和最終基準測試性能首次證明,去中心化協調能夠達到此前僅中心化叢集才具備的穩定性。這驗證了一套基於彈性與自願參與而非實體基礎設施資本支出的AI開發新技術棧。
行業影響
Covenant-72B的成功在AI行業引發了震動,挑戰了其基本的經濟和運營假設。多年來,主流敘事一直是構建前沿AI需要數十億美元的資料中心資本投入,這為除了資金最雄厚的公司和國家之外的所有參與者創造了難以逾越的護城河。這個項目打破了這種敘事,證明可以調動集體、分散式的資源來實現類似的結果。
最直接的影響是訪問的民主化。獨立研究人員、學術機構和較小的新創公司現在有了一條可行的途徑,可以在不需要企業贊助或雲服務積分的情況下,為前沿規模的模型開發做出貢獻並從中受益。這降低了進行新穎研究和專業化微調的門檻,可能釋放一波在利基和垂直應用領域的創新浪潮,而這些應用對於通用的企業模型來說是不經濟的。
透明度和可審計性成為其固有特性。