Covenant-72B achève son entraînement, ouvrant l'ère de l'IA décentralisée

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

Le paysage du développement de l'IA a atteint un point d'inflexion décisif avec l'achèvement réussi de la phase de pré-entraînement de Covenant-72B. Cette réalisation représente l'aboutissement de l'effort collaboratif et décentralisé le plus important jamais entrepris pour construire un grand modèle de langage de pointe, fonctionnant entièrement en dehors du cadre traditionnel des centres de données hyperscale des entreprises. En coordonnant l'entraînement d'un modèle de 72 milliards de paramètres sur un réseau mondial et volontaire de nœuds de calcul distribués, le projet a fourni une preuve de concept puissante pour un avenir alternatif de l'IA. Covenant-72B.

Analyse technique

L'achèvement du pré-entraînement de Covenant-72B est un exploit d'ingénierie monumental qui résout une série de défis techniques complexes inhérents à l'apprentissage automatique décentralisé. L'innovation principale ne réside pas dans une nouvelle architecture de modèle, mais dans la couche d'orchestration — l'ensemble des protocoles, frameworks et mécanismes d'incitation qui ont permis un entraînement stable et efficace sur du matériel hétérogène et mondialement distribué.

L'entraînement traditionnel des grands modèles repose sur des interconnexions à haut débit et étroitement couplées au sein d'un seul centre de données pour synchroniser les gradients sur des milliers de GPU identiques. Le projet Covenant a dû surmonter la latence, la volatilité des nœuds (participants qui rejoignent et quittent), la variance matérielle et les problèmes de confiance. Il y est parvenu grâce à une combinaison de techniques d'entraînement asynchrones avec des points de contrôle robustes, un nouveau protocole de calcul vérifiable pour garantir que les participants exécutaient correctement leurs tâches d'entraînement assignées, et un système d'incitation basé sur des tokens qui récompense la contribution en fonction d'unités de travail vérifiables et de la qualité des données.

Une percée critique a été le développement d'un optimiseur distribué tolérant aux pannes, capable de gérer des retards significatifs et des mises à jour partielles sans diverger. Cela permet au modèle de progresser même lorsqu'une partie importante du réseau est temporairement hors ligne ou lente. De plus, le projet a mis en œuvre un routage et un partitionnement avancés des données pour garantir la confidentialité et l'intégrité des données d'entraînement sur des nœuds non fiables, une nécessité pour traiter les ensembles de données divers requis pour le pré-entraînement.

Le résultat est un modèle de 72 milliards de paramètres dont la trajectoire d'entraînement et les performances finales sur les benchmarks démontrent que la coordination décentralisée peut, pour la première fois, égaler la stabilité auparavant exclusive aux clusters centralisés. Cela valide une nouvelle pile technique pour le développement de l'IA, construite sur la résilience et la participation volontaire plutôt que sur des dépenses en capital en infrastructure physique.

Impact sur l'industrie

Le succès de Covenant-72B envoie des ondes de choc à travers l'industrie de l'IA, remettant en question ses hypothèses économiques et opérationnelles fondamentales. Pendant des années, le discours a été que la construction d'une IA de pointe nécessitait des milliards en capital pour les centres de données, créant un fossé infranchissable pour tous sauf les entreprises et nations les mieux financées. Ce projet démolit ce récit, prouvant que des ressources collectives et distribuées peuvent être mobilisées pour atteindre un résultat similaire.

L'impact immédiat est la démocratisation de l'accès. Les chercheurs indépendants, les institutions académiques et les petites startups ont désormais une voie viable pour contribuer au développement de modèles à l'échelle de la pointe et en bénéficier, sans avoir besoin de parrainage d'entreprise ou de crédits cloud. Cela abaisse la barrière à l'entrée pour la recherche novatrice et le fine-tuning spécialisé, libérant potentiellement une vague d'innovation dans des applications de niche et verticales qui ne sont pas rentables pour les modèles d'entreprise généralistes.

La transparence et la vérifiabilité deviennent des caractéristiques inhérentes

More from Hacker News

UntitledAnthropic's Claude Code has been widely praised for its 'extended thinking' feature, which promises to tackle complex prUntitledSpookling is not just another AI feature; it is a paradigm shift in how artificial intelligence interacts with our digitUntitledA hardware engineer and security researcher has released Revenant, a groundbreaking reverse engineering toolkit that harOpen source hub5062 indexed articles from Hacker News

Related topics

decentralized AI62 related articlesopen source AI225 related articleslarge language model81 related articles

Archive

March 20262347 published articles

Further Reading

The Open Source AI Deadline: December 3, 2026, and the End of API DominanceA single date—December 3, 2026—has emerged as a focal point for the open source AI community. This is not a random guessLes Clusters d'Agents AI Locaux d'Edster Défient la Domination du Cloud dans les Systèmes AutonomesLe projet open-source Edster a lancé un changement de paradigme dans l'autonomie de l'IA en permettant à des clusters muL'architecture Meshcore émerge : Les réseaux d'inférence P2P décentralisés peuvent-ils défier l'hégémonie de l'IA ?Un nouveau cadre architectural appelé Meshcore gagne du terrain, proposant une alternative radicale aux services cloud dLa révolution du GPU domestique : comment le calcul distribué démocratise l'infrastructure IAUne révolution silencieuse est en cours dans les sous-sols et les salles de jeu des passionnés de technologie du monde e

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。