Covenant-72B Eğitimini Tamamladı, Merkeziyetsiz AI Çağını Başlatıyor

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

AI geliştirme ekosistemi, Covenant-72B'nin ön eğitim aşamasının başarıyla tamamlanmasıyla kritik bir dönüm noktasına ulaştı. Bu başarı, geleneksel kurumsal hiper ölçekli veri merkezleri çerçevesinin tamamen dışında çalışan, en gelişmiş büyük dil modelini oluşturmak için yapılan en büyük merkeziyetsiz, işbirlikçi çabanın doruk noktasını temsil ediyor. Gönüllü, küresel bir dağıtık bilgi işlem düğümleri ağı üzerinde 72 milyar parametreli bir modelin eğitimini koordine ederek, proje alternatif bir AI geleceği için güçlü bir kavram kanıtı sundu.

Teknik Analiz

Covenant-72B'nin ön eğitiminin tamamlanması, merkeziyetsiz makine öğrenimine özgü bir dizi karmaşık teknik zorluğu çözen anıtsal bir mühendislik başarısıdır. Temel yenilik, yeni bir model mimarisinde değil, heterojen, küresel olarak dağıtılmış donanım üzerinde istikrarlı ve verimli eğitimi mümkün kılan protokoller, çerçeveler ve teşvik mekanizmalarından oluşan orkestrasyon katmanındadır.

Geleneksel büyük model eğitimi, binlerce özdeş GPU arasında gradyanları senkronize etmek için tek bir veri merkezi içindeki sıkı bağlı, yüksek bant genişlikli bağlantılara dayanır. Covenant projesi, gecikme, düğüm değişimi (katılımcıların katılması ve ayrılması), donanım çeşitliliği ve güven sorunlarının üstesinden gelmek zorundaydı. Bunu, sağlam kontrol noktası oluşturma ile asenkron eğitim tekniklerinin birleşimi, katılımcıların kendilerine atanan eğitim görevlerini doğru şekilde yürüttüğünden emin olmak için yeni bir doğrulanabilir hesaplama protokolü ve katkıyı doğrulanabilir iş birimleri ve veri kalitesine dayanarak ödüllendiren token tabanlı bir teşvik sistemi ile başardı.

Kritik bir atılım, önemli gecikmeleri ve kısmi güncellemeleri ıraksamadan işleyebilen hata toleranslı dağıtık bir optimize edicinin geliştirilmesiydi. Bu, ağın önemli bir kısmı geçici olarak çevrimdışı veya yavaş olsa bile modelin ilerleme kaydetmesini sağlar. Ayrıca proje, ön eğitim için gereken çeşitli veri kümelerini işlemek için bir gereklilik olan, güvenilmeyen düğümler arasında eğitim verilerinin gizliliğini ve bütünlüğünü sağlamak amacıyla gelişmiş veri yönlendirme ve parçalama uyguladı.

Sonuç, eğitim süreci ve nihai kıyaslama performansı, merkeziyetsiz koordinasyonun ilk kez daha önce yalnızca merkezi kümlelere özgü olan istikrara denk gelebileceğini gösteren 72B parametreli bir modeldir. Bu, fiziksel altyapıya yapılan sermaye harcaması yerine dayanıklılık ve gönüllü katılım üzerine inşa edilmiş yeni bir AI geliştirme yazılım yığınını doğrulamaktadır.

Endüstri Etkisi

Covenant-72B'nin başarısı, AI endüstrisinde sismik dalgalar yaratıyor ve temel ekonomik ve operasyonel varsayımları sorguluyor. Yıllardır, sınır AI inşa etmenin veri merkezleri için milyarlarca dolarlık sermaye gerektirdiği, en iyi fonlanan şirketler ve ülkeler dışında herkes için aşılmaz bir savunma hattı oluşturduğu anlatılıyordu. Bu proje, kolektif, dağıtık kaynakların benzer bir sonuca ulaşmak için seferber edilebileceğini kanıtlayarak bu anlatıyı yıkıyor.

En yakın etki, erişimin demokratikleşmesidir. Bağımsız araştırmacılar, akademik kurumlar ve daha küçük startup'lar artık kurumsal sponsorluk veya bulut kredisi gerektirmeden sınır ölçeğinde model geliştirmeye katkıda bulunmak ve ondan faydalanmak için uygulanabilir bir yol buluyor. Bu, yeni araştırmalar ve özelleştirilmiş ince ayar için giriş engelini düşürüyor ve genel amaçlı kurumsal modeller için ekonomik olmayan niş ve dikey uygulamalarda bir yenilik dalgasını potansiyel olarak tetikleyebilir.

Şeffaflık ve denetlenebilirlik, bu yaklaşımın doğal özellikleri haline gelir.

More from Hacker News

GPT-Rosalind: OpenAI'nin Biyoloji AI'sı Bilimsel Keşfi Nasıl Yeniden TanımlıyorOpenAI's introduction of GPT-Rosalind signals a definitive strategic turn in artificial intelligence development. RatherAjan Yorgunluğu Krizi: AI Kodlama Asistanları Geliştiricilerin Akış Durumlarını Nasıl Bozuyor?The initial euphoria surrounding AI-powered coding assistants has given way to a sobering reality check across the develPelikan Gambiti: Dizüstü Bilgisayarlardaki 35B Parametreli Modeller AI'nın Sınırını Nasıl Yeniden TanımlıyorThe recent demonstration of a 35-billion parameter model, colloquially referenced in community discussions as the 'PelicOpen source hub2021 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

Routstr Protokolü: Merkezi Olmayan AI Çıkarımı, Bulut Bilişimin Hakimiyetine Meydan Okuyabilir mi?Routstr adlı yeni bir protokol, çıkarım hesaplaması için merkezi olmayan bir pazar yaratarak merkezi AI altyapısını değiEgemen AI Devrimi: Kişisel Bilgi İşlem, Zeka Yaratımını Nasıl Geri AlıyorAI geliştirmenin odağı, merkezi veri merkezlerinden dağıtılmış kişisel bilgi işlem ortamlarına kayıyor. Egemen AI—bireylMiniMind'in Saf PyTorch GPT Eğitimi, Büyük Dil Modeli Geliştirmeyi DemokratikleştiriyorMiniMind adlı yeni bir açık kaynak projesi, büyük dil modellerini eğitmenin özel, endüstriyel ölçekli altyapı gerektirdiLocal Cursor'un Sessiz Devrimi: Yerel AI Ajanları Dijital Egemenliği Nasıl Yeniden Tanımlıyor?Yapay zekada sessiz ama derin bir değişim yaşanıyor. Tamamen yerel AI ajanları için açık kaynaklı bir çerçeve olan Local

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。