Covenant-72B का प्रशिक्षण पूरा, विकेंद्रीकृत AI युग की शुरुआत

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

Covenant-72B के प्री-ट्रेनिंग चरण के सफल समापन के साथ AI विकास का परिदृश्य एक निर्णायक मोड़ पर पहुंच गया है। यह उपलब्धि एक अत्याधुनिक लार्ज लैंग्वेज मॉडल बनाने के लिए अब तक के सबसे बड़े विकेंद्रीकृत, सहयोगात्मक प्रयास का चरमोत्कर्ष है, जो पारंपरिक कॉर्पोरेट हाइपरस्केल डेटा सेंटरों के ढांचे से पूरी तरह बाहर संचालित हुआ है। एक स्वैच्छिक, वैश्विक वितरित कंप्यूटिंग नोड्स के नेटवर्क पर 72-बिलियन-पैरामीटर मॉडल के प्रशिक्षण का समन्वय करके, इस परियोजना ने एक वैकल्पिक AI भविष्य के लिए एक शक्तिशाली प्रूफ-ऑफ-कॉन्सेप्ट प्रस्तुत किया है।

तकनीकी विश्लेषण

Covenant-72B की प्री-ट्रेनिंग का पूरा होना एक ऐतिहासिक इंजीनियरिंग करतब है जिसने विकेंद्रीकृत मशीन लर्निंग में निहित जटिल तकनीकी चुनौतियों की एक श्रृंखला का समाधान किया है। मूल नवाचार किसी नए मॉडल आर्किटेक्चर में नहीं, बल्कि ऑर्केस्ट्रेशन लेयर में निहित है—प्रोटोकॉल, फ्रेमवर्क और प्रोत्साहन तंत्र के उस सूट में जिसने विषम, वैश्विक रूप से वितरित हार्डवेयर पर स्थिर, कुशल प्रशिक्षण को सक्षम किया।

पारंपरिक बड़े मॉडल प्रशिक्षण हजारों समान GPUs में ग्रेडिएंट्स को सिंक्रनाइज़ करने के लिए एक ही डेटा सेंटर के भीतर कसकर जुड़े, उच्च-बैंडविड्थ इंटरकनेक्ट्स पर निर्भर करता है। Covenant परियोजना को लेटेंसी, नोड चर्न (प्रतिभागियों के जुड़ने और छोड़ने), हार्डवेयर विविधता और विश्वास के मुद्दों पर काबू पाना पड़ा। इसने इसे एसिंक्रोनस ट्रेनिंग तकनीकों के मजबूत चेकपॉइंटिंग के साथ संयोजन, एक नए सत्यापन योग्य कम्प्यूटेशन प्रोटोकॉल जो यह सुनिश्चित करता है कि प्रतिभागियों ने अपने सौंपे गए प्रशिक्षण कार्यों को सही ढंग से निष्पादित किया, और एक टोकन-आधारित प्रोत्साहन प्रणाली के माध्यम से हासिल किया जो सत्यापन योग्य कार्य इकाइयों और डेटा गुणवत्ता के आधार पर योगदान को पुरस्कृत करती है।

एक महत्वपूर्ण सफलता एक फॉल्ट-टॉलरेंट डिस्ट्रिब्यूटेड ऑप्टिमाइज़र का विकास था जो महत्वपूर्ण देरी और आंशिक अपडेट को बिना विचलन के संभाल सकता है। यह मॉडल को प्रगति करने की अनुमति देता है तब भी जब नेटवर्क का एक बड़ा हिस्सा अस्थायी रूप से ऑफलाइन या धीमा हो। इसके अलावा, परियोजना ने उन्नत डेटा रूटिंग और शार्डिंग लागू की ताकि अविश्वसनीय नोड्स में प्रशिक्षण डेटा की गोपनीयता और अखंडता सुनिश्चित की जा सके, जो प्री-ट्रेनिंग के लिए आवश्यक विविध डेटासेट को संभालने के लिए एक आवश्यकता है।

परिणाम एक 72B पैरामीटर मॉडल है जिसका प्रशिक्षण प्रक्षेपवक्र और अंतिम बेंचमार्क प्रदर्शन दर्शाता है कि विकेंद्रीकृत समन्वय पहली बार, उस स्थिरता से मेल खा सकता है जो पहले केंद्रीकृत क्लस्टरों के लिए अनन्य थी। यह AI विकास के लिए एक नए तकनीकी स्टैक को मान्य करता है, जो भौतिक बुनियादी ढांचे पर पूंजीगत व्यय के बजाय लचीलेपन और स्वैच्छिक भागीदारी पर बनाया गया है।

उद्योग पर प्रभाव

Covenant-72B की सफलता AI उद्योग में भूकंपीय लहरें पैदा करती है, जो इसकी मूलभूत आर्थिक और परिचालन मान्यताओं को चुनौती देती है। वर्षों से, यह कथा रही है कि फ्रंटियर AI के निर्माण के लिए डेटा सेंटरों के लिए अरबों पूंजी की आवश्यकता होती है, जो सबसे अधिक धन वाले निगमों और राष्ट्रों को छोड़कर सभी के लिए एक अजेय खाई पैदा करती है। यह परियोजना उस कथा को ध्वस्त करती है, यह साबित करते हुए कि सामूहिक, वितरित संसाधनों को एक समान परिणाम प्राप्त करने के लिए संगठित किया जा सकता है।

तत्काल प्रभाव पहुंच का लोकतंत्रीकरण है। स्वतंत्र शोधकर्ताओं, शैक्षणिक संस्थानों और छोटे स्टार्टअप्स के पास अब फ्रंटियर-स्केल मॉडल विकास में योगदान करने और उससे लाभान्वित होने का एक व्यवहार्य मार्ग है, बिना कॉर्पोरेट प्रायोजन या क्लाउड क्रेडिट की आवश्यकता के। यह नए शोध और विशेष फाइन-ट्यूनिंग के लिए प्रवेश की बाधा को कम करता है, संभावित रूप से आला और ऊर्ध्वाधर अनुप्रयोगों में नवाचार की एक लहर छोड़ सकता है जो सामान्य-उद्देश्यीय कॉर्पोरेट मॉडलों के लिए अलाभकारी हैं।

पारदर्शिता और ऑडिट करने की क्षमता अंतर्निहित विशेषताएं बन जाती हैं

More from Hacker News

GPT-Rosalind: OpenAI का बायोलॉजी AI वैज्ञानिक खोज को कैसे नया रूप दे रहा हैOpenAI's introduction of GPT-Rosalind signals a definitive strategic turn in artificial intelligence development. Ratherएजेंट थकान संकट: AI कोडिंग असिस्टेंट डेवलपर्स के फ्लो स्टेट को कैसे तोड़ रहे हैंThe initial euphoria surrounding AI-powered coding assistants has given way to a sobering reality check across the develपेलिकन गैंबिट: लैपटॉप पर 35B पैरामीटर मॉडल AI की सीमा को कैसे नया रूप दे रहे हैंThe recent demonstration of a 35-billion parameter model, colloquially referenced in community discussions as the 'PelicOpen source hub2021 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

Routstr प्रोटोकॉल: क्या विकेंद्रीकृत AI इन्फेरेंस क्लाउड कंप्यूटिंग के वर्चस्व को चुनौती दे सकता है?Routstr नामक एक नया प्रोटोकॉल, इन्फेरेंस कंप्यूटेशन के लिए एक विकेंद्रीकृत बाज़ार बनाकर केंद्रीकृत AI बुनियादी ढांचे के सॉवरेन एआई क्रांति: व्यक्तिगत कंप्यूटिंग कैसे बुद्धिमत्ता सृजन को वापस ले रही हैएआई विकास का केंद्र केंद्रीकृत डेटा सेंटरों से वितरित व्यक्तिगत कंप्यूटिंग वातावरणों की ओर स्थानांतरित हो रहा है। सॉवरेनMiniMind का शुद्ध PyTorch GPT प्रशिक्षण बड़े भाषा मॉडल विकास को लोकतांत्रिक बनाता हैMiniMind नामक एक नए ओपन-सोर्स प्रोजेक्ट ने इस धारणा को चुनौती दी है कि बड़े भाषा मॉडलों को प्रशिक्षित करने के लिए मालिकाLocal Cursor की मूक क्रांति: कैसे स्थानीय AI एजेंट डिजिटल संप्रभुता को पुनर्परिभाषित कर रहे हैंकृत्रिम बुद्धिमत्ता में एक शांत लेकिन गहरा बदलाव हो रहा है। Local Cursor का उदय, जो पूरी तरह से स्थानीय AI एजेंटों के लि

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。