Covenant-72B Selesai Latihan, Memulakan Era AI Terdesentralisasi

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

Landskap pembangunan AI telah mencapai titik perubahan penting dengan kejayaan penyiapan fasa pra-latihan Covenant-72B. Pencapaian ini mewakili kemuncak usaha kolaboratif terdesentralisasi terbesar untuk membina model bahasa besar (LLM) canggih, yang beroperasi sepenuhnya di luar rangka kerja tradisional pusat data hiperskala korporat. Dengan menyelaraskan latihan model 72 bilion parameter merentasi rangkaian nod pengkomputeran teragih global secara sukarela, projek ini telah memberikan bukti konsep yang kukuh untuk masa depan AI alternatif.

Analisis Teknikal

Penyiapan pra-latihan Covenant-72B adalah satu pencapaian kejuruteraan monumental yang menyelesaikan satu siri cabaran teknikal kompleks yang wujud dalam pembelajaran mesin terdesentralisasi. Inovasi teras terletak bukan pada seni bina model baru, tetapi pada lapisan orkestra—satu suite protokol, rangka kerja, dan mekanisme insentif yang membolehkan latihan yang stabil dan cekap merentasi perkakasan heterogen yang teragih secara global.

Latihan model besar tradisional bergantung pada sambungan dalaman berjalur lebar tinggi yang rapat dalam satu pusat data untuk menyegerakkan kecerunan merentasi ribuan GPU yang serupa. Projek Covenant terpaksa mengatasi kependaman, perubahan nod (peserta yang menyertai dan meninggalkan), variasi perkakasan, dan isu kepercayaan. Ia mencapai ini melalui gabungan teknik latihan tak segerak dengan pemeriksaan (checkpointing) yang kukuh, satu protokol pengiraan boleh disahkan yang novel untuk memastikan peserta melaksanakan tugas latihan yang diberikan dengan betul, dan satu sistem insentif berasaskan token yang memberi ganjaran berdasarkan unit kerja boleh disahkan dan kualiti data.

Satu kejayaan kritikal ialah pembangunan pengoptimum teragih tahan ralat (fault-tolerant distributed optimizer) yang boleh mengendalikan kelewatan ketara dan kemas kini separa tanpa mencapah. Ini membolehkan model membuat kemajuan walaupun sebahagian besar rangkaian berada dalam keadaan luar talian sementara atau perlahan. Tambahan pula, projek ini melaksanakan penghalaan dan pemecahan data (sharding) lanjutan untuk memastikan privasi dan integriti data latihan merentasi nod yang tidak dipercayai, satu keperluan untuk mengendalikan set data pelbagai yang diperlukan untuk pra-latihan.

Hasilnya ialah satu model 72B parameter yang trajektori latihan dan prestasi penanda aras akhirnya menunjukkan bahawa buat pertama kalinya, penyelarasan terdesentralisasi boleh menyamai kestabilan yang sebelum ini eksklusif kepada kelompok berpusat. Ini mengesahkan satu timbunan teknikal baru untuk pembangunan AI, yang dibina berdasarkan ketahanan dan penyertaan sukarela dan bukannya perbelanjaan modal ke atas infrastruktur fizikal.

Kesan Industri

Kejayaan Covenant-72B menghantar gelombang seismik melalui industri AI, mencabar andaian asas ekonomi dan operasinya. Selama bertahun-tahun, naratifnya ialah membina AI frontier memerlukan berbilion modal untuk pusat data, mewujudkan parit yang tidak dapat diatasi untuk semua kecuali syarikat dan negara yang dibiayai terbaik. Projek ini meruntuhkan naratif itu, membuktikan bahawa sumber kolektif dan teragih boleh dikerahkan untuk mencapai hasil yang serupa.

Kesan serta-merta ialah pendemokrasian akses. Penyelidik bebas, institusi akademik, dan startup kecil kini mempunyai laluan yang boleh dilaksanakan untuk menyumbang dan mendapat manfaat daripada pembangunan model skala frontier tanpa memerlukan tajaan korporat atau kredit awan. Ini menurunkan halangan kemasukan untuk penyelidikan novel dan penalaan halus khusus, berpotensi membebaskan satu gelombang inovasi dalam aplikasi niche dan menegak yang tidak ekonomik untuk model korporat tujuan umum.

Ketelusan dan kebolehauditan menjadi ciri yang wujud

More from Hacker News

GPT-Rosalind: Bagaimana AI Biologi OpenAI Mentakrifkan Semula Penemuan SaintifikOpenAI's introduction of GPT-Rosalind signals a definitive strategic turn in artificial intelligence development. RatherKrisis Kelesuan Ejen: Bagaimana Pembantu Pengekodan AI Memecahkan Status Aliran PajuangThe initial euphoria surrounding AI-powered coding assistants has given way to a sobering reality check across the develPelican Gambit: Bagaimana Model 35B Parameter pada Komputer Riba Mentakrifkan Semula Sempadan AIThe recent demonstration of a 35-billion parameter model, colloquially referenced in community discussions as the 'PelicOpen source hub2021 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

Protokol Routstr: Bolehkah Inferens AI Terpencar Mencabar Dominasi Pengkomputeran Awan?Satu protokol baharu bernama Routstr cuba mengganggu landskap infrastruktur AI berpusat dengan mencipta pasaran terpencaRevolusi AI Berdaulat: Bagaimana Pengkomputeran Peribadi Merebut Semula Penciptaan KecerdasanTumpuan pembangunan AI sedang beralih dari pusat data berpusat kepada persekitaran pengkomputeran peribadi yang teragih.Latihan GPT PyTorch Tulen MiniMind Mendemokrasikan Pembangunan Model Bahasa BesarSatu projek sumber terbuka baharu bernama MiniMind mencabar tanggapan bahawa melatih model bahasa besar memerlukan infraRevolusi Senyap Local Cursor: Bagaimana Ejen AI Tempatan Mentakrifkan Semula Kedaulatan DigitalSatu anjakan yang senyap tetapi mendalam sedang berlaku dalam kecerdasan buatan. Kemunculan Local Cursor, rangka kerja s

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。