Covenant-72B เสร็จสิ้นการฝึกฝน เปิดยุคใหม่ของ AI แบบกระจายศูนย์

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

ภูมิทัศน์การพัฒนา AI ได้มาถึงจุดเปลี่ยนสำคัญด้วยความสำเร็จของการเสร็จสิ้นขั้นตอนการฝึกฝนล่วงหน้า (pre-training) ของ Covenant-72B ความสำเร็จนี้เป็นจุดสูงสุดของความพยายามร่วมมือแบบกระจายศูนย์ที่ใหญ่ที่สุดเพื่อสร้างโมเดลภาษาขนาดใหญ่ (LLM) ที่ทันสมัย ซึ่งดำเนินการทั้งหมดนอกกรอบดั้งเดิมของศูนย์ข้อมูลขนาดยักษ์ขององค์กร ด้วยการประสานงานการฝึกฝนโมเดลขนาด 72 พันล้านพารามิเตอร์ผ่านเครือข่ายโหนดคอมพิวเตอร์แบบกระจายทั่วโลกที่อาสาสมัครเข้าร่วม โครงการนี้ได้แสดงหลักฐานเชิงแนวคิด (proof-of-concept) ที่ทรงพลังสำหรับอนาคตของ AI ในรูปแบบทางเลือก

การวิเคราะห์ทางเทคนิค

การเสร็จสิ้นการฝึกฝนล่วงหน้าของ Covenant-72B เป็นความสำเร็จทางวิศวกรรมอันยิ่งใหญ่ที่แก้ไขชุดความท้าทายทางเทคนิคที่ซับซ้อนซึ่งมีอยู่ในการเรียนรู้ของเครื่องแบบกระจายศูนย์ นวัตกรรมหลักไม่ได้อยู่ที่สถาปัตยกรรมโมเดลใหม่ แต่อยู่ที่ชั้นการประสานงาน (orchestration layer) ซึ่งเป็นชุดของโปรโตคอล เฟรมเวิร์ก และกลไกการจูงใจที่ทำให้การฝึกฝนที่มีเสถียรภาพและมีประสิทธิภาพข้ามฮาร์ดแวร์ที่หลากหลายและกระจายตัวทั่วโลกเป็นไปได้

การฝึกฝนโมเดลขนาดใหญ่แบบดั้งเดิมอาศัยการเชื่อมต่อภายในศูนย์ข้อมูลเดียวที่มีแบนด์วิธสูงและเชื่อมโยงกันอย่างแน่นหนาเพื่อซิงโครไนซ์เกรเดียนต์ข้าม GPU หลายพันตัวที่เหมือนกัน โครงการ Covenant ต้องเอาชนะความล่าช้า การเปลี่ยนแปลงของโหนด (ผู้เข้าร่วมที่เข้ามาและออก) ความแตกต่างของฮาร์ดแวร์ และปัญหาด้านความไว้วางใจ ซึ่งทำได้ผ่านการผสมผสานเทคนิคการฝึกฝนแบบอะซิงโครนัสกับการบันทึกจุดตรวจสอบ (checkpointing) ที่แข็งแกร่ง โปรโตคอลการคำนวณที่สามารถตรวจสอบได้ใหม่เพื่อให้แน่ใจว่าผู้เข้าร่วมดำเนินงานฝึกฝนที่ได้รับมอบหมายอย่างถูกต้อง และระบบจูงใจแบบโทเค็นที่ให้รางวัลตามหน่วยงานที่ตรวจสอบได้และคุณภาพของข้อมูล

ความก้าวหน้าที่สำคัญคือการพัฒนาตัวเพิ่มประสิทธิภาพแบบกระจายที่ทนต่อความผิดพลาด (fault-tolerant distributed optimizer) ซึ่งสามารถจัดการกับความล่าช้าที่มีนัยสำคัญและการอัปเดตบางส่วนได้โดยไม่ทำให้กระบวนการเบี่ยงเบน ซึ่งทำให้โมเดลยังคงก้าวหน้าได้แม้ว่าส่วนใหญ่ของเครือข่ายจะออฟไลน์ชั่วคราวหรือทำงานช้า นอกจากนี้ โครงการยังได้ใช้การกำหนดเส้นทางและแบ่งส่วนข้อมูลขั้นสูงเพื่อรับประกันความเป็นส่วนตัวและความสมบูรณ์ของข้อมูลฝึกฝนข้ามโหนดที่ไม่น่าเชื่อถือ ซึ่งเป็นสิ่งจำเป็นสำหรับการจัดการชุดข้อมูลที่หลากหลายที่ต้องใช้ในการฝึกฝนล่วงหน้า

ผลลัพธ์คือโมเดลขนาด 72 พันล้านพารามิเตอร์ ซึ่งแนวทางการฝึกฝนและประสิทธิภาพในการทดสอบมาตรฐานขั้นสุดท้ายแสดงให้เห็นว่าเป็นครั้งแรกที่การประสานงานแบบกระจายศูนย์สามารถเทียบเคียงความเสถียรภาพที่ก่อนหน้านี้มีเฉพาะในคลัสเตอร์แบบรวมศูนย์ได้ สิ่งนี้ยืนยันสแต็กทางเทคนิคใหม่สำหรับการพัฒนา AI ซึ่งสร้างขึ้นบนความยืดหยุ่นและการมีส่วนร่วมโดยสมัครใจ แทนที่จะเป็นการใช้จ่ายเงินทุนสำหรับโครงสร้างพื้นฐานทางกายภาพ

ผลกระทบต่ออุตสาหกรรม

ความสำเร็จของ Covenant-72B ส่งคลื่นสั่นสะเทือนไปทั่วอุตสาหกรรม AI ท้าทายสมมติฐานพื้นฐานทางเศรษฐกิจและการดำเนินงานมายาวนาน เป็นเวลาหลายปีที่เรื่องเล่าคือการสร้าง AI ขั้นสูง (frontier AI) ต้องการเงินทุนหลายพันล้านสำหรับศูนย์ข้อมูล สร้างคูเมืองที่ข้ามไม่ได้สำหรับทุกคนยกเว้นบริษัทและประเทศที่ได้รับเงินสนับสนุนมากที่สุด โครงการนี้ทำลายเรื่องเล่านั้น โดยพิสูจน์ว่าทรัพยากรแบบรวมกลุ่มและกระจายตัวสามารถถูกระดมเพื่อให้ได้ผลลัพธ์ที่คล้ายกันได้

ผลกระทบทันทีคือการทำให้การเข้าถึงเป็นประชาธิปไตย นักวิจัยอิสระ สถาบันการศึกษา และสตาร์ทอัพขนาดเล็ก ตอนนี้มีเส้นทางที่เป็นไปได้ที่จะมีส่วนร่วมและได้รับประโยชน์จากการพัฒนาโมเดลระดับขั้นสูง โดยไม่จำเป็นต้องได้รับการสนับสนุนจากองค์กรหรือเครดิตคลาวด์ สิ่งนี้ลดอุปสรรคในการเริ่มต้นการวิจัยใหม่และการปรับแต่งเฉพาะทาง ซึ่งอาจปลดปล่อยคลื่นแห่งนวัตกรรมในแอปพลิเคชันเฉพาะทางและแนวตั้งที่ไม่มีเศรษฐกิจสำหรับโมเดลองค์กรทั่วไป

ความโปร่งใสและการตรวจสอบได้กลายเป็นคุณสมบัติที่มีมาแต่เดิม

More from Hacker News

GPT-Rosalind: AI ด้านชีววิทยาของ OpenAI นิยามการค้นพบทางวิทยาศาสตร์ใหม่ได้อย่างไรOpenAI's introduction of GPT-Rosalind signals a definitive strategic turn in artificial intelligence development. Ratherวิกฤติความเหนื่อยล้าของเอเจนต์: ผู้ช่วยเขียนโค้ด AI กำลังทำลายสภาวะโฟลว์ของนักพัฒนาอย่างไรThe initial euphoria surrounding AI-powered coding assistants has given way to a sobering reality check across the develกลยุทธ์นกกระทุง: โมเดล 35B พารามิเตอร์บนแล็ปท็อปกำลังกำหนดขอบเขตใหม่ของ AI อย่างไรThe recent demonstration of a 35-billion parameter model, colloquially referenced in community discussions as the 'PelicOpen source hub2021 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

โปรโตคอล Routstr: AI แบบกระจายศูนย์จะท้าทายการครอบงำของระบบคลาวด์ได้หรือไม่?โปรโตคอลใหม่ชื่อ Routstr กำลังพยายามเปลี่ยนแปลงโครงสร้างพื้นฐาน AI แบบรวมศูนย์ ด้วยการสร้างตลาดแบบกระจายศูนย์สำหรับการปรการปฏิวัติ AI อธิปไตย: การคำนวณส่วนบุคคลกำลังกอบกู้การสร้างปัญญากลับคืนมาอย่างไรศูนย์กลางของการพัฒนา AI กำลังย้ายจากศูนย์ข้อมูลแบบรวมศูนย์ไปสู่สภาพแวดล้อมการคำนวณส่วนบุคคลแบบกระจาย AI อธิปไตย—แนวคิดทีการฝึกฝน GPT ด้วย PyTorch ล้วนของ MiniMind ทำให้การพัฒนารูปแบบภาษาขนาดใหญ่เป็นประชาธิปไตยโครงการโอเพ่นซอร์สใหม่ชื่อ MiniMind กำลังท้าทายแนวคิดที่ว่าการฝึกฝนโมเดลภาษาขนาดใหญ่จำเป็นต้องใช้โครงสร้างพื้นฐานที่เป็นการปฏิวัติเงียบของ Local Cursor: เอเจนต์ AI ภายในเครื่องกำลังนิยามอธิปไตยดิจิทัลใหม่อย่างไรการเปลี่ยนแปลงที่เงียบแต่ลึกซึ้งกำลังเกิดขึ้นในวงการปัญญาประดิษฐ์ การปรากฏตัวของ Local Cursor ซึ่งเป็นเฟรมเวิร์กโอเพนซอร

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。