Covenant-72B เสร็จสิ้นการฝึกฝน เปิดยุคใหม่ของ AI แบบกระจายศูนย์

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen-source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

ภูมิทัศน์การพัฒนา AI ได้มาถึงจุดเปลี่ยนสำคัญด้วยความสำเร็จของการเสร็จสิ้นขั้นตอนการฝึกฝนล่วงหน้า (pre-training) ของ Covenant-72B ความสำเร็จนี้เป็นจุดสูงสุดของความพยายามร่วมมือแบบกระจายศูนย์ที่ใหญ่ที่สุดเพื่อสร้างโมเดลภาษาขนาดใหญ่ (LLM) ที่ทันสมัย ซึ่งดำเนินการทั้งหมดนอกกรอบดั้งเดิมของศูนย์ข้อมูลขนาดยักษ์ขององค์กร ด้วยการประสานงานการฝึกฝนโมเดลขนาด 72 พันล้านพารามิเตอร์ผ่านเครือข่ายโหนดคอมพิวเตอร์แบบกระจายทั่วโลกที่อาสาสมัครเข้าร่วม โครงการนี้ได้แสดงหลักฐานเชิงแนวคิด (proof-of-concept) ที่ทรงพลังสำหรับอนาคตของ AI ในรูปแบบทางเลือก

การวิเคราะห์ทางเทคนิค

การเสร็จสิ้นการฝึกฝนล่วงหน้าของ Covenant-72B เป็นความสำเร็จทางวิศวกรรมอันยิ่งใหญ่ที่แก้ไขชุดความท้าทายทางเทคนิคที่ซับซ้อนซึ่งมีอยู่ในการเรียนรู้ของเครื่องแบบกระจายศูนย์ นวัตกรรมหลักไม่ได้อยู่ที่สถาปัตยกรรมโมเดลใหม่ แต่อยู่ที่ชั้นการประสานงาน (orchestration layer) ซึ่งเป็นชุดของโปรโตคอล เฟรมเวิร์ก และกลไกการจูงใจที่ทำให้การฝึกฝนที่มีเสถียรภาพและมีประสิทธิภาพข้ามฮาร์ดแวร์ที่หลากหลายและกระจายตัวทั่วโลกเป็นไปได้

การฝึกฝนโมเดลขนาดใหญ่แบบดั้งเดิมอาศัยการเชื่อมต่อภายในศูนย์ข้อมูลเดียวที่มีแบนด์วิธสูงและเชื่อมโยงกันอย่างแน่นหนาเพื่อซิงโครไนซ์เกรเดียนต์ข้าม GPU หลายพันตัวที่เหมือนกัน โครงการ Covenant ต้องเอาชนะความล่าช้า การเปลี่ยนแปลงของโหนด (ผู้เข้าร่วมที่เข้ามาและออก) ความแตกต่างของฮาร์ดแวร์ และปัญหาด้านความไว้วางใจ ซึ่งทำได้ผ่านการผสมผสานเทคนิคการฝึกฝนแบบอะซิงโครนัสกับการบันทึกจุดตรวจสอบ (checkpointing) ที่แข็งแกร่ง โปรโตคอลการคำนวณที่สามารถตรวจสอบได้ใหม่เพื่อให้แน่ใจว่าผู้เข้าร่วมดำเนินงานฝึกฝนที่ได้รับมอบหมายอย่างถูกต้อง และระบบจูงใจแบบโทเค็นที่ให้รางวัลตามหน่วยงานที่ตรวจสอบได้และคุณภาพของข้อมูล

ความก้าวหน้าที่สำคัญคือการพัฒนาตัวเพิ่มประสิทธิภาพแบบกระจายที่ทนต่อความผิดพลาด (fault-tolerant distributed optimizer) ซึ่งสามารถจัดการกับความล่าช้าที่มีนัยสำคัญและการอัปเดตบางส่วนได้โดยไม่ทำให้กระบวนการเบี่ยงเบน ซึ่งทำให้โมเดลยังคงก้าวหน้าได้แม้ว่าส่วนใหญ่ของเครือข่ายจะออฟไลน์ชั่วคราวหรือทำงานช้า นอกจากนี้ โครงการยังได้ใช้การกำหนดเส้นทางและแบ่งส่วนข้อมูลขั้นสูงเพื่อรับประกันความเป็นส่วนตัวและความสมบูรณ์ของข้อมูลฝึกฝนข้ามโหนดที่ไม่น่าเชื่อถือ ซึ่งเป็นสิ่งจำเป็นสำหรับการจัดการชุดข้อมูลที่หลากหลายที่ต้องใช้ในการฝึกฝนล่วงหน้า

ผลลัพธ์คือโมเดลขนาด 72 พันล้านพารามิเตอร์ ซึ่งแนวทางการฝึกฝนและประสิทธิภาพในการทดสอบมาตรฐานขั้นสุดท้ายแสดงให้เห็นว่าเป็นครั้งแรกที่การประสานงานแบบกระจายศูนย์สามารถเทียบเคียงความเสถียรภาพที่ก่อนหน้านี้มีเฉพาะในคลัสเตอร์แบบรวมศูนย์ได้ สิ่งนี้ยืนยันสแต็กทางเทคนิคใหม่สำหรับการพัฒนา AI ซึ่งสร้างขึ้นบนความยืดหยุ่นและการมีส่วนร่วมโดยสมัครใจ แทนที่จะเป็นการใช้จ่ายเงินทุนสำหรับโครงสร้างพื้นฐานทางกายภาพ

ผลกระทบต่ออุตสาหกรรม

ความสำเร็จของ Covenant-72B ส่งคลื่นสั่นสะเทือนไปทั่วอุตสาหกรรม AI ท้าทายสมมติฐานพื้นฐานทางเศรษฐกิจและการดำเนินงานมายาวนาน เป็นเวลาหลายปีที่เรื่องเล่าคือการสร้าง AI ขั้นสูง (frontier AI) ต้องการเงินทุนหลายพันล้านสำหรับศูนย์ข้อมูล สร้างคูเมืองที่ข้ามไม่ได้สำหรับทุกคนยกเว้นบริษัทและประเทศที่ได้รับเงินสนับสนุนมากที่สุด โครงการนี้ทำลายเรื่องเล่านั้น โดยพิสูจน์ว่าทรัพยากรแบบรวมกลุ่มและกระจายตัวสามารถถูกระดมเพื่อให้ได้ผลลัพธ์ที่คล้ายกันได้

ผลกระทบทันทีคือการทำให้การเข้าถึงเป็นประชาธิปไตย นักวิจัยอิสระ สถาบันการศึกษา และสตาร์ทอัพขนาดเล็ก ตอนนี้มีเส้นทางที่เป็นไปได้ที่จะมีส่วนร่วมและได้รับประโยชน์จากการพัฒนาโมเดลระดับขั้นสูง โดยไม่จำเป็นต้องได้รับการสนับสนุนจากองค์กรหรือเครดิตคลาวด์ สิ่งนี้ลดอุปสรรคในการเริ่มต้นการวิจัยใหม่และการปรับแต่งเฉพาะทาง ซึ่งอาจปลดปล่อยคลื่นแห่งนวัตกรรมในแอปพลิเคชันเฉพาะทางและแนวตั้งที่ไม่มีเศรษฐกิจสำหรับโมเดลองค์กรทั่วไป

ความโปร่งใสและการตรวจสอบได้กลายเป็นคุณสมบัติที่มีมาแต่เดิม

More from Hacker News

UntitledThe open-source AI agent framework OpenClaw has achieved a critical milestone: reliable deployment on standard virtual pUntitledThe White House has formally requested that OpenAI implement a staged release for its upcoming next-generation AI model,UntitledThe AI industry is witnessing a paradigm shift in how inference costs are measured and billed. For years, the dominant mOpen source hub5250 indexed articles from Hacker News

Related topics

decentralized AI63 related articlesopen-source AI229 related articleslarge language model85 related articles

Archive

March 20262347 published articles

Further Reading

The Open Source AI Deadline: December 3, 2026, and the End of API DominanceA single date—December 3, 2026—has emerged as a focal point for the open source AI community. This is not a random guessคลัสเตอร์เอเจนต์ AI ระดับท้องถิ่นของ Edster ท้าทายการครอบงำของคลาวด์ในระบบอัตโนมัติโปรเจกต์โอเพนซอร์ส Edster ได้เปิดตัวการเปลี่ยนกระบวนทัศน์ในระบบอัตโนมัติของ AI โดยทำให้คลัสเตอร์มัลติเอเจนต์ที่ซับซ้อนสาสถาปัตยกรรม Meshcore ปรากฏตัว: เครือข่ายอนุมานแบบ P2P กระจายศูนย์จะท้าทายการครอบงำของ AI ได้หรือไม่?กรอบสถาปัตยกรรมใหม่ที่เรียกว่า Meshcore กำลังได้รับความนิยม โดยเสนอทางเลือกที่รุนแรงแทนบริการคลาวด์ AI แบบรวมศูนย์ ด้วยกการปฏิวัติ GPU ในบ้าน: การประมวลผลแบบกระจายกำลังทำให้โครงสร้างพื้นฐาน AI เป็นประชาธิปไตยได้อย่างไรการปฏิวัติที่เงียบ ๆ กำลังก่อตัวขึ้นในห้องใต้ดินและห้องเล่นเกมของนักเทคโนโลยีทั่วโลก ด้วยแรงบันดาลใจจากมรดกของ SETI@home

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。