Covenant-72B Hoàn Thành Huấn Luyện, Mở Ra Kỷ Nguyên AI Phi Tập Trung

Hacker News March 2026
Source: Hacker Newsdecentralized AIopen source AIlarge language modelArchive: March 2026
The Covenant-72B project has completed pre-training, marking a historic milestone as the largest decentralized large language model ever created. This 72-billion-parameter model, t

Bối cảnh phát triển AI đã đạt đến một điểm bước ngoặt quan trọng với việc hoàn thành thành công giai đoạn tiền huấn luyện của Covenant-72B. Thành tựu này đánh dấu đỉnh cao của nỗ lực hợp tác phi tập trung lớn nhất từ trước đến nay nhằm xây dựng một mô hình ngôn ngữ lớn (LLM) tân tiến, hoạt động hoàn toàn bên ngoài khuôn khổ truyền thống của các trung tâm dữ liệu siêu quy mô của tập đoàn. Bằng cách phối hợp huấn luyện một mô hình 72 tỷ tham số thông qua một mạng lưới máy tính phân tán toàn cầu tự nguyện, dự án đã cung cấp một bằng chứng khái niệm mạnh mẽ cho một tương lai AI thay thế.

Phân Tích Kỹ Thuật

Việc hoàn thành tiền huấn luyện của Covenant-72B là một kỳ công kỹ thuật vĩ đại, giải quyết một loạt thách thức kỹ thuật phức tạp vốn có của học máy phi tập trung. Đổi mới cốt lõi không nằm ở kiến trúc mô hình mới, mà nằm ở lớp điều phối (orchestration layer) — bộ giao thức, framework và cơ chế khuyến khích cho phép huấn luyện ổn định, hiệu quả trên phần cứng không đồng nhất, phân tán toàn cầu.

Huấn luyện mô hình lớn truyền thống dựa vào các kết nối liên kết chặt chẽ, băng thông cao trong một trung tâm dữ liệu duy nhất để đồng bộ hóa gradient qua hàng nghìn GPU giống hệt nhau. Dự án Covenant phải vượt qua độ trễ, sự biến động nút (người tham gia gia nhập và rời đi), sự khác biệt phần cứng và các vấn đề về niềm tin. Họ đạt được điều này thông qua sự kết hợp của kỹ thuật huấn luyện bất đồng bộ với cơ chế checkpoint mạnh mẽ, một giao thức tính toán có thể xác minh mới để đảm bảo người tham gia thực thi chính xác nhiệm vụ huấn luyện được giao, và một hệ thống khuyến khích dựa trên token thưởng cho đóng góp dựa trên các đơn vị công việc và chất lượng dữ liệu có thể xác minh.

Một đột phá quan trọng là sự phát triển của một bộ tối ưu hóa phân tán chịu lỗi, có thể xử lý độ trễ đáng kể và các bản cập nhật một phần mà không bị phân kỳ. Điều này cho phép mô hình tiếp tục tiến triển ngay cả khi một phần đáng kể của mạng lưới tạm thời ngoại tuyến hoặc chậm. Hơn nữa, dự án đã triển khai định tuyến và phân mảnh dữ liệu tiên tiến để đảm bảo quyền riêng tư và tính toàn vẹn của dữ liệu huấn luyện trên các nút không đáng tin cậy, một điều cần thiết để xử lý các bộ dữ liệu đa dạng cần cho tiền huấn luyện.

Kết quả là một mô hình 72B tham số có quỹ đạo huấn luyện và hiệu suất benchmark cuối cùng chứng minh rằng sự phối hợp phi tập trung lần đầu tiên có thể sánh ngang với độ ổn định trước đây chỉ có ở các cụm tập trung. Điều này xác nhận một chồng công nghệ (stack) mới cho phát triển AI, được xây dựng dựa trên khả năng phục hồi và sự tham gia tự nguyện thay vì chi tiêu vốn cho cơ sở hạ tầng vật lý.

Tác Động Ngành Công Nghiệp

Thành công của Covenant-72B gây ra những cơn chấn động khắp ngành công nghiệp AI, thách thức các giả định kinh tế và vận hành nền tảng của nó. Trong nhiều năm, luận điệu phổ biến là xây dựng AI đỉnh cao đòi hỏi hàng tỷ đô la vốn cho trung tâm dữ liệu, tạo ra một hào sâu không thể vượt qua cho tất cả trừ các tập đoàn và quốc gia được tài trợ tốt nhất. Dự án này phá vỡ luận điệu đó, chứng minh rằng các nguồn lực tập thể, phân tán có thể được huy động để đạt được kết quả tương tự.

Tác động trực tiếp là sự dân chủ hóa khả năng tiếp cận. Các nhà nghiên cứu độc lập, tổ chức học thuật và startup nhỏ hơn giờ đây có một con đường khả thi để đóng góp và hưởng lợi từ việc phát triển mô hình quy mô đỉnh cao mà không cần sự bảo trợ của tập đoàn hay tín dụng điện toán đám mây. Điều này hạ thấp rào cản gia nhập cho nghiên cứu mới và tinh chỉnh chuyên biệt, có khả năng giải phóng một làn sóng đổi mới trong các ứng dụng chuyên ngành và thích hợp mà các mô hình tập đoàn đa mục đích không kinh tế để theo đuổi.

Tính minh bạch và khả năng kiểm toán trở thành các đặc tính cố hữu của mô hình này.

More from Hacker News

CodeBurn Phơi Bày Cuộc Khủng Hoảng Chi Phí Ẩn Của AI: Từ Đếm Token Đến Kinh Tế Học Dựa Trên Nhiệm VụThe release of CodeBurn, an open-source analysis tool created by a developer facing opaque and escalating costs from AI Agent-Cache Mở Khóa Khả Năng Mở Rộng cho AI Agent: Cách Bộ Nhớ Đệm Thống Nhất Giải Quyết Nút Cổ Chai Triển Khai 10 Tỷ ĐôThe AI industry's relentless focus on model capabilities has created a paradoxical situation: while agents built on framNền tảng Kỹ thuật Đảo ngược API của Kampala Có Thể Mở khóa Phần mềm Cũ cho Kỷ nguyên AI AgentKampala has officially launched with a proposition that challenges the fundamental constraints of software integration. Open source hub2018 indexed articles from Hacker News

Related topics

decentralized AI29 related articlesopen source AI117 related articleslarge language model18 related articles

Archive

March 20262347 published articles

Further Reading

Giao thức Routstr: Liệu AI Suy luận Phi tập trung có thể Thách thức Sự thống trị của Điện toán Đám mây?Một giao thức mới có tên Routstr đang cố gắng làm thay đổi bức tranh hạ tầng AI tập trung bằng cách tạo ra một thị trườnCách mạng AI Chủ quyền: Máy tính Cá nhân Đang Lấy Lại Quyền Sáng tạo Trí tuệ Như Thế NàoTrọng tâm phát triển AI đang dịch chuyển từ các trung tâm dữ liệu tập trung sang môi trường máy tính cá nhân phân tán. AViệc Đào Tạo GPT Bằng PyTorch Thuần Túy Của MiniMind Dân Chủ Hóa Phát Triển Mô Hình Ngôn Ngữ LớnMột dự án mã nguồn mở mới có tên MiniMind đang thách thức quan niệm rằng việc đào tạo các mô hình ngôn ngữ lớn đòi hỏi cCuộc Cách mạng Thầm lặng của Local Cursor: Cách các Tác nhân AI Cục bộ Định nghĩa lại Chủ quyền SốMột sự chuyển dịch thầm lặng nhưng sâu sắc đang diễn ra trong lĩnh vực trí tuệ nhân tạo. Sự xuất hiện của Local Cursor,

常见问题

这次模型发布“Covenant-72B Completes Training, Ushering in Decentralized AI Era”的核心内容是什么?

The AI development landscape has reached a pivotal inflection point with the successful completion of the Covenant-72B pre-training phase. This achievement represents the culminati…

从“How does Covenant-72B decentralized training actually work technically?”看,这个模型发布为什么重要?

The completion of Covenant-72B's pre-training is a monumental engineering feat that solves a series of complex technical challenges inherent to decentralized machine learning. The core innovation lies not in a novel mode…

围绕“What are the real-world use cases for an open, decentralized AI model?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。