เหนือกว่า NVIDIA: สามเสาหลักที่จำเป็นเพื่อชนะการแข่งขันชิป AI รุ่นใหม่

การแข่งขันเพื่อกำหนดอนาคตของคอมพิวเตอร์ AI กำลังทวีความรุนแรงขึ้น แต่เส้นทางสู่ความเป็นผู้นำนั้นไกลเกินกว่าความหนาแน่นของทรานซิสเตอร์หรือค่าฟลอปส์สูงสุด การวิเคราะห์ของ AINews ชี้ให้เห็นว่าผู้ท้าชิงที่น่าเชื่อถือใด ๆ ที่จะท้าทายการครอบครองตลาดในปัจจุบันจะต้องดำเนินกลยุทธ์สามประการที่มุ่งเน้นนวัตกรรมเชิงระบบ สนามรบแรกและสำคัญที่สุดคือซอฟต์แวร์ ผู้แข่งขันต้องนำเสนอประสบการณ์ซอฟต์แวร์แบบฟูลสแต็กที่มีความเรียบง่ายอย่างรุนแรง เปิดกว้าง และมีประสิทธิภาพสูง ซึ่งช่วยลดต้นทุนและความซับซ้อนในการย้ายและปรับโมเดลขนาดใหญ่ให้เหมาะสมได้อย่างเด็ดขาด จึงทำลายความเฉื่อยของนักพัฒนา ประการที่สอง ฮาร์ดแวร์ต้องได้รับการออกแบบใหม่ตั้งแต่พื้นฐานสำหรับกราฟการคำนวณของ AI ที่เกิดขึ้นจริง ไม่ใช่แค่การฝึกฝนเท่านั้น สิ่งนี้ต้องการสถาปัตยกรรมที่สามารถจัดการกับความเบาบาง (sparsity) ไดนามิก และความต้องการแบนด์วิดท์หน่วยความจำที่สูงของเอเจนต์อัตโนมัติและโมเดลโลก (world models) ได้อย่างมีประสิทธิภาพ ประการที่สาม และเป็นสิ่งที่มักถูกมองข้ามคือการสร้างระบบนิเวศที่แข็งแกร่งและเปิดกว้าง ซึ่งรวมถึงไลบรารีที่ปรับให้เหมาะสมแล้ว เครื่องมือสำหรับนักพัฒนา และช่องทางการจัดจำหน่ายที่เข้าถึงได้ ซึ่งจำเป็นต่อการลดอุปสรรคในการนำไปใช้และสร้างความไว้วางใจจากผู้ใช้

การวิเคราะห์ทางเทคนิค

ความท้าทายทางเทคนิคในการก้าวข้ามสถาปัตยกรรมเดิมนั้นมีหลายมิติ ในด้านซอฟต์แวร์ การครอบงำของ CUDA ไม่ใช่แค่ API เท่านั้น แต่เป็นระบบนิเวศที่บูรณาการอย่างลึกซึ้งซึ่งครอบคลุมไลบรารี (cuDNN, TensorRT) เครื่องมือสำหรับการพัฒนา และคลังเก็บโค้ดที่ปรับให้เหมาะสมแล้วจำนวนมาก ซอฟต์แวร์สแต็กของผู้ท้าชิงที่ประสบความสำเร็จจะต้องบรรลุเป้าหมายสองประการที่ดูเหมือนขัดแย้งกัน: ต้องเรียบง่ายอย่างรุนแรงสำหรับนักพัฒนาในการนำไปใช้ ในขณะเดียวกันก็ต้องมีประสิทธิภาพเพียงพอที่จะทำให้การย้ายมาสมเหตุสมผล สิ่งนี้น่าจะเกี่ยวข้องกับกลยุทธ์ที่ให้ความสำคัญกับคอมไพเลอร์เป็นอันดับแรก โดยที่ตัวแทนระดับกลาง (IR) ที่เป็นอิสระจากเฟรมเวิร์กระดับสูงสามารถถูกคอมไพล์ลงไปยังแบ็กเอนด์ฮาร์ดแวร์ที่หลากหลายได้อย่างมีประสิทธิภาพ ซึ่งจะช่วยอำพรายความซับซ้อนของฮาร์ดแวร์ การเปิดเผยซอร์สโค้ดของสแต็กหลักไม่ใช่แค่การแสดงน้ำใจ แต่เป็นความจำเป็นเชิงกลยุทธ์เพื่อส่งเสริมความไว้วางใจจากชุมชนและเร่งการเติบโตของระบบนิเวศ

ในเชิงสถาปัตยกรรม โฟกัสกำลังเปลี่ยนจากการมุ่งเน้นที่ปริมาณงานการฝึกฝนล้วน ๆ ไปสู่ประสิทธิภาพของการฝึกฝน *และ* การอนุมานสำหรับปริมาณงานที่เกิดขึ้นใหม่ GPU ในปัจจุบันทำได้ดีในด้านการคูณเมทริกซ์ที่หนาแน่นและคาดการณ์ได้ของการฝึกฝนทรานส์ฟอร์มเมอร์ อย่างไรก็ตาม กราฟการคำนวณสำหรับเอเจนต์อัตโนมัติที่ทำการวางแผนระยะยาว หรือโมเดลโลกที่จำลองสภาพแวดล้อมทางกายภาพนั้นเบาบางและไดนามิกกว่ามาก สิ่งนี้จำเป็นต้องใช้ฮาร์ดแวร์ที่มีแบนด์วิดท์และความจุหน่วยความจำที่ยอดเยี่ยมเพื่อจัดการกับหน้าต่างบริบทขนาดใหญ่ และอาจรวมถึงการเปลี่ยนแปลงที่พื้นฐานมากขึ้น เช่น การผนวกรวมสถาปัตยกรรมที่ไม่ใช่ Von Neumann (เช่น การคำนวณในหน่วยความจำ) สำหรับฟังก์ชันเฉพาะ การออกแบบแบบชิปเล็ตที่มีการเชื่อมต่อระหว่างดายถึงดายที่เร็วมาก (เช่น UCIe) จะมีความสำคัญอย่างยิ่งสำหรับการขยายขนาดเกินขีดจำกัดของเรติเคิล ในขณะที่ยังคงอนุญาตให้ปรับแต่งแบบแยกส่วนได้ โดยการผสมผสานคอร์ทั่วไปกับตัวเร่งความเร็วเฉพาะทางสำหรับการให้ความสนใจ การกำหนดเส้นทาง หรือการจัดการสถานะ

ผลกระทบต่ออุตสาหกรรม

ผลกระทบของการเปลี่ยนแปลงนี้มีความลึกซึ้งต่อห่วงโซ่อุปทาน AI ทั้งหมด หากผู้ท้าชิงประสบความสำเร็จด้วยซอฟต์แวร์สแต็กแบบเปิด มันอาจทำให้การเข้าถึงฮาร์ดแวร์เป็นประชาธิปไตยมากขึ้น ลดความเปราะบางของอุตสาหกรรมต่อจุดคอขวดจากผู้จัดหาเพียงรายเดียว ผู้ให้บริการคลาวด์ไฮเปอร์สเกล (ซึ่งมักออกแบบชิปของตัวเอง) จะได้เปรียบและมีความยืดหยุ่นมากขึ้น โดยอาจนำกลยุทธ์ "best-of-breed" แบบหลายผู้ขายสำหรับระดับปริมาณงาน AI ที่แตกต่างกัน สิ่งนี้จะทำให้ตลาดแตกแยก แต่ก็จะกระตุ้นนวัตกรรมที่ไม่เคยมีมาก่อน

การเคลื่อนไปสู่สถาปัตยกรรมใหม่ที่ปรับให้เหมาะสมสำหรับการอนุมานและปริมาณงานแบบเอเจนต์ อาจแยกตลาดฮาร์ดแวร์ AI ออกจากเกณฑ์มาตรฐาน HPC และกราฟิกส์แบบดั้งเดิม สร้างเมตริกประสิทธิภาพและเกณฑ์การซื้อใหม่ทั้งหมด บริษัทที่สร้างแอปพลิเคชัน AI ขนาดใหญ่อาจให้ความสำคัญกับต้นทุนรวมในการเป็นเจ้าของ (TCO) สำหรับการให้บริการปฏิสัมพันธ์ผู้ใช้พันล้านครั้งต่อวัน มากกว่าความเร็วในการฝึกฝนดิบ สิ่งนี้ปรับแนวข้อได้เปรียบในการแข่งขันไปสู่บริษัทที่มีการบูรณาการแนวตั้งลึก ตั้งแต่ชิปไปจนถึงแอปพลิเคชันผู้ใช้ปลายทาง หรือบริษัทที่นำเสนอโมเดลการบริโภคที่โปร่งใสและยืดหยุ่นที่สุด

แนวโน้มในอนาคต

ในอีก 3-5 ปีข้างหน้า เราจะได้เห็นผู้ท้าชิงหลายรายปรากฏตัวขึ้น พยายามดำเนินการตามเสาหลักหนึ่งหรือหลายประการ

More from Hacker News

常见问题

这次公司发布“Beyond NVIDIA: Three Pillars Required to Win the Next-Generation AI Chip Race”主要讲了什么？

The competition to define the future of AI compute is intensifying, but the path to leadership extends far beyond transistor density or peak FLOPs. AINews analysis identifies that…

从“What are the main alternatives to CUDA for AI programming?”看，这家公司的这次发布为什么值得关注？

The technical challenge of surpassing incumbent architectures is multifaceted. On the software front, CUDA's dominance is not merely an API but a deeply integrated ecosystem encompassing libraries (cuDNN, TensorRT), deve…

围绕“How do AI agent workloads differ from traditional model training for hardware?”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

เหนือกว่า NVIDIA: สามเสาหลักที่จำเป็นเพื่อชนะการแข่งขันชิป AI รุ่นใหม่

การวิเคราะห์ทางเทคนิค

ผลกระทบต่ออุตสาหกรรม

แนวโน้มในอนาคต

More from Hacker News

Related topics

Archive

Further Reading

常见问题