การวิเคราะห์ทางเทคนิค
ความท้าทายทางเทคนิคในการก้าวข้ามสถาปัตยกรรมเดิมนั้นมีหลายมิติ ในด้านซอฟต์แวร์ การครอบงำของ CUDA ไม่ใช่แค่ API เท่านั้น แต่เป็นระบบนิเวศที่บูรณาการอย่างลึกซึ้งซึ่งครอบคลุมไลบรารี (cuDNN, TensorRT) เครื่องมือสำหรับการพัฒนา และคลังเก็บโค้ดที่ปรับให้เหมาะสมแล้วจำนวนมาก ซอฟต์แวร์สแต็กของผู้ท้าชิงที่ประสบความสำเร็จจะต้องบรรลุเป้าหมายสองประการที่ดูเหมือนขัดแย้งกัน: ต้องเรียบง่ายอย่างรุนแรงสำหรับนักพัฒนาในการนำไปใช้ ในขณะเดียวกันก็ต้องมีประสิทธิภาพเพียงพอที่จะทำให้การย้ายมาสมเหตุสมผล สิ่งนี้น่าจะเกี่ยวข้องกับกลยุทธ์ที่ให้ความสำคัญกับคอมไพเลอร์เป็นอันดับแรก โดยที่ตัวแทนระดับกลาง (IR) ที่เป็นอิสระจากเฟรมเวิร์กระดับสูงสามารถถูกคอมไพล์ลงไปยังแบ็กเอนด์ฮาร์ดแวร์ที่หลากหลายได้อย่างมีประสิทธิภาพ ซึ่งจะช่วยอำพรายความซับซ้อนของฮาร์ดแวร์ การเปิดเผยซอร์สโค้ดของสแต็กหลักไม่ใช่แค่การแสดงน้ำใจ แต่เป็นความจำเป็นเชิงกลยุทธ์เพื่อส่งเสริมความไว้วางใจจากชุมชนและเร่งการเติบโตของระบบนิเวศ
ในเชิงสถาปัตยกรรม โฟกัสกำลังเปลี่ยนจากการมุ่งเน้นที่ปริมาณงานการฝึกฝนล้วน ๆ ไปสู่ประสิทธิภาพของการฝึกฝน *และ* การอนุมานสำหรับปริมาณงานที่เกิดขึ้นใหม่ GPU ในปัจจุบันทำได้ดีในด้านการคูณเมทริกซ์ที่หนาแน่นและคาดการณ์ได้ของการฝึกฝนทรานส์ฟอร์มเมอร์ อย่างไรก็ตาม กราฟการคำนวณสำหรับเอเจนต์อัตโนมัติที่ทำการวางแผนระยะยาว หรือโมเดลโลกที่จำลองสภาพแวดล้อมทางกายภาพนั้นเบาบางและไดนามิกกว่ามาก สิ่งนี้จำเป็นต้องใช้ฮาร์ดแวร์ที่มีแบนด์วิดท์และความจุหน่วยความจำที่ยอดเยี่ยมเพื่อจัดการกับหน้าต่างบริบทขนาดใหญ่ และอาจรวมถึงการเปลี่ยนแปลงที่พื้นฐานมากขึ้น เช่น การผนวกรวมสถาปัตยกรรมที่ไม่ใช่ Von Neumann (เช่น การคำนวณในหน่วยความจำ) สำหรับฟังก์ชันเฉพาะ การออกแบบแบบชิปเล็ตที่มีการเชื่อมต่อระหว่างดายถึงดายที่เร็วมาก (เช่น UCIe) จะมีความสำคัญอย่างยิ่งสำหรับการขยายขนาดเกินขีดจำกัดของเรติเคิล ในขณะที่ยังคงอนุญาตให้ปรับแต่งแบบแยกส่วนได้ โดยการผสมผสานคอร์ทั่วไปกับตัวเร่งความเร็วเฉพาะทางสำหรับการให้ความสนใจ การกำหนดเส้นทาง หรือการจัดการสถานะ
ผลกระทบต่ออุตสาหกรรม
ผลกระทบของการเปลี่ยนแปลงนี้มีความลึกซึ้งต่อห่วงโซ่อุปทาน AI ทั้งหมด หากผู้ท้าชิงประสบความสำเร็จด้วยซอฟต์แวร์สแต็กแบบเปิด มันอาจทำให้การเข้าถึงฮาร์ดแวร์เป็นประชาธิปไตยมากขึ้น ลดความเปราะบางของอุตสาหกรรมต่อจุดคอขวดจากผู้จัดหาเพียงรายเดียว ผู้ให้บริการคลาวด์ไฮเปอร์สเกล (ซึ่งมักออกแบบชิปของตัวเอง) จะได้เปรียบและมีความยืดหยุ่นมากขึ้น โดยอาจนำกลยุทธ์ "best-of-breed" แบบหลายผู้ขายสำหรับระดับปริมาณงาน AI ที่แตกต่างกัน สิ่งนี้จะทำให้ตลาดแตกแยก แต่ก็จะกระตุ้นนวัตกรรมที่ไม่เคยมีมาก่อน
การเคลื่อนไปสู่สถาปัตยกรรมใหม่ที่ปรับให้เหมาะสมสำหรับการอนุมานและปริมาณงานแบบเอเจนต์ อาจแยกตลาดฮาร์ดแวร์ AI ออกจากเกณฑ์มาตรฐาน HPC และกราฟิกส์แบบดั้งเดิม สร้างเมตริกประสิทธิภาพและเกณฑ์การซื้อใหม่ทั้งหมด บริษัทที่สร้างแอปพลิเคชัน AI ขนาดใหญ่อาจให้ความสำคัญกับต้นทุนรวมในการเป็นเจ้าของ (TCO) สำหรับการให้บริการปฏิสัมพันธ์ผู้ใช้พันล้านครั้งต่อวัน มากกว่าความเร็วในการฝึกฝนดิบ สิ่งนี้ปรับแนวข้อได้เปรียบในการแข่งขันไปสู่บริษัทที่มีการบูรณาการแนวตั้งลึก ตั้งแต่ชิปไปจนถึงแอปพลิเคชันผู้ใช้ปลายทาง หรือบริษัทที่นำเสนอโมเดลการบริโภคที่โปร่งใสและยืดหยุ่นที่สุด
แนวโน้มในอนาคต
ในอีก 3-5 ปีข้างหน้า เราจะได้เห็นผู้ท้าชิงหลายรายปรากฏตัวขึ้น พยายามดำเนินการตามเสาหลักหนึ่งหรือหลายประการ