AMD โชว์พลัง AI! Instinct MI355X ทะลุ 1 ล้าน Tokens/วินาที บน MLPerf 6.0

AMD เปิดเผยผลการทดสอบ MLPerf Inference 6.0 โดย GPU รุ่น Instinct MI355X สามารถทำประสิทธิภาพทะลุระดับ 1 ล้าน tokens ต่อวินาที ในการประมวลผลแบบ multinode ซึ่งถือเป็นก้าวสำคัญของระบบ AI ระดับดาต้าเซ็นเตอร์
ผลลัพธ์ดังกล่าวสะท้อนถึงความสามารถของแพลตฟอร์มที่ไม่ได้เน้นเพียงความเร็ว แต่ยังรองรับ workload ใหม่ ๆ และสามารถสเกลระบบได้อย่างมีประสิทธิภาพทั้งแบบ single-node และ multi-node
ในด้านฮาร์ดแวร์ MI355X ถูกพัฒนาบนสถาปัตยกรรม CDNA 4 ขนาด 3 นาโนเมตร พร้อมหน่วยความจำ HBM3E สูงสุด 288GB และรองรับการประมวลผล FP4/FP6 เพื่อเพิ่มประสิทธิภาพงาน AI โดยเฉพาะ

AMD ยังแสดงให้เห็นถึงการพัฒนาแบบก้าวกระโดดเมื่อเทียบกับรุ่นก่อนหน้า โดยมี throughput สูงขึ้นถึง 3.1 เท่าในบาง workload
นอกจากนี้ ระบบยังสามารถแข่งขันกับ GPU ระดับสูงของคู่แข่งได้ในหลายสถานการณ์ ทั้งด้าน batch throughput, latency และ interactive performance
อีกหนึ่งไฮไลต์คือการรองรับโมเดลใหม่อย่าง GPT-OSS-120B และงานด้าน text-to-video เช่น Wan-2.2-t2v ซึ่งแสดงถึงความพร้อมในการรองรับ workload AI ยุคใหม่
ในการทดสอบแบบ multinode ระบบสามารถสเกลได้ใกล้เคียง linear scaling โดยรักษาประสิทธิภาพได้สูงถึงกว่า 90% ในหลายกรณี

AMD ยังโชว์ศักยภาพด้าน ecosystem โดยมีพาร์ทเนอร์หลายรายสามารถรันผลลัพธ์ได้ใกล้เคียงกัน แสดงถึงความเสถียรและ reproducibility ของระบบ
รวมถึงการทดสอบแบบ heterogeneous ที่ใช้ GPU หลายรุ่นร่วมกัน ซึ่งสามารถทำงานข้ามระบบและต่างภูมิภาคได้อย่างมีประสิทธิภาพ
ทั้งหมดนี้ขับเคลื่อนด้วยซอฟต์แวร์ ROCm ของ AMD ที่ช่วยเพิ่มประสิทธิภาพ การสเกล และความยืดหยุ่นในการใช้งานจริง
ความสำเร็จใน MLPerf ครั้งนี้จึงสะท้อนว่า AMD กำลังก้าวขึ้นมาเป็นผู้เล่นหลักในตลาด AI Infrastructure และพร้อมแข่งขันในระดับสูงของอุตสาหกรรม