Article by Nongkoo OverclockTeam On March 19, 2024 178 views
Nvidia เปิดตัวการ์ดจอ NVIDIA Blackwell อย่างเป็นทางการมาพร้อมทรานซิสเตอร์ 208 พันล้านตัวประสิทธิภาพ AI แรงขึ้น 5 เท่า ใช้หน่วยความจำ HBM3e 192 GB แบนด์วิดธ์ 8 TB/s

Nvidia เปิดตัวการ์ดจอ NVIDIA Blackwell อย่างเป็นทางการมาพร้อมทรานซิสเตอร์ 208 พันล้านตัวประสิทธิภาพ AI แรงขึ้น 5 เท่า ใช้หน่วยความจำ HBM3e 192 GB แบนด์วิดธ์ 8 TB/s

nvidia-blackwell

วันนี้ก็มีข่าวจากฝั่ง NVIDIA ออกมาให้เราได้ชมกันครับ ในวันนี้ทาง Nvidia ได้เปิดตัวสถาปัตยกรรม Blackwell รุ่นต่อไปอย่างเป็นทางการ ซึ่งมีประสิทธิภาพเพิ่มขึ้นถึง 5 เท่า เมื่อเทียบกับการ์ดจอ Hopper H100 รุ่นเก่า NVIDIA Blackwell มาพร้อมประสิทธิภาพ AI ที่เร็วกว่า Hopper H100 ถึง 5 เท่า ถือเป็นผู้นำด้านการประมวลผล AI ยุคถัดไป

2024-03-19_1-31-03

NVIDIA เปิดตัวอย่างเป็นทางการพร้อมรายละเอียดทั้งหมดของสถาปัตยกรรม AI & Tensor Core GPU รุ่นต่อไปที่มีชื่อรหัสว่า Blackwell ตามที่คาดไว้ Blackwell GPUs เป็นรุ่นแรกที่มีการออกแบบ MCM แรกของ NVIDIA ซึ่งจะรวม GPU สองตัวไว้ในแม่พิมพ์เดียวกัน ชิปที่ทรงพลังที่สุดในโลก — อัดแน่นด้วยทรานซิสเตอร์ 208 พันล้านตัว GPU สถาปัตยกรรม Blackwell ผลิตขึ้นโดยใช้กระบวนการ 4NP TSMC ที่สร้างขึ้นเองพร้อม GPU ที่จำกัดเรติเคิลสองเรติเคิลเชื่อมต่อกันด้วยลิงก์ระหว่างชิปถึงชิป 10 TB/วินาทีเป็น GPU แบบครบวงจรตัวเดียว .

เครื่องยนต์ Transformer เจนเนอเรชั่นที่สอง — ขับเคลื่อนด้วยการสนับสนุนการปรับขนาดไมโครเทนเซอร์ใหม่และอัลกอริธึมการจัดการช่วงไดนามิกขั้นสูงของ NVIDIA ที่รวมอยู่ในเฟรมเวิร์ก NVIDIA TensorRT™-LLM และ NeMo Megatron Blackwell จะรองรับขนาดการคำนวณและโมเดลเป็นสองเท่าด้วย AI จุดลอยตัว 4 บิตใหม่ ความสามารถในการอนุมาน

NVLink รุ่นที่ห้า — เพื่อเร่งความเร็วประสิทธิภาพสำหรับโมเดล AI หลายล้านพารามิเตอร์และการผสมผสานของผู้เชี่ยวชาญ การทำซ้ำล่าสุดของ NVIDIA NVLink® มอบทรูพุตแบบสองทิศทางที่แปลกใหม่ 1.8TB/s ต่อ GPU ทำให้มั่นใจได้ถึงการสื่อสารความเร็วสูงที่ราบรื่นระหว่าง GPU สูงสุด 576 ตัว สำหรับ LLM ที่ซับซ้อนที่สุด

RAS Engine — GPU ที่ขับเคลื่อนโดย Blackwell มีเอ็นจิ้นเฉพาะเพื่อความน่าเชื่อถือ ความพร้อมใช้งาน และความสามารถในการให้บริการ นอกจากนี้ สถาปัตยกรรม Blackwell ยังเพิ่มความสามารถในระดับชิปเพื่อใช้การบำรุงรักษาเชิงป้องกันโดยใช้ AI เพื่อเรียกใช้การวินิจฉัยและคาดการณ์ปัญหาความน่าเชื่อถือ สิ่งนี้จะเพิ่มเวลาทำงานของระบบให้สูงสุดและปรับปรุงความยืดหยุ่นสำหรับการปรับใช้ AI ขนาดใหญ่เพื่อให้ทำงานอย่างต่อเนื่องเป็นเวลาหลายสัปดาห์หรือหลายเดือนในแต่ละครั้ง และเพื่อลดต้นทุนการดำเนินงาน

nvidia-blackwell-_2-1456x819

โดย NVIDIA Blackwell มีทรานซิสเตอร์ทั้งหมด 104 พันล้านบนชิปประมวลผลแต่ละตัวซึ่งประดิษฐ์บนโหนดกระบวนการ TSMC 4NP สิ่งที่น่าสนใจคือทั้ง Synopsys และ TSMC ใช้เทคโนโลยี CuLitho ของ NVIDIA สำหรับการผลิต GPU Blackwell ซึ่งทำให้แต่ละชิปเร่งการผลิตชิปเร่ง AI รุ่นต่อไปเหล่านี้ GPU B100 มาพร้อมกับอินเทอร์เฟซแบนด์วิธสูง 10 TB/s ซึ่งช่วยให้สามารถเชื่อมต่อระหว่างชิปต่อชิปได้อย่างรวดเร็วเป็นพิเศษ GPU เหล่านี้รวมเป็นชิปตัวเดียวในแพ็คเกจเดียวกัน โดยมีทรานซิสเตอร์สูงถึง 208 พันล้านตัวและการเชื่อมโยงกันของแคช GPU เต็มรูปแบบ

nvidia-blackwell-_6

nvidia-blackwell-_23 nvidia-blackwell-_6

เมื่อเปรียบเทียบกับ Hopper แล้ว NVIDIA Blackwell GPU มีทรานซิสเตอร์มากกว่า 128 พันล้านตัว ประสิทธิภาพ AI 5 เท่า ซึ่งเพิ่มขึ้นเป็น 20 petaFlops ต่อชิป และ 4 เท่าของหน่วยความจำออนไดย์ ตัว GPU เองนั้นจับคู่กับ HBM3e 8 สแต็กที่มีโซลูชันหน่วยความจำที่เร็วที่สุดในโลก โดยนำเสนอแบนด์วิธหน่วยความจำ 8 TB/s บนอินเทอร์เฟซบัส 8192 บิต และหน่วยความจำ HBM3e สูงสุด 192 GB