NVIDIA ra mắt khay tính toán lai Groq3 LPX tại GTC 2026, hướng tới hiệu suất suy luận AI vượt trội

Tại sự kiện GTC 2026, NVIDIA chính thức công bố khay tính toán Vera Rubin lai tích hợp tám đơn vị Groq3 LPX, nhằm tăng tốc hiệu suất suy luận AI với thông lượng tăng gấp 35 lần trên mỗi megawatt.

Saigon Gazette 17/03/2026 09:44

NVIDIA ra mắt khay tính toán lai Groq3 LPX tại GTC 2026, hướng tới hiệu suất suy luận AI vượt trội — NVIDIA ra mắt khay tính toán lai Groq3 LPX tại GTC 2026

NVIDIA trình diễn khay tính toán lai với Groq3 LPX tại GTC 2026

Tại sự kiện GTC 2026, NVIDIA đã chính thức công bố khay tính toán Vera Rubin lai, tích hợp tám đơn vị Groq3 LPX chưa từng được tiết lộ trước đó. Động thái này nhấn mạnh mục tiêu tăng tốc hiệu suất suy luận AI, đặc biệt trong các tác vụ yêu cầu tốc độ cao, giúp NVIDIA củng cố vị thế cạnh tranh trên thị trường đang phát triển mạnh mẽ.

Hợp tác chiến lược giữa NVIDIA và Groq

Hợp tác giữa NVIDIA và Groq đã được chính thức hóa khi CEO Jensen Huang giới thiệu khay tính toán lai mới tại GTC 2026. Khay này tích hợp các đơn vị xử lý thế hệ ba Groq3 LPX trong một rack Rubin, tạo nên sự kết hợp mạnh mẽ nhằm tối ưu hóa cả hai giai đoạn prefill và decode trong quá trình suy luận AI.

Sự kết hợp giữa LPX và Rubin được cho là mang lại hiệu suất suy luận chưa từng có, với khả năng tăng thông lượng suy luận lên gấp 35 lần trên mỗi megawatt. Đây là yếu tố then chốt giúp NVIDIA mở rộng ảnh hưởng trong lĩnh vực mà hãng không phải là người tiên phong, đặc biệt khi đối mặt với các đối thủ như Cerebras.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Thông số kỹ thuật ấn tượng của khay tính toán lai

Mỗi rack tính toán Vera Rubin lai Groq3 LPX chứa tới 256 đơn vị LPU, cung cấp tổng cộng 128GB SRAM tích hợp và băng thông scale-up đạt 640TB/s. Về mặt chi tiết, mỗi chip Groq3 sở hữu:

500MB SRAM
Băng thông SRAM đạt 150TB/s
Khả năng tính toán 1,2 PFLOPs (FP8)

Khi kết hợp khay Rubin và Groq3 LPX, tổng hiệu suất tính toán suy luận AI mà CEO NVIDIA công bố có thể đạt tới 315 PFLOPs, một con số đáng kinh ngạc trong ngành công nghiệp AI.

Kiến trúc đồng thiết kế và tầm nhìn tương lai

Kiến trúc đồng thiết kế LPX được tối ưu hóa cho các mô hình AI hàng nghìn tỷ tham số và ngữ cảnh hàng triệu token, kết hợp cùng Vera Rubin để tối đa hóa hiệu quả về điện năng, bộ nhớ và năng lực xử lý. NVIDIA kỳ vọng các đơn vị LPU của Groq sẽ đóng vai trò tương tự như Mellanox trong lĩnh vực mạng, giúp hãng dẫn đầu ở các tác vụ AI yêu cầu độ trễ thấp.

Trong bối cảnh AI tác tử (agentic AI) được dự báo sẽ phát triển mạnh mẽ, hợp tác với Groq giúp NVIDIA đáp ứng nhu cầu tính toán ngày càng tăng. Hình ảnh thực tế bên trong khay tính toán cũng đã được NVIDIA chia sẻ tại sự kiện, minh chứng cho sự tiến bộ vượt bậc trong công nghệ phần cứng AI.

Sự ra mắt này không chỉ là một bước tiến kỹ thuật mà còn là chiến lược quan trọng để NVIDIA duy trì lợi thế cạnh tranh trong cuộc đua suy luận AI toàn cầu, hứa hẹn mang lại hiệu quả vượt trội cho các ứng dụng thực tế trong tương lai.