AMD hỗ trợ Gemma 4: PC thường cũng chạy được AI mã nguồn mở của Google
AMD hỗ trợ Gemma 4, PC thường chạy AI Google

AMD mở rộng hỗ trợ Gemma 4, AI Google chạy được trên cả PC thường

Hãng công nghệ AMD vừa chính thức công bố hỗ trợ từ ngày đầu ra mắt (Day Zero) cho toàn bộ dòng mô hình AI mã nguồn mở Gemma 4 của Google trên tất cả phần cứng AI của mình. Điều này bao gồm từ GPU dành cho trung tâm dữ liệu cho đến CPU dành cho máy tính cá nhân, mở ra cơ hội tiếp cận công nghệ AI tiên tiến cho đông đảo người dùng.

Gemma 4: Thế hệ AI mã nguồn mở mới nhất từ Google

Gemma 4 là thế hệ mô hình AI mã nguồn mở mới nhất được Google phát triển, với nhiều phiên bản có kích thước từ 2 tỷ đến 31 tỷ tham số. AMD xác nhận rằng toàn bộ dòng sản phẩm của hãng đều có khả năng chạy được các phiên bản này, từ GPU AMD Instinct dành cho máy chủ doanh nghiệp và điện toán đám mây, GPU AMD Radeon cho máy trạm AI, cho đến bộ xử lý AMD Ryzen AI dành cho PC thế hệ mới.

Hỗ trợ đa dạng cho doanh nghiệp và nhà phát triển

Đối với người dùng doanh nghiệp và nhà phát triển, AMD cung cấp hỗ trợ triển khai Gemma 4 qua nhiều framework phổ biến. Trên nền tảng vLLM, được tối ưu cho nhiều yêu cầu đồng thời, toàn bộ GPU AMD tương thích đều có thể chạy Gemma 4, bao gồm cả dòng Instinct và Radeon qua nhiều thế hệ. Framework SGLang cũng được hỗ trợ trên các GPU AMD MI300X, MI325X và MI35X, cho phép triển khai cả dòng mô hình dày đặc (E2B, E4B, 31B) lẫn biến thể MoE (26B-A4B).

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Đáng chú ý, toàn bộ mô hình Gemma 4 đều có thể vừa trong một GPU MI300X duy nhất với bộ nhớ 192 GB HBM ở độ dài ngữ cảnh đầy đủ, mang lại hiệu suất cao cho các ứng dụng phức tạp.

Giải pháp cho người dùng phổ thông trên PC cá nhân

Với người dùng phổ thông muốn trải nghiệm AI ngay trên máy tính cá nhân, AMD đề xuất hai phương án chính:

  • LM Studio: Ứng dụng phổ biến cho phép tải và chạy các mô hình AI trên máy tính cá nhân. Người dùng sở hữu bộ xử lý Ryzen AI, Ryzen AI Max, hoặc card đồ họa Radeon và Radeon PRO chỉ cần tải LM Studio và cài driver AMD Software: Adrenalin Edition mới nhất là có thể sử dụng được Gemma 4 một cách dễ dàng.
  • Lemonade Server: Phần mềm máy chủ AI mã nguồn mở với API tương thích OpenAI. Lemonade hỗ trợ tăng tốc qua ROCm trên GPU Radeon và Radeon PRO, đồng thời hỗ trợ NPU XDNA 2 trên các bộ xử lý Ryzen AI. Điều này cho phép Gemma 4 chạy trên cả GPU lẫn chip AI chuyên dụng tích hợp trong CPU, giúp tiết kiệm điện năng trong nhiều kịch bản sử dụng hàng ngày.

Hỗ trợ NPU cho các phiên bản Gemma-4 E2B và E4B sẽ được cập nhật trong bản Ryzen AI SW tiếp theo, sau đó tích hợp vào Lemonade và cung cấp trực tiếp cho nhà phát triển dưới dạng OnnxRuntime API, đảm bảo tính linh hoạt và khả năng mở rộng.

Với động thái này, AMD không chỉ củng cố vị thế trong thị trường AI mà còn mang công nghệ tiên tiến đến gần hơn với người dùng cá nhân, thúc đẩy sự phát triển của hệ sinh thái mã nguồn mở trong lĩnh vực trí tuệ nhân tạo.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình