OpenAI Lần Đầu Vận Hành GPT-5.3-Codex-Spark Trên Chip Cerebras, Không Phải Nvidia
OpenAI vừa chính thức ra mắt mô hình GPT-5.3-Codex-Spark, một phiên bản rút gọn và tiết kiệm năng lượng của dòng Codex, được tối ưu hóa đặc biệt cho các tác vụ lập trình nhanh chóng và khả năng tương tác liên tục. Điểm đáng chú ý nhất là đây là lần đầu tiên công ty sở hữu ChatGPT triển khai một mô hình vào vận hành thực tế trên nền tảng phần cứng không phải của Nvidia, mà thay vào đó là từ Cerebras Systems.
Kiến Trúc Chip Cerebras Và Hiệu Suất Vượt Trội
Phần cứng đứng sau sự thay đổi mang tính bước ngoặt này là Wafer Scale Engine thế hệ thứ ba của Cerebras. Khác với các cụm GPU truyền thống được ghép nối từ nhiều chip nhỏ, kiến trúc độc đáo của Cerebras sử dụng một tấm silicon khổng lồ chứa hàng trăm nghìn nhân xử lý AI. Thiết kế này giúp giảm thiểu đáng kể độ trễ và tối đa hóa tốc độ truyền tải dữ liệu, vốn là những điểm yếu thường gặp trong các tác vụ phản hồi thời gian thực.
OpenAI tiết lộ rằng khi chạy trên hệ thống của Cerebras, GPT-5.3-Codex-Spark có thể đạt tốc độ xử lý ấn tượng, vượt quá 1.000 token mỗi giây. Mô hình này được tinh chỉnh kỹ lưỡng để hỗ trợ lập trình viên trong việc chỉnh sửa từng đoạn mã cụ thể hoặc chạy các bài kiểm tra mục tiêu một cách nhanh chóng và hiệu quả.
Chiến Lược Đa Dạng Hóa Phần Cứng Của OpenAI
Mặc dù bắt đầu đa dạng hóa nguồn cung phần cứng, OpenAI vẫn khẳng định sự phụ thuộc chủ yếu vào Nvidia. Đầu tháng 2, CEO Sam Altman đã viết trên X rằng công ty "yêu thích hợp tác với Nvidia" và gọi đây là nhà sản xuất chip tốt nhất thế giới. Động thái này của Altman nhằm dập tắt những tin đồn rằng OpenAI đang không hài lòng với hiệu suất của một số dòng chip Nvidia. Trên thực tế, các mô hình mạnh mẽ nhất của OpenAI vẫn được đào tạo và vận hành chủ yếu trên hạ tầng của Nvidia.
Việc bắt tay với Cerebras là một phần trong kế hoạch mở rộng hệ sinh thái phần cứng của OpenAI. Tháng trước, công ty đã xác nhận ký kết thỏa thuận triển khai hạ tầng tính toán 750 MW với Cerebras, kéo dài đến năm 2028. Ngoài ra, OpenAI cũng đã đồng ý mua lượng chip tương đương 6 GW từ AMD trong nhiều năm, đồng thời hợp tác với Broadcom để tự thiết kế các bộ tăng tốc AI và linh kiện mạng tùy chỉnh.
Tương Lai Của GPT-5.3-Codex-Spark Và Người Dùng
Hiện tại, dòng mô hình Codex đã đạt hơn một triệu người dùng hoạt động hàng tuần, cho thấy sự phổ biến và tiềm năng lớn. GPT-5.3-Codex-Spark hiện đang được cung cấp dưới dạng thử nghiệm cho những người đăng ký gói ChatGPT Pro. OpenAI dự kiến sẽ mở rộng quyền truy cập cho nhiều nhóm người dùng hơn sau khi đánh giá kỹ lưỡng hiệu năng và nhu cầu thị trường.
Siêu máy tính Andromeda của Cerebras, được đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) từ năm 2022, đóng vai trò then chốt trong việc hỗ trợ các hoạt động này. Sự kiện này không chỉ đánh dấu một bước tiến trong công nghệ AI mà còn phản ánh xu hướng đa dạng hóa nguồn cung phần cứng trong ngành công nghiệp trí tuệ nhân tạo.



