Sự thật về AI đa diện Fugu của startup Nhật Sakana AI có thực sự ngang Claude?
Sự thật về AI đa diện Fugu của startup Nhật Sakana AI

Trong vài ngày qua, cộng đồng công nghệ quốc tế xôn xao trước thông tin startup Sakana AI có trụ sở tại Tokyo công bố Fugu Ultra, một hệ thống AI được cho là có năng lực ngang hàng với các mô hình tiên tiến của Anthropic như Claude Fable 5 và Mythos. Nhiều bài đăng mô tả đây là bước ngoặt giúp Nhật Bản lần đầu sở hữu mô hình đủ sức cạnh tranh với các tên tuổi dẫn đầu của Mỹ. Tuy nhiên, khi đối chiếu với tài liệu kỹ thuật và thông báo chính thức của Sakana AI, bức tranh thực tế cần được nhìn nhận thận trọng hơn.

Fugu không phải là mô hình nền tảng mới

Sakana AI, do các cựu kỹ sư Google thành lập, nổi tiếng với định hướng phát triển "Collective Intelligence" - xây dựng hệ thống AI hoạt động theo nguyên lý hợp tác giữa nhiều mô hình thay vì chỉ dựa vào một mô hình khổng lồ duy nhất. Trong thông báo phát hành, Sakana AI giới thiệu Fugu là một hệ thống điều phối đa tác tử (multi-agent orchestration). Thay vì trực tiếp giải quyết toàn bộ yêu cầu như GPT, Claude hay Gemini, Fugu đóng vai trò như một "nhạc trưởng": khi nhận câu hỏi, hệ thống phân tích bài toán, chia thành nhiều nhiệm vụ nhỏ, lựa chọn mô hình phù hợp xử lý từng phần, sau đó tổng hợp thành câu trả lời hoàn chỉnh.

Chính vì vậy, Fugu không phải là một foundation model mới theo nghĩa truyền thống mà là một lớp điều phối thông minh đứng phía trên nhiều mô hình AI khác. Đây là điểm khiến nhiều bài đăng trên mạng xã hội dễ gây hiểu nhầm, khi mô tả Fugu như "một mô hình AI mới của Nhật Bản đánh bại Claude", trong khi bản chất sản phẩm lại khác đáng kể. Giá trị cốt lõi của Fugu nằm ở khả năng phối hợp nhiều mô hình để tạo ra kết quả chất lượng cao hơn, chứ không phải huấn luyện một mô hình ngôn ngữ khổng lồ từ đầu.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Tuyên bố hiệu năng chưa được kiểm chứng độc lập

Điểm gây chú ý nhất trong thông báo của Sakana AI là tuyên bố Fugu Ultra đạt hiệu năng tương đương các mô hình hàng đầu như Claude Fable 5 và Mythos trên nhiều bài kiểm tra về lập trình, khoa học và suy luận. Đây là nguồn gốc của loạt bài viết khẳng định Nhật Bản đã sở hữu AI ngang tầm Anthropic. Tuy nhiên, cần lưu ý rằng đây là kết quả do chính Sakana AI công bố. Công ty chưa khẳng định Fugu vượt qua Claude hay thay thế hoàn toàn các mô hình frontier, mà chỉ cho biết hệ thống đạt mức hiệu năng tương đương trên một số bộ benchmark nhất định. Cho đến nay, chưa có nhiều tổ chức nghiên cứu độc lập hoặc bảng xếp hạng uy tín xác nhận đầy đủ những tuyên bố này.

Điều đó không đồng nghĩa Fugu không đáng chú ý. Giới chuyên môn đánh giá hướng tiếp cận của Sakana AI phản ánh xu hướng mới: sau nhiều năm chạy đua xây dựng mô hình ngày càng lớn với chi phí huấn luyện lên tới hàng tỷ USD, ngày càng nhiều công ty chuyển sang tối ưu khả năng điều phối nhiều mô hình hiện có nhằm đạt hiệu quả tương đương với chi phí thấp hơn và khả năng mở rộng linh hoạt hơn.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Giảm phụ thuộc vào mô hình Mỹ, không phải vượt kiểm soát xuất khẩu

Sakana AI cũng nhấn mạnh kiến trúc Fugu giúp doanh nghiệp giảm sự phụ thuộc vào các mô hình do Mỹ phát triển. Một số bài đăng trên mạng xã hội diễn giải điều này thành việc Fugu "vượt qua các lệnh kiểm soát xuất khẩu của Mỹ". Cách diễn đạt này phần nào gây hiểu nhầm. Trên thực tế, Fugu không phải công nghệ nhằm vô hiệu hóa các quy định kiểm soát xuất khẩu. Thay vào đó, hệ thống được thiết kế để điều phối nhiều mô hình khác nhau, bao gồm mô hình mã nguồn mở hoặc triển khai trong nước, qua đó giảm lệ thuộc vào một nhà cung cấp duy nhất.

Các thử nghiệm ban đầu từ cộng đồng phát triển cho thấy bức tranh cân bằng hơn. Nhiều nhà phát triển ghi nhận Fugu tạo ra kết quả chất lượng trong các tác vụ phức tạp, nhưng thời gian xử lý có thể kéo dài đáng kể do phải điều phối nhiều mô hình cùng lúc. Với yêu cầu tốc độ phản hồi tức thì, đây vẫn là điểm cần cải thiện.

Ý nghĩa đối với ngành AI toàn cầu

Dẫu vậy, sự xuất hiện của Fugu mang ý nghĩa đáng chú ý. Trong nhiều năm, cuộc đua AI tiên tiến gần như xoay quanh các "ông lớn" Mỹ như OpenAI, Anthropic, Google hay Meta. Việc một startup Nhật Bản lựa chọn con đường khác, tập trung vào khả năng điều phối thay vì xây dựng mô hình khổng lồ, cho thấy cuộc cạnh tranh AI đang trở nên đa dạng hơn về chiến lược công nghệ.

Vì vậy, sẽ là quá sớm để khẳng định "Nhật Bản đã tạo ra AI ngang Claude" như nhiều bài đăng lan truyền. Điều chính xác hơn là Sakana AI vừa giới thiệu một kiến trúc AI mới với nhiều ý tưởng đáng chú ý và công bố các kết quả benchmark rất tham vọng. Những tuyên bố này hiện vẫn cần thêm thời gian để cộng đồng nghiên cứu và tổ chức đánh giá độc lập kiểm chứng trên quy mô rộng. Nếu Fugu tiếp tục chứng minh hiệu năng trong ứng dụng thực tế, đây có thể là dấu mốc cho thấy tương lai AI không chỉ nằm ở mô hình ngày càng lớn, mà còn ở khả năng kết nối và điều phối hiệu quả sức mạnh của nhiều mô hình khác nhau. Và đó mới có thể là đóng góp lớn nhất của Sakana AI đối với cuộc đua trí tuệ nhân tạo toàn cầu.