Baidu ra mắt ERNIE 5.1: Chi phí huấn luyện giảm 94%, đánh bại đối thủ phương Tây
Baidu ra mắt ERNIE 5.1: Chi phí giảm 94%, vượt đối thủ phương Tây

Baidu, tập đoàn công nghệ thường được ví như "Google của Trung Quốc", vừa chính thức ra mắt mô hình ngôn ngữ lớn ERNIE 5.1, gây chấn động giới công nghệ toàn cầu. Điểm nổi bật không chỉ nằm ở khả năng xử lý vượt trội mà còn ở chi phí huấn luyện thấp hơn khoảng 94% so với các hệ thống AI cùng quy mô. Đây được xem là lời giải mới cho bài toán tối ưu hóa nguồn lực trong kỷ nguyên AI.

Công nghệ nén mạng lưới và chiến lược "đào tạo một lần cho tất cả"

Để đạt được mức giảm chi phí đáng kinh ngạc này, Baidu đã áp dụng phương pháp "huấn luyện sơ bộ đàn hồi đa chiều". ERNIE 5.1 không được xây dựng từ đầu mà dựa trên nền tảng của ERNIE 5.0 (ra mắt tháng 1/2026). Công ty sử dụng khung huấn luyện đàn hồi "Once-For-All", cho phép tối ưu hóa cả một "gia đình" các mô hình với nhiều kích thước trong một lần chạy duy nhất. Các mô hình này chia sẻ trọng số nhưng khác nhau về độ sâu, độ rộng và số lượng khối chuyên gia được kích hoạt.

Từ kiến trúc khổng lồ của ERNIE 5.0 với khoảng 2.400 tỷ tham số, Baidu đã trích xuất một mạng lưới con tối ưu để tạo ra ERNIE 5.1. Kết quả là một mô hình tinh gọn với tổng số tham số chỉ bằng khoảng một phần ba so với bản gốc, và số lượng tham số hoạt động giảm một nửa. Việc kế thừa kho kiến thức từ mô hình "mẹ" mà không cần lặp lại toàn bộ quy trình huấn luyện tốn kém chính là chìa khóa giúp Baidu tiết kiệm tới 94% ngân sách.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Bên cạnh đó, Baidu tái cấu trúc hệ thống học tăng cường, tách các khâu cập nhật mô hình, tạo phản hồi và đánh giá thành các phân hệ độc lập, được điều phối bởi bộ kiểm soát trung tâm. Điều này cho phép mỗi thành phần chạy trên phần cứng phù hợp nhất, tránh tắc nghẽn. Để giải quyết vấn đề sai lệch tính toán trong mô hình hỗn hợp chuyên gia (MoE), Baidu triển khai thư viện tính toán độ chính xác thấp tiêu chuẩn hóa, giúp giảm một nửa sự mất ổn định mà không làm giảm tốc độ xử lý.

Giải quyết "hiệu ứng bập bênh" bằng quy trình huấn luyện bốn giai đoạn

Một thách thức cố hữu khi huấn luyện mô hình AI lớn là "hiệu ứng bập bênh" (seesaw effect): cải thiện kỹ năng này thường làm suy giảm kỹ năng khác. Baidu đã thiết lập quy trình tinh chỉnh bốn giai đoạn gọi là MOPD (Chưng cất Chính sách Trực tuyến Đa giáo viên).

Giai đoạn đầu tiên là huấn luyện có giám sát trên tập dữ liệu rộng lớn. Giai đoạn thứ hai, Baidu huấn luyện song song nhiều mô hình chuyên gia cho các lĩnh vực như lập trình, suy luận logic và tác vụ đại lý, mỗi mô hình có tín hiệu đánh giá riêng. Giai đoạn thứ ba, một mô hình "học sinh" duy nhất học từ tất cả các "giáo viên" chuyên gia bằng cách tự tạo câu trả lời và so sánh với kết quả của chuyên gia. Giai đoạn cuối cùng là học tăng cường tổng quát cho các cuộc đối thoại mở và tác vụ sáng tạo. Nhờ quy trình này, ERNIE 5.1 đạt được sự cân bằng về trình độ giữa các kỹ năng, không để bất kỳ lĩnh vực nào bị ưu tiên quá mức.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Hiệu năng dẫn đầu và tham vọng chiếm lĩnh thị trường toàn cầu

Những nỗ lực tối ưu hóa của Baidu đã mang lại kết quả cụ thể trên các bảng xếp hạng uy tín. Trên LMArena Search Arena, ERNIE 5.1 đạt 1.223 điểm tính đến ngày 9/5, đứng thứ 4 toàn cầu và quán quân trong số các mô hình do Trung Quốc phát triển. Trong các bài kiểm tra về kiến thức và suy luận, ERNIE 5.1 tiệm cận hiệu suất của Gemini 3.1 Pro của Google. Tại kỳ thi toán học AIME26, mô hình đạt tỷ lệ chính xác 99,6% khi sử dụng công cụ hỗ trợ suy luận, chỉ đứng sau Gemini 3.1 Pro. Đặc biệt, trong các tác vụ liên quan đến "khả năng đại lý" như xử lý bảng tính phức tạp hay tự động duyệt web đa bước, ERNIE 5.1 đã vượt qua DeepSeek-V4-Pro – mô hình từng giữ kỷ lục tại Trung Quốc.

Câu chuyện về ERNIE 5.1 gợi nhớ đến DeepSeek R1 vào đầu năm 2025, khi startup này chứng minh có thể đạt hiệu suất tương đương OpenAI o1 với chi phí thấp hơn 98%. Tuy nhiên, trong khi DeepSeek tập trung vào hiệu quả suy luận, ERNIE 5.1 tạo ra bước đột phá ngay từ khâu huấn luyện sơ bộ. Thông điệp của Baidu rất rõ ràng: các phòng thí nghiệm AI Trung Quốc đang liên tục tìm ra phương thức sáng tạo để "làm được nhiều hơn với ít nguồn lực hơn", thay vì chỉ dựa vào sức mạnh phần cứng.

Hiện tại, ERNIE 5.1 đã được triển khai rộng rãi trên hơn 10 nền tảng sáng tạo và đại lý tại Trung Quốc. Người dùng có thể trải nghiệm qua các ứng dụng như nền tảng nhập vai Isekai Zero, công cụ tạo phim ngắn Storymaster, hay ứng dụng đồ họa Diting Huanliu. Các nhà phát triển cũng có thể tiếp cận mô hình qua API trên nền tảng Cloud AI của Baidu. Mặc dù Baidu chưa công bố trọng số mô hình để các bên độc lập xác minh, nhưng sự hiện diện trên các bảng xếp hạng quốc tế đang khẳng định vị thế của nó. Dự kiến, tại hội nghị nhà phát triển Create 2026 diễn ra vào giữa tháng 5 tại Bắc Kinh, Baidu sẽ tiếp tục trình diễn các ứng dụng công nghiệp mới nhất của ERNIE, minh chứng cho tham vọng đẩy mạnh mô hình này vào thị trường doanh nghiệp và mở rộng ra quy mô toàn cầu.