OpenAI ra mắt GPT-5.4: Mô hình AI mới với cửa sổ ngữ cảnh 1 triệu token
GPT-5.4 ra mắt với cửa sổ ngữ cảnh 1 triệu token

OpenAI chính thức ra mắt GPT-5.4: Mô hình AI đột phá cho công việc chuyên nghiệp

Vào thứ Năm vừa qua, OpenAI đã chính thức công bố phiên bản mới nhất của mô hình ngôn ngữ lớn - GPT-5.4. Đây được xem là mô hình nền tảng mạnh mẽ và hiệu quả nhất từ trước đến nay của hãng, đặc biệt tối ưu cho các tác vụ chuyên môn và ứng dụng doanh nghiệp.

Đa dạng phiên bản đáp ứng nhu cầu chuyên biệt

GPT-5.4 không chỉ có phiên bản tiêu chuẩn mà còn được cung cấp dưới hai dạng đặc biệt: GPT-5.4 Thinking (mô hình suy luận) và GPT-5.4 Pro (tối ưu hóa cho hiệu suất cao). Sự đa dạng này cho phép các doanh nghiệp và chuyên gia lựa chọn giải pháp phù hợp nhất với yêu cầu công việc cụ thể của họ.

Cửa sổ ngữ cảnh khổng lồ 1 triệu token

Một trong những cải tiến đáng chú ý nhất của GPT-5.4 là hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token trong phiên bản API. Đây là cửa sổ ngữ cảnh lớn nhất mà OpenAI từng cung cấp, cho phép mô hình xử lý lượng thông tin khổng lồ trong một lần duy nhất. Khả năng này mở ra nhiều ứng dụng mới cho các tác vụ phức tạp đòi hỏi xử lý văn bản dài.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

OpenAI cũng tập trung vào việc cải thiện hiệu quả sử dụng token, khẳng định GPT-5.4 có thể giải quyết cùng một vấn đề với số lượng token ít hơn đáng kể so với các phiên bản tiền nhiệm.

Hiệu suất vượt trội trong các bài kiểm tra chuẩn

GPT-5.4 đạt được những kết quả ấn tượng trong các bài kiểm tra điểm chuẩn. Mô hình này thiết lập kỷ lục mới trong các bài kiểm tra sử dụng máy tính như OSWorld-Verified và WebArena Verified. Đặc biệt, GPT-5.4 đạt 83% điểm số trong bài kiểm tra GDPval của OpenAI dành cho các tác vụ công việc tri thức.

Theo tuyên bố từ CEO Brendan Foody của Mercor, GPT-5.4 còn dẫn đầu trong điểm chuẩn APEX-Agents - được thiết kế để đánh giá kỹ năng chuyên môn trong lĩnh vực luật và tài chính.

Ông Foody nhấn mạnh: "GPT-5.4 vượt trội trong việc tạo ra các sản phẩm yêu cầu phạm vi dài hạn như bộ slide, mô hình tài chính và phân tích pháp lý. Mô hình này mang lại hiệu suất hàng đầu trong khi hoạt động nhanh hơn và với chi phí thấp hơn so với các đối thủ cạnh tranh."

Cải thiện độ chính xác và hệ thống an toàn

OpenAI công bố GPT-5.4 có khả năng mắc lỗi trong các tuyên bố riêng lẻ ít hơn 33% so với GPT-5.2, và các phản hồi tổng thể ít khả năng chứa lỗi hơn 18%.

Trong đợt ra mắt này, OpenAI đã tái cấu trúc cách phiên bản API của GPT-5.4 quản lý việc gọi công cụ thông qua hệ thống mới có tên Tìm kiếm Công cụ (Tool Search). Thay vì đưa ra định nghĩa cho tất cả công cụ có sẵn khi gọi mô hình (một quá trình tiêu tốn nhiều token), hệ thống mới cho phép mô hình tra cứu định nghĩa công cụ khi cần, giúp các yêu cầu trở nên nhanh hơn và tiết kiệm chi phí hơn trong các hệ thống có nhiều công cụ.

OpenAI cũng triển khai đánh giá an toàn mới để kiểm tra "chuỗi suy nghĩ" (chain-of-thought) của mô hình. Các thử nghiệm cho thấy khả năng lừa dối ít xảy ra hơn trong phiên bản Thinking của GPT-5.4, chứng tỏ mô hình thiếu khả năng che giấu suy luận và việc giám sát CoT vẫn là công cụ an toàn hiệu quả.

Sự ra mắt của GPT-5.4 đánh dấu bước tiến quan trọng trong việc phát triển AI phục vụ công việc chuyên nghiệp, với những cải tiến đáng kể về hiệu suất, độ chính xác và khả năng xử lý thông tin quy mô lớn.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình