Một nghiên cứu mới từ startup AI LifePrompt tiết lộ rằng các mô hình trí tuệ nhân tạo như ChatGPT không chỉ vượt qua kỳ thi tuyển sinh vào Đại học Tokyo năm 2026 mà còn có thể đứng đầu bảng xếp hạng, nhờ đạt điểm số cao hơn bất kỳ thí sinh con người nào.
Kết quả ấn tượng của AI
Nghiên cứu đã sử dụng ba mô hình AI lớn: ChatGPT 5.2 Thinking của OpenAI, Gemini 3 Pro Preview của Google, và Claude Opus 4.5 của Anthropic. Các mô hình này được yêu cầu làm bài thi tuyển sinh thực tế do Đại học Tokyo tổ chức vào tháng 2 năm 2026, dùng để tuyển sinh cho khóa học bắt đầu từ tháng 4. Trong đó, bài thi khoa học nhóm 3 dành cho thí sinh muốn vào ngành y được xem là một trong những kỳ thi khó nhất Nhật Bản.
Kết quả cho thấy hai trong ba mô hình AI đạt điểm cao hơn mức điểm cao nhất của thí sinh con người, vốn khoảng 454 trên 550 điểm. ChatGPT là mô hình đạt điểm cao nhất với khoảng 504 điểm, vượt người đứng đầu hơn 50 điểm. Đáng chú ý, các bài thi này chủ yếu yêu cầu trả lời tự luận dài, thay vì trắc nghiệm – dạng bài từng gây khó khăn cho AI trước đây. Vì vậy, kết quả năm 2026 được xem là bước tiến lớn, trong khi hai năm trước, vào năm 2024, ChatGPT-4 vẫn chưa đạt nổi điểm đỗ ở bất kỳ nhóm thi nào của Đại học Tokyo.
Chi tiết điểm số
ChatGPT đạt điểm tuyệt đối ở tất cả các bài toán, bao gồm cả toán dành cho khối khoa học tự nhiên. Năm ngoái, phiên bản ChatGPT o1 chỉ đạt 38 trên 120 điểm. Ở lần thử mới nhất, ChatGPT cũng đạt gần mức tuyệt đối ở các môn khoa học như Vật lý và Hóa học, đồng thời giữ mức điểm cao ở môn Tiếng Anh (khoảng 90%). Tuy nhiên, mô hình này gặp khó khăn hơn ở các môn khoa học xã hội, đặc biệt là phần tự luận dài như Lịch sử thế giới (chỉ đạt khoảng 25%).
Nghiên cứu cũng chỉ ra rằng các mô hình AI vẫn gặp hạn chế khi xử lý các biểu đồ trực quan trong đề thi, đồng thời chưa thể xây dựng mạch văn mượt mà khi viết bằng tiếng Nhật. Dù vậy, ChatGPT vẫn đạt khoảng 503 trên 550 điểm ở ba tổ hợp khoa học của Đại học Tokyo và khoảng 453 trên 550 điểm ở ba tổ hợp khoa học xã hội – đều vượt xa mức điểm đỗ và cao hơn bất kỳ thí sinh nào. Trong khi đó, Gemini thể hiện nhỉnh hơn ChatGPT ở nhóm khoa học xã hội với khoảng 460 điểm.
Khả năng vượt qua các trường khác
Theo nghiên cứu, cả ba mô hình AI đều có thể vượt qua kỳ thi tuyển sinh của Đại học Kyoto, một trường đại học danh tiếng khác tại Nhật Bản, với mức điểm cao hơn cả điểm tối đa mà thí sinh con người từng đạt được ở mọi ngành học.
Nghiên cứu này được đưa ra trong bối cảnh nhiều người trẻ tại Mỹ đang điều chỉnh hướng học tập và chuẩn bị cho những lựa chọn nghề nghiệp mới trước lo ngại AI đe dọa triển vọng việc làm. Tại Hàn Quốc, người đứng đầu ngành giáo dục Seoul đề xuất bỏ kỳ thi đại học quốc gia Suneung vào năm 2040, cho rằng mô hình giáo dục quá nặng về thi cử không còn phù hợp. Trong khi đó, tại Trung Quốc, nghiên cứu AI tại các trường đại học đang đối mặt với thách thức khi nguồn tài trợ thu hẹp và yêu cầu công bố gia tăng.



