Hai kỹ sư Việt Nam tỏa sáng tại đấu trường AI toàn cầu
Hội nghị thường niên lần thứ 40 của Hiệp hội Trí tuệ Nhân tạo (AAAI-26) vừa diễn ra tại Singapore, quy tụ những nhóm nghiên cứu xuất sắc nhất từ các tập đoàn công nghệ và viện hàn lâm hàng đầu thế giới. Sự kiện học thuật danh giá này đã chứng kiến sự góp mặt ấn tượng của hai đại diện Việt Nam: kỹ sư Nguyễn Thị Ngân và Tiến sĩ Trần Văn Khánh, cả hai đều đang công tác tại Trung tâm GenAI, FPT Smart Cloud thuộc Tập đoàn FPT.
Nghiên cứu đột phá về mô hình ngôn ngữ nhỏ gọn
Nguyễn Thị Ngân, 26 tuổi, đã trình bày báo cáo nghiên cứu về phương pháp "CTPD: Cross Tokenizer Preference Distillation". Công trình này tập trung vào một vấn đề cấp thiết: làm thế nào để tạo ra các mô hình AI vừa nhỏ gọn vừa hiệu quả, giúp doanh nghiệp tiết kiệm chi phí vận hành khổng lồ khi sử dụng các mô hình ngôn ngữ quy mô lớn.
Nhóm nghiên cứu của Ngân tìm cách chuyển đổi các mô hình mạnh sang phiên bản gọn nhẹ hơn, nhưng vẫn giữ được khả năng trả lời chính xác và phù hợp với nhu cầu người dùng. Thách thức kỹ thuật lớn nhất là mỗi mô hình có một bộ tách từ (tokenizer) khác nhau, dẫn đến sai lệch trong quá trình truyền đạt tín hiệu huấn luyện.
Giải pháp đột phá của nhóm là sử dụng vị trí ký tự trong câu gốc làm mốc chung để căn chỉnh, thay vì cố ép các mô hình phải có chung cách "cắt chữ". Điều này cho phép mô hình nhỏ học được phong cách trả lời từ mô hình lớn một cách chính xác nhất. Ngân chia sẻ: "Chúng tôi muốn giúp cộng đồng tái sử dụng các mô hình mạnh sẵn có để tạo ra những mô hình thực dụng cho nhiều bài toán khác nhau như chăm sóc khách hàng, luật hay ngân hàng".
Quá trình nghiên cứu trải qua ba tháng làm việc cường độ cao, với áp lực lớn khi kết quả thử nghiệm chưa đạt kỳ vọng chỉ một tuần trước hạn nộp bài. Tuy nhiên, những số liệu bứt phá cuối cùng đã giúp công trình được chấp thuận và thuộc top 3% bài báo xuất sắc tại hội nghị. Ban tổ chức đánh giá nghiên cứu này mang tư duy thực tế, nhấn mạnh rằng AI không nhất thiết phải luôn khổng lồ mà cần đủ gọn và thông minh để phục vụ cộng đồng.
Hệ thống giáo dục trực tuyến thông minh với AI đa tác nhân
Trong khi đó, Tiến sĩ Trần Văn Khánh tập trung vào việc thay đổi cách con người tương tác với AI trong giáo dục thông qua công trình "SAGE". Đây là một khung làm việc đa tác nhân (Multi-Agent) nhằm giải quyết vấn đề cốt lõi của giáo dục trực tuyến: sự thiếu hụt tương tác nhóm có cấu trúc sư phạm.
SAGE mô phỏng buổi học nhóm với các "bạn học AI" đóng vai trò khác nhau, bao gồm:
- Một AI điều phối tiến độ học tập.
- Một AI đóng vai chuyên gia hỗ trợ kiến thức.
- Một AI đóng vai trò động viên, khích lệ.
Điểm khác biệt lớn nhất của SAGE so với các hệ thống cũ là khả năng "biết nói đúng lúc và im lặng đúng lúc". Các AI Agent trong hệ thống có cơ chế tự chủ, không trả lời thay học sinh quá sớm mà chỉ đưa ra gợi ý khi cần thiết, tuân theo phương pháp "giàn giáo" trong sư phạm - hỗ trợ nhiều lúc đầu và giảm dần để học sinh tự làm chủ kiến thức.
Tiến sĩ Khánh chia sẻ: "Khi AI biết lùi lại đúng lúc, người học sẽ chủ động hơn thay vì chỉ trông chờ vào đáp án". Nghiên cứu này ra đời từ sự kết hợp giữa khối nghiên cứu hàn lâm và thực tế công nghiệp, với trăn trở về việc AI hiện nay dù giỏi trả lời nhưng vẫn thiếu tính "người" và sư phạm.
Kết quả thử nghiệm trên các bài toán lớp 12 cho thấy SAGE đạt tỷ lệ hiệu quả sư phạm vượt trội (hơn 72%) so với các phương pháp thông thường. Dù đối mặt với thách thức về chi phí và độ trễ khi vận hành nhiều tác nhân AI cùng lúc, tầm nhìn của Khánh vẫn hướng đến việc xây dựng các lớp học ảo thông minh, nơi AI trở thành người đồng hành giúp rút ngắn khoảng cách tri thức.
Nền tảng cho sự phát triển công nghệ tương lai
Cả hai công trình nghiên cứu đều được đánh giá là nền tảng quan trọng để đội ngũ chuyên gia tiếp tục phát triển chuyên sâu, chuyển hóa công nghệ thành giá trị thực tiễn, theo đúng định hướng làm chủ công nghệ của Tập đoàn FPT. Việc xuất hiện tại AAAI-26 không chỉ là cơ hội để khẳng định năng lực nghiên cứu mà còn chứng minh rằng những vấn đề giáo dục và công nghệ tại Việt Nam hoàn toàn có thể được giải quyết bằng các giải pháp đạt tiêu chuẩn toàn cầu.
Các thử nghiệm nghiên cứu được tăng tốc trên FPT AI Factory - nền tảng hạ tầng GPU Cloud cho phép chạy và đánh giá nhiều cấu hình mô hình. Việc chủ động hạ tầng này giúp nhóm rút ngắn thời gian chạy thử nghiệm, tăng tính ổn định khi huấn luyện và mở rộng quy mô đánh giá theo yêu cầu một cách thuận lợi hơn.



