Cô gái Việt 29 tuổi giúp ChatGPT nói tiếng Việt tự nhiên như người bản xứ
Cô gái Việt giúp ChatGPT nói tiếng Việt tự nhiên

Cô giáo của học trò siêu trí tuệ

Trong các dự án của OpenAI, mỗi ngôn ngữ chỉ có từ 2 đến 4 nhà ngôn ngữ học (Linguist) chính phụ trách kiểm soát chất lượng. Ivy Giao Nguyễn, 29 tuổi, sống tại Chicago (Mỹ), đảm nhận vai trò này cho tiếng Việt. Công việc của cô không chỉ dịch thuật mà còn hiệu chỉnh để AI thoát khỏi lối diễn đạt cứng nhắc, nói chuyện như người bản xứ.

Giao Nguyễn cho biết AI hiện dịch chính xác đến 99% về mặt nghĩa, nhưng điểm yếu là không trôi chảy và đúng ngữ cảnh văn hóa. "Mục tiêu của tôi là AI phải nói tiếng Việt như một người Việt đang sống tại Việt Nam, chứ không phải dịch từ tiếng Anh sang tiếng Việt", cô chia sẻ.

Dạy AI nói có hồn

Một ví dụ điển hình: câu "I'm not going if you're not going" thường được AI dịch là "Tôi sẽ không đi nếu bạn không đi". Giao dạy AI diễn đạt tự nhiên hơn: "Ê bà không đi, tôi cũng không đi đâu nha". Cô giải thích AI thiếu các từ đệm, trợ từ cuối câu như "đó", "nha", "nhé", "à", "ơi" - yếu tố tạo nên hồn của tiếng Việt.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Trong dự án bản địa hóa World Cup, Giao đưa thành ngữ, tục ngữ như "ếch ngồi đáy giếng" vào nội dung OpenAI. Câu "The defending kept the doubters alive" được máy dịch là "Hàng phòng thủ khiến người hâm mộ vẫn hoài nghi", cô hiệu đính thành "Hàng thủ lỏng lẻo khiến ngọn lửa hoài nghi vẫn âm ỉ" để diễn tả trọn vẹn ý và hình ảnh.

Vai trò quan trọng nhất: giúp AI học từ hiệu đính

Bên cạnh sửa lỗi trực tiếp trên các nội dung như email khách hàng hay giao diện web, vai trò quan trọng nhất của Giao là giúp AI học từ chính bản hiệu đính của mình. Qua đó, AI dần hiểu phong cách, văn phong và cách dùng từ đặc trưng của người Việt.

Sự khắt khe của Giao xuất phát từ tình yêu tiếng mẹ đẻ sau gần 10 năm sống xa xứ. "Nếu chỉ dựa vào các bản dịch trực tiếp từ tiếng Anh mà thiếu sự thuần Việt, chúng ta sẽ dần đánh mất cách nói chuyện thực sự của người Việt Nam", cô trăn trở.

Nghề chỉ dành cho người khó tính

Giao tốt nghiệp Tài chính, bén duyên với ngôn ngữ từ năm 2022 khi một công ty khởi nghiệp cần kiểm tra chất lượng dịch máy. Sau đó, cô làm bản địa hóa cho Steam, rồi được Agency Smartling săn đón cho dự án OpenAI. Vị trí Linguist là ngách nghề "độc bản", mỗi ngôn ngữ chỉ có 2-4 chuyên gia trên toàn thế giới.

"Tôi rất khó chịu với sự cẩu thả trong nghề", Giao khẳng định, bám sát tôn chỉ của nhà văn Nam Cao. Trong mô hình AIHT (AI Human Translation), OpenAI đặt niềm tin tuyệt đối vào các Linguist. Giao sẵn sàng đấu tranh với quản lý dự án để bản địa hóa hoàn toàn tên gọi sản phẩm sang tiếng Việt.

Nghề đào vàng có hạn sử dụng

Giao dự báo mình sẽ "nghỉ hưu" trong vòng chưa đầy 5 năm vì AI học rất nhanh. "Tôi hoàn toàn sẵn sàng cho chuyện... mất việc sớm", cô chia sẻ. Mục tiêu cuối cùng của một Linguist là giúp AI phục vụ người Việt tự nhiên nhất mà không cần chỉnh sửa thủ công.

Tại Mỹ, thu nhập trung bình ngành ngôn ngữ từ 40.000 đến 70.000 USD/năm. Với vị trí chuyên gia tại OpenAI, thu nhập của Giao cao gấp đôi so với bản địa hóa thông thường. Cô quan niệm đây là "nghề thời điểm": "Đây là sự may mắn khi tôi có mặt đúng lúc cơ hội mở ra. Nhưng để đi đường dài, cần cả sự linh hoạt và khả năng ứng biến".

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình