Mô hình AI lớn của Việt Nam: Sai ngay từ khởi đầu?

Ngày 31 tháng 5 vừa qua, một hội nghị chuyên ngành lớn về AI tại TP.HCM đã đưa ra kết luận gây tranh cãi: "Việt Nam không nên cố xây mô hình AI lớn." Các chuyên gia từ Google DeepMind và Qualcomm bay về tham dự và đồng tình với quan điểm này. Tuy nhiên, bên ngoài hội thảo, các cuộc thảo luận lại sôi nổi và đa chiều hơn, đặt ra nhiều vấn đề đáng suy ngẫm.

Bài toán nan giải của mô hình ngôn ngữ lớn

Mô hình ngôn ngữ lớn (LLM), công nghệ chạy phía sau ChatGPT hay Gemini, đòi hỏi hàng chục nghìn chip GPU, hàng trăm triệu đến hàng tỷ đô la, và vận hành liên tục nhiều tháng. Tiến sĩ Bùi Hải Hưng, người từng dẫn dắt VinAI Research, thẳng thắn chia sẻ: chính VinAI đã thử và phải đổi hướng. Cạnh tranh với OpenAI khi họ sở hữu 200.000 GPU, trong khi chúng ta chỉ có vài trăm, quả là một cuộc đua không cân sức. Chúng ta đã thua trước khi bắt đầu.

Phe phản biện nhanh chóng lên tiếng: Pháp có Mistral, UAE có Falcon, Singapore có SEA-LION. Đây không phải là những mô hình lớn nhất thế giới, nhưng đủ tốt và nằm trong tầm kiểm soát. Việt Nam cũng đang có những dự án tương tự, như GreenMind của VNG, LLM tiếng Việt mã nguồn mở đầu tiên trên nền tảng NVIDIA NIM. Các công ty công nghệ lớn như FPT, Viettel, VNPT đều có những nỗ lực đáng kể.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Cả hai phía đều có lý, nhưng có thể đã cược nhầm ô?

Cả hai quan điểm đều có những lý lẽ đúng đắn, nhưng dường như chỉ tập trung vào một câu hỏi hẹp. Yann LeCun, người đặt nền móng cho mạng thần kinh tích chập (CNN), đã nhiều lần nhấn mạnh: LLM chỉ là máy thống kê ngôn ngữ cực kỳ tinh vi, không hiểu thế giới, không có bộ nhớ liên tục và thất bại với bài toán suy luận mà ngay cả đứa trẻ ba tuổi cũng giải được. Ông cho rằng ngành AI đang bị "nghiện LLM" đến mất phương hướng.

Đầu năm 2026, LeCun đã đặt cược thật. Ông rời Meta, thành lập AMI Labs tại Paris và huy động hơn một tỷ đô la. Hướng đi của ông hoàn toàn khác: xây dựng mô hình thế giới (world models) - một hệ thống học cách thế giới vận hành thay vì chỉ đoán chữ tiếp theo như LLM hiện nay. LeCun dự báo kiến trúc này sẽ thay thế LLM trong vài năm tới.

Câu hỏi chiến lược cho Việt Nam

Quay lại bối cảnh đầu bài: chúng ta tranh cãi có nên xây dựng LLM riêng cho Việt Nam hay không, trong khi người tạo nền móng AI đang cược rằng LLM sắp hết thời. Nếu Việt Nam mất ba năm để xây xong một LLM, nhưng bốn năm sau kiến trúc đó bị thay thế, thì bài toán hoàn vốn sẽ ra sao? Đây mới là câu hỏi đáng suy nghĩ.

GenAI (AI tạo sinh, như ChatGPT, Gemini) sẽ không biến mất, vẫn hữu ích với hàng triệu người mỗi ngày. Nhưng GenAI chỉ là một nhánh nhỏ. Camera phát hiện lỗi trên dây chuyền sản xuất, cảm biến dự báo sâu bệnh đồng ruộng, hệ thống định tuyến logistics, AI trong máy bán hàng tự động: tất cả đều là AI, tạo giá trị thực và không cần đến mô hình tiên phong (frontier model). Nhầm lẫn GenAI với AI nói chung dễ dẫn đến hai thái cực: hoặc yêu thích quá mức, hoặc chối bỏ quá mức. Ứng dụng thực tiễn của AI lại nằm ở khoảng giữa, nơi ít người nhìn vào.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Chủ quyền số và rủi ro phụ thuộc

Hai mươi năm qua, "chủ quyền số" được hiểu ở tầng vật lý: ai sở hữu cáp quang, ai nắm trung tâm dữ liệu. Nhưng khi mô hình ngôn ngữ bắt đầu tóm tắt hồ sơ y tế, phân tích hợp đồng, hỗ trợ quyết định tuyển dụng, nó vô tình định hình cách người dùng tư duy. Hệ thống huấn luyện trên văn bản tiếng Anh hiểu tập quán thương mại Việt Nam hay pháp lý nội địa theo cách rất khác với thực tế. Phụ thuộc vào hạ tầng vật lý đã đáng lo, phụ thuộc vào cách máy nghĩ hộ còn đáng lo hơn.

Không có quốc gia nào tự cung tự cấp AI hoàn toàn. BCG đầu năm 2026 đưa ra mục tiêu thực tế hơn cho các nước chưa sở hữu công nghệ AI: đó là "khả năng phục hồi" (resilience) - có đủ năng lực để không bị khóa cứng vào một nhà cung cấp và hiểu được AI đang tạo ra cái gì. Ở khía cạnh này, GreenMind, dù nhỏ hơn GPT rất nhiều, vẫn có giá trị chiến lược vì hiểu bối cảnh Việt Nam và kiểm soát được.

Thị trường có nuôi nổi mô hình?

Giả sử chúng ta xây xong một LLM tiếng Việt đủ tốt, liệu thị trường có nuôi nổi không, khi phần lớn các công ty AI trên thế giới đều đang "đốt tiền"? 81% người dùng Internet Việt Nam tương tác với công cụ AI hàng ngày, dẫn đầu Đông Nam Á. Nghe ấn tượng. Nhưng chỉ 18% doanh nghiệp sử dụng AI thường xuyên, và 74% trong số đó chỉ dừng lại ở viết email, tóm tắt văn bản, tra cứu. Cá nhân xài miễn phí, doanh nghiệp chưa quen trả tiền. Thị trường sẵn sàng chi cho LLM tiếng Việt chuyên sâu vẫn rất hẹp.

Rủi ro thực sự: xây xong mà thị trường chưa chín. Chi phí vận hành LLM mỗi ngày, dù không có người dùng, vẫn là tiền thật, tính bằng điện và chip. Chờ lâu thì không nổi. Chiến lược mã nguồn mở là lựa chọn thông minh hơn so với xây dựng mô hình tính phí ngay: đó là mở hệ sinh thái để nhà phát triển tự tinh chỉnh cho bài toán của họ, xây dựng cộng đồng song song với việc xây dựng mô hình. Nuôi thị trường cùng lúc nuôi sản phẩm.

Những ví dụ thực tế đang chạy

Trong khi bài toán vĩ mô còn nhiều tranh cãi, vẫn có những ví dụ đang hoạt động hiệu quả. Masan tích hợp AI vào chuỗi bán lẻ WinX và máy bán hàng tự động để dự báo nhu cầu và tự động bổ sung hàng cho 15 triệu thành viên. MoMo dùng học máy trong trợ lý tài chính Moni, phân tích chi tiêu thời gian thực cho hơn 30 triệu người dùng. Họ không tự xây LLM theo kiểu OpenAI, mà đơn giản là dùng đúng công cụ, giải đúng bài toán và vận hành thực tế.

Kết luận: Đâu là hướng đi đúng?

Cá nhân tôi thấy cả hai phía đều đúng. Đốt ngân sách chỉ để theo đuổi mô hình tiên phong là lãng phí. Nhưng nếu bỏ qua hoàn toàn năng lực AI nội địa thì lại là rủi ro chiến lược. Câu trả lời phụ thuộc vào vị trí của bạn. Với người dùng cá nhân, hãy quan tâm đến công cụ AI nào giúp ích ngay hôm nay. Với người xây dựng sản phẩm: bài toán cụ thể là gì, đo kết quả thế nào? Với doanh nghiệp: làm sao tiết kiệm chi phí nhất mà vẫn áp dụng AI có lợi và tuân thủ pháp luật?

Tranh luận về mô hình tiên phong và chủ quyền số là quan trọng, nhưng đó là bài toán của nhà hoạch định và nhà đầu tư dài hạn với số tiền khổng lồ. Sau tất cả, đọc xong bài này, bạn sẽ gõ gì tiếp vào ChatGPT, Gemini, hay đi tìm một điều gì đó sâu hơn?