Nhạc sĩ Thái Nguyên, người sáng lập dự án ca sĩ ảo AI/T (Ái Trinh), tiết lộ rằng công nghệ AI tạo video đã phát triển nhanh đến mức nhiều kỹ thuật sản xuất từng là "bí quyết" nay đã trở nên lỗi thời chỉ sau một năm.
Thách thức từ những ngày đầu
Theo anh, khi bắt đầu thực hiện những MV đầu tiên cho AI/T vào năm 2025, thách thức lớn nhất không nằm ở khâu sáng tác hay dựng hình, mà là việc giữ cho nhân vật ảo xuất hiện đồng nhất xuyên suốt toàn bộ video.
"Thời điểm đó, các nền tảng AI video chủ yếu hoạt động dựa trên câu lệnh (prompt). Để duy trì cùng một gương mặt qua nhiều cảnh quay, người làm nội dung phải mô tả rất chi tiết từ độ tuổi, kiểu tóc, đường nét khuôn mặt cho đến biểu cảm và trang phục. Chỉ một thay đổi nhỏ trong cách diễn đạt cũng có thể khiến nhân vật bị 'biến dạng' giữa các cảnh. Tôi từng phải chỉnh sửa và thử nghiệm rất nhiều lần chỉ để giữ cho nhân vật xuất hiện nhất quán từ đầu đến cuối MV", nhạc sĩ Thái Nguyên chia sẻ.
Ca sĩ ảo AI/T (Ái Trinh) do nhạc sĩ Thái Nguyên sáng lập (Ảnh: Nhân vật cung cấp).
Do đó, sau mỗi sản phẩm hoàn thành, toàn bộ hệ thống prompt, quy trình xây dựng nhân vật và kinh nghiệm xử lý tình huống đều được lưu lại như một dạng "tài liệu kỹ thuật" cho các dự án tiếp theo.
Công nghệ thay đổi chỉ sau một năm
Tuy nhiên, chỉ sau khoảng một năm, bức tranh công nghệ đã thay đổi rõ rệt. Các nền tảng AI video thế hệ mới hiện cho phép tạo video trực tiếp từ hình ảnh tham chiếu, giúp duy trì tính nhất quán của nhân vật tốt hơn đáng kể. Những bài toán từng mất hàng tuần để xử lý nay có thể rút ngắn xuống còn vài giờ hoặc thậm chí vài phút.
Sự thay đổi này cũng mang đến cho người thực hiện dự án AI/T một góc nhìn khác khi nhìn lại các sản phẩm giai đoạn đầu. "Những MV tôi làm trong năm 2025 mới thực sự là giai đoạn rất đặc biệt. Chúng được tạo ra khi việc giữ một nhân vật AI đồng nhất xuyên suốt MV vẫn là một thử thách lớn. Chỉ sau khoảng một năm, bài toán đó gần như đã được công nghệ giải quyết", anh nói.
Nhạc sĩ Thái Nguyên (Ảnh: Nhân vật cung cấp).
Dấu mốc công nghệ qua từng sản phẩm
Theo nhạc sĩ Thái Nguyên, tốc độ phát triển quá nhanh của AI khiến nhiều sản phẩm trong giai đoạn 2025-2026 trở thành những dấu mốc quan sát quan trọng, phản ánh rõ sự thay đổi của công nghệ qua từng năm.
Chẳng hạn như MV "Không phải em hôm qua" phát hành ngày 27/2. Đây là sản phẩm được thực hiện trong giai đoạn chuyển tiếp giữa hai thế hệ công nghệ: Vừa sử dụng phương pháp tạo video bằng prompt, vừa kết hợp bước đầu với công nghệ tạo video từ hình ảnh tham chiếu. Nhờ đó, nhân vật AI/T có thể xuất hiện tại nhiều địa điểm quen thuộc ở TPHCM như Landmark 81, cầu Ba Son hay khu vực hầm sông Sài Gòn với mức độ đồng nhất cao hơn so với các sản phẩm trước đó.
"Nhìn từ góc độ công nghệ, các MV như vậy không chỉ là sản phẩm nghệ thuật mà còn phản ánh rõ quá trình tiến hóa rất nhanh của AI video trong giai đoạn 2025–2026", nhạc sĩ chia sẻ.



