Phát hiện Gemini Omni: Mô hình tạo video AI mới của Google
Gemini Omni: Mô hình tạo video AI mới của Google

Bên cạnh hiệu ứng hoạt hình mới trên ứng dụng Gemini cho cả iOS và Android, một người dùng Reddit đã báo cáo về mô hình mang tên Gemini Omni. Theo thông tin, đây có thể là thế hệ công cụ sáng tạo video AI tiếp theo do Google phát triển.

Phát hiện từ người dùng Reddit

Theo người dùng Zacatac_391, khi mở ứng dụng Gemini, họ nhận được thông báo mời gọi "tạo nội dung với Gemini Omni" - mô hình tạo video AI mới của Google. Người dùng đã thử nghiệm với yêu cầu tạo video, trong đó một giáo sư viết chứng minh toán học cho các hằng đẳng thức lượng giác trên bảng đen.

Kết quả là một video ấn tượng với hình ảnh sống động và nội dung chính xác. Tuy nhiên, video chưa hoàn hảo khi một số chi tiết như thao tác viết không khớp với hình ảnh và hiện tượng phấn biến mất ở cuối video, cho thấy sự không nhất quán.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Những hạn chế của Gemini Omni

Zacatac_391 cũng thử nghiệm với bài kiểm tra "Will Smith ăn mì Ý" để đánh giá hiệu suất, nhưng không đạt kết quả như mong đợi. Cảnh hai người đàn ông ngồi tại nhà hàng sang trọng bên bờ biển cho thấy mì Ý xuất hiện đột ngột trên đĩa và người trong video không nhai kỹ.

Để so sánh, người dùng Reddit janekm3 thử nghiệm với mô hình Seedance 2 của ByteDance và nhận thấy chất lượng hình ảnh ổn định hơn, dù video vẫn bị giật.

Thông tin thêm về Omni

Zacatac_391 phát hiện phần mới hiển thị mức sử dụng cho phép, cho thấy người này đã đạt 86% giới hạn sử dụng hằng ngày chỉ sau hai yêu cầu tạo video trên gói Google AI Pro.

Trong khi đó, người dùng Max Weinbach trên X tìm thấy siêu dữ liệu chỉ ra Omni là phần mở rộng của công cụ sáng tạo video AI Veo mà Google phát hành trước đó. Mọi chi tiết về Omni và cải tiến dự kiến được Google công bố vào tuần sau.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình