Cư dân mạng Việt Nam đang xôn xao trước tính năng mới Images 2.0 trên ChatGPT, được OpenAI giới thiệu với khả năng tạo ảnh nhanh và chính xác hơn, đặc biệt là văn bản tiếng Việt hiển thị gần như không mắc lỗi chính tả hay sai lệch ký tự.
Mô hình tạo ảnh mới này đang thu hút sự chú ý của giới công nghệ và người dùng trong nước, khi lần đầu tiên văn bản trong ảnh được xử lý chính xác, kể cả với tiếng Việt, khắc phục điểm yếu cố hữu của các thế hệ AI trước đây. Trước đây, các công cụ như DALL-E 3 thường xuyên mắc lỗi chính tả, thậm chí tự bịa ra từ ngữ khi tạo hình ảnh có chứa văn bản. Giờ đây, Images 2.0 có thể tạo ra một thực đơn nhà hàng hoàn chỉnh với nội dung rõ ràng, tự nhiên, khó phân biệt với sản phẩm do con người thiết kế.
Thử nghiệm thực tế với tiếng Việt
Qua thử nghiệm, so với phiên bản Image 1.5 ra mắt cuối năm ngoái, ChatGPT tích hợp Images 2.0 cho khả năng tạo ảnh nhanh hơn và độ chính xác cao hơn. Văn bản tiếng Việt hiển thị gần như không gặp lỗi chính tả hay sai lệch ký tự, kể cả với nội dung dài. Người dùng có thể tùy chọn nhiều tỉ lệ khung hình như vuông, chân dung, ngang hoặc màn ảnh rộng.
Theo phản hồi từ cộng đồng, Images 2.0 của OpenAI đang tạo áp lực cạnh tranh đáng kể lên các đối thủ, trong đó có Nano Banana Pro của Google. Một người dùng mạng xã hội nói vui: 'Sau khi Google ra Nano Banana Pro thì cuối cùng ChatGPT cũng tham gia cuộc chơi với Image 2.0. Nó hiểu tiếng Việt rõ hơn, cấu trúc câu lệnh chi tiết hơn. Kiểu này mấy anh làm menu dạo tha hồ mà nhận đơn'.
Tích hợp khả năng tư duy và kiểm tra kết quả
Dù chưa công bố chi tiết công nghệ, OpenAI cho biết Images 2.0 được tích hợp khả năng 'tư duy', có thể tự kiểm tra kết quả, tìm kiếm thông tin và tạo nhiều biến thể hình ảnh từ một yêu cầu. Nhờ đó, mô hình có thể thiết kế các sản phẩm phức tạp như ấn phẩm marketing, giao diện hoặc truyện tranh nhiều khung với độ chi tiết cao.
Khả năng hiển thị chữ ngoài bảng chữ cái Latin như tiếng Nhật, Hàn hay Hindi cũng được cải thiện rõ rệt. Độ phân giải đầu ra có thể đạt tới 2K, giúp tái hiện tốt các chi tiết nhỏ, biểu tượng và bố cục dày đặc - những yếu tố từng là hạn chế lớn của AI tạo ảnh trước đây.
Người dùng hài lòng và triển vọng ứng dụng
Images 2.0 đã được cung cấp cho toàn bộ người dùng ChatGPT và Codex. Người dùng trả phí có thể tiếp cận thêm các tùy chọn nâng cao. OpenAI cũng mở API gpt-image-2 với mức giá phụ thuộc vào chất lượng và độ phân giải đầu ra. Với những cải tiến này, tình trạng sai lỗi chính tả khi tạo ảnh bằng AI gần như đã được khắc phục, mở ra nhiều ứng dụng thực tiễn trong thiết kế và truyền thông.



