Google I/O 2026: Gemini vượt chatbot, trở thành tác nhân AI hoạt động liên tục

Tại I/O 2026, Google ra mắt Gemini 3.5 Flash, Gemini Spark và Omni, đánh dấu bước chuyển từ chatbot sang tác nhân AI hoạt động liên tục, tối ưu chi phí và tích hợp sâu vào hệ sinh thái.

Saigon Gazette 22/05/2026 01:24

Google I/O 2026: Gemini vượt chatbot, trở thành tác nhân AI hoạt động liên tục — Google I/O 2026: Gemini vượt chatbot, thành tác nhân AI

Tại hội nghị I/O 2026 diễn ra rạng sáng 20/5 (giờ Việt Nam), Google công bố phiên bản mới nhất của Gemini cùng mô hình AI mô phỏng thế giới vật lý mang tên Omni. Sự kiện diễn ra trong bối cảnh Google chạy đua bắt kịp tốc độ phát triển AI, đồng thời cung cấp nhiều dịch vụ cho lượng người dùng khổng lồ. I/O 2026 cũng là điểm nhấn khi thị trường tập trung vào mức định giá tăng vọt của OpenAI và Anthropic, cả hai dự kiến phát hành cổ phiếu lần đầu ra công chúng trong năm nay.

Gemini 3.5 Flash: Tốc độ nhanh, tiết kiệm chi phí

Trọng tâm của Google vẫn xoay quanh hệ sinh thái Gemini. Công ty giới thiệu Gemini 3.5 Flash, phiên bản rút gọn nhưng vẫn đảm bảo hiệu quả với chi phí chỉ bằng một nửa, thậm chí một phần ba so với các mô hình tiên tiến tương đương. CEO Sundar Pichai chia sẻ Gemini 3.5 Flash "nhanh đến kinh ngạc". Google cho biết đây sẽ là mô hình mặc định trong Gemini và chế độ AI của Google Search trên toàn cầu. "Bạn không còn phải đánh đổi chất lượng cho tốc độ nữa", thông báo của Google nhấn mạnh. Khả năng bảo vệ tấn công mạng của Gemini 3.5 Flash được cải thiện, giảm tỷ lệ tạo nội dung độc hại và từ chối nhầm các câu lệnh bình thường.

Gemini 3.5 Flash được tối ưu cho các quy trình làm việc phức tạp mang tính tác nhân (agent). Mô hình vượt trội hơn Gemini 3.1 Pro trên nhiều thang điểm, chẳng hạn như Terminal-Bench 2.1 (76,2% so với 70,3%) hay MCP Atlas (83,6% so với 78,2%). Về số lượng token đầu ra mỗi giây, Gemini 3.5 Flash nhanh gấp 4 lần so với một số mô hình mới khác. Mô hình có thể rút ngắn thời gian hoàn tất các tác vụ vốn mất nhiều ngày hoặc nhiều tuần với chi phí thấp hơn, tối ưu cho lập trình viên, doanh nghiệp, nhà khoa học và người dùng phổ thông. Pichai nhấn mạnh: "Các công ty lớn đang xử lý khoảng 1.000 tỷ token mỗi ngày. Nếu chuyển dịch 80% khối lượng công việc đó sang 3.5 Flash, họ sẽ tiết kiệm được hơn 1 tỷ USD/năm". Sau Gemini 3.5 Flash, Google tiết lộ Gemini 3.5 Pro đang được phát triển và sử dụng nội bộ, dự kiến ra mắt rộng rãi trong tháng 6.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Mở rộng Gemini: Spark và Daily Brief

Ứng dụng Gemini được thiết kế lại với ngôn ngữ Neural Expressive. Điểm mới đến từ Gemini Spark, tác nhân AI cá nhân hoạt động liên tục. Tính năng này vận hành dựa trên nền tảng Gemini 3.5, có thể kết nối trực tiếp với Gmail, Google Docs hay Slides. Khác biệt của Gemini Spark là khả năng chạy ngầm, vận hành kể cả khi người dùng khóa điện thoại hay máy tính. Một số công dụng của Spark gồm phân tích sao kê thẻ tín dụng hàng tháng để cảnh báo phí thuê bao hoặc chi phí ẩn, kiểm tra email để trích xuất và tổng hợp thông tin quan trọng, tóm tắt cuộc họp rồi viết lên Google Docs.

Trên Android, người dùng có thể theo dõi cập nhật trực tiếp và tiến độ thực hiện tác vụ của các tác nhân như Spark qua giao diện mới mang tên Android Halo, dự kiến ra mắt vào cuối năm nay. Đến cuối mùa hè, Spark cũng sẽ vận hành trực tiếp trong Chrome, biến trình duyệt thành agent hỗ trợ người dùng trên Internet. Để đảm bảo quyền riêng tư, người dùng có thể không kích hoạt Gemini Spark, cũng như chọn các ứng dụng được kết nối. Tính năng này dự kiến được triển khai thử nghiệm từ cuối tháng 5 cho thuê bao Google AI Ultra tại Mỹ.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Daily Brief là tính năng mới trên Gemini, cung cấp bản tóm tắt cá nhân hóa vào mỗi buổi sáng. Các thông tin được tổng hợp từ email và lịch để tạo ra báo cáo ngắn gọn. Người dùng có thể yêu cầu loại thông tin cần ưu tiên, thậm chí hướng dẫn bước xử lý tiếp theo để AI vận hành. Hiện tại, Daily Brief hỗ trợ thuê bao AI Plus, Pro và Ultra tại thị trường Mỹ. Google cũng tiết lộ cập nhật cho ứng dụng Gemini trên macOS, bao gồm tích hợp Gemini Spark để xử lý và tự động hóa quy trình làm việc. Hệ thống nhận diện giọng nói Rambler cũng được hỗ trợ trên macOS, loại bỏ các từ thừa để chuyển đổi giọng nói thành văn bản mượt mà hơn.

Sáng tạo video với Gemini Omni

Gemini Omni là mô hình mô phỏng thế giới vật lý. Trước đây, DeepMind đã phát triển các mô hình tương tự nhưng chỉ dùng trong lĩnh vực robot và game. Với Omni, người dùng có thể kết hợp hình ảnh, âm thanh và văn bản để tạo ra video chất lượng cao, dựa trên nền tảng kiến thức về thế giới thực của Gemini. Omni có thể áp dụng các định luật vật lý như lực hấp dẫn, động năng và động lực học chất lưu một cách chính xác. Nhờ kiến thức sẵn có từ Gemini, mô hình có khả năng dự đoán diễn biến tiếp theo. Mô hình hỗ trợ chỉnh sửa bằng ngôn ngữ tự nhiên, bối cảnh luôn duy trì nhất quán qua mỗi lần chỉnh. Người dùng có thể dễ dàng thêm nhân vật, chèn vật thể hoặc thay đổi khung cảnh qua câu lệnh. Omni cũng hỗ trợ tạo avatar ảo với ngoại hình, giọng nói giống ngoài đời. Các video đều có ảnh chìm SynthID để nhận biết nội dung tạo bởi AI. Google cho biết phiên bản đầu tiên mang tên Gemini Omni Flash sẽ được triển khai trong ứng dụng Gemini, Flow và YouTube Shorts. Trong thời gian tới, mô hình này sẽ hỗ trợ đầu ra hình ảnh và âm thanh.

Tham vọng AI của Google

Chi phí đầu tư ngày càng lớn khiến Phố Wall đặt ra nhiều kỳ vọng. Giới đầu tư muốn thấy Google tích hợp sâu AI vào các sản phẩm cốt lõi nhằm tạo ra lợi nhuận bền vững. Các công cụ tác nhân (agent) như Spark hay Daily Brief là câu trả lời của Google. Thông qua sự kết hợp của Gemini 3.5 Flash tối ưu chi phí và Omni, hãng đang nỗ lực giữ vững vị thế trước các đối thủ cạnh tranh. Không chỉ riêng Google, kỳ vọng dành cho các công ty AI tiếp tục tăng cao, đặc biệt sau khi Anthropic công bố Mythos, mô hình được tuyên bố có thể phát hiện hàng nghìn lỗ hổng bảo mật chưa từng thấy trong cơ sở hạ tầng phần mềm toàn cầu.