Trung Quốc đẩy mạnh huấn luyện robot hình người với kho dữ liệu khổng lồ
Trong một cơ sở rộng 12.000 mét vuông tại Vũ Hán, những cử nhân trẻ Trung Quốc dành cả ngày làm việc để điều khiển robot hình người thực hiện các nhiệm vụ như phục vụ bánh bao hấp, lau chùi bàn ghế và gấp quần áo. Mọi chuyển động của máy móc trong các căn bếp và phòng ngủ mô phỏng tại phòng thí nghiệm trị giá 200 triệu nhân dân tệ này đều được theo dõi và ghi lại bởi hệ thống camera và cảm biến tinh vi.
Chiến lược 'trí tuệ hiện thân' của Bắc Kinh
Trung tâm Đổi mới Robot hình người Hồ Bắc chỉ là một trong hàng chục cơ sở huấn luyện do nhà nước tài trợ, mọc lên khắp Trung Quốc nhằm xây dựng một kho dữ liệu huấn luyện khổng lồ dành riêng cho thiết bị máy móc. Zhang Jia, quản lý chương trình 21 tuổi tại đây, chia sẻ: "Chúng tôi giống như giáo viên, còn robot là học sinh. Dạy một robot đòi hỏi sự lặp lại hành động hàng trăm, hàng nghìn, thậm chí hàng chục nghìn lần, khác xa với việc dạy con người."
Nỗ lực này nằm trong chiến lược của Chủ tịch Tập Cận Bình nhằm biến Trung Quốc thành siêu cường khoa học công nghệ hàng đầu thế giới. Gần đây, Bắc Kinh đã xác định "trí tuệ hiện thân" là một trong sáu ngành công nghiệp tương lai cần thúc đẩy trong kế hoạch 5 năm 2026-2030, kêu gọi phát triển các trung tâm huấn luyện, mô hình AI và phần cứng để tăng tốc triển khai robot hình người.
Thách thức từ sự thiếu hụt dữ liệu
Các chuyên gia chỉ ra rằng sự thiếu hụt dữ liệu huấn luyện dành riêng cho robot vẫn là trở ngại lớn trong việc chuyển hóa những tiến bộ của AI vào lĩnh vực robot thực tế. Trong khi các mô hình ngôn ngữ lớn như ChatGPT được xây dựng trên lượng văn bản khổng lồ từ Internet, việc thu thập dữ liệu robot vẫn ở giai đoạn sơ khai.
Để giải quyết vấn đề này, Trung Quốc đang triển khai nhiều phương pháp, bao gồm:
- Triển khai robot trong thế giới thực để thu thập dữ liệu trực tiếp.
- Sử dụng mô phỏng và dữ liệu do AI tạo ra để tăng cường huấn luyện.
- Đầu tư vào các cơ sở huấn luyện mới trên khắp cả nước, từ Hàng Châu đến Miên Dương.
Tỉnh Hồ Bắc, nơi đặt phòng thí nghiệm Vũ Hán, đã công bố một quỹ nhà nước trị giá 10 tỷ nhân dân tệ dành riêng cho robot hình người. Jay Huang, người đứng đầu bộ phận công nghệ công nghiệp châu Á tại Bernstein, nhận định: "Sự hỗ trợ của chính phủ giúp dữ liệu được chia sẻ rộng rãi, thúc đẩy toàn ngành đi chung một hướng."
Quy trình thu thập dữ liệu bằng 'sức người'
Tại Vũ Hán, Zhang giám sát 70 huấn luyện viên trẻ làm việc theo ca 8 tiếng để đào tạo 46 robot. Họ sử dụng điều khiển từ xa hoặc thiết bị cầm tay gắn cảm biến để vận hành máy móc, lặp đi lặp lại các động tác. Các nhân viên khác túc trực để kiểm tra đầu ra video, dán nhãn từng cảnh quay với chú thích như "xoay trái" hoặc "mở rộng cánh tay".
Cơ sở này tạo ra khoảng 100 giờ dữ liệu có thể sử dụng mỗi ngày. Zhang giải thích: "Chúng tôi thu thập, sắp xếp dữ liệu, sau đó tải lên nền tảng để dán nhãn và xử lý. Chúng tôi vẫn đang trong giai đoạn khám phá." Dữ liệu này được nạp vào các mô hình AI dành cho robot, nhằm tái tạo những đột phá tương tự như trong lĩnh vực ngôn ngữ lớn.
Những thách thức và nghịch lý còn tồn tại
Tuy nhiên, các chuyên gia cảnh báo về một thách thức căn bản: dữ liệu thu thập từ một robot thường không dễ dàng chuyển giao sang robot khác có phần cứng khác biệt. Với tốc độ phát triển nhanh chóng của phần cứng, dữ liệu hôm nay có thể trở nên lỗi thời cho thế hệ máy của năm tới.
Dù vậy, cách tiếp cận của Trung Quốc đã được vạch ra trong tài liệu chiến lược của Bộ Công nghiệp và Công nghệ Thông tin, với trọng tâm là xây dựng các cơ sở dữ liệu huấn luyện quy mô lớn. Một lợi ích hiện hữu là việc các trung tâm thu thập dữ liệu mua sắm thiết bị đã giúp duy trì hoạt động cho các nhà sản xuất robot trong nước.
Ví dụ, Trung tâm Vũ Hán đã mua hàng chục robot từ AgiBot với giá 350.000 nhân dân tệ mỗi con. Các nhà phân tích ước tính, doanh số phục vụ mục đích thu thập dữ liệu chiếm khoảng 20% trong tổng số hơn 20.000 robot hình người xuất xưởng tại Trung Quốc vào năm ngoái.
Tuy nhiên, vẫn tồn tại những nghịch lý. Tại một trung tâm thu thập dữ liệu, hàng tá robot treo bất động trong sảnh lớn. Một nhân viên giấu tên tiết lộ: "Những robot này chỉ dùng để biểu diễn khi có quan chức đến thăm, không phải để huấn luyện." Điều này cho thấy những thách thức trong việc biến tham vọng thành hiện thực.



