Tại một cơ sở mới rộng 12.000 m² ở Wuhan, các cử nhân trẻ dành cả ngày làm việc để điều khiển robot hình người thực hiện những công việc thường nhật như phục vụ bánh bao hấp, lau bàn hay gấp quần áo.
Mọi chuyển động của robot trong các không gian mô phỏng như nhà bếp và phòng ngủ đều được theo dõi bằng camera và cảm biến tại Hubei Humanoid Robot Innovation Center. Phòng thí nghiệm trị giá khoảng 200 triệu nhân dân tệ này là một trong hàng chục cơ sở huấn luyện robot do nhà nước tài trợ đang được xây dựng trên khắp Trung Quốc.

Theo những người vận hành, mục tiêu của các trung tâm này là tạo ra kho dữ liệu huấn luyện khổng lồ để “dạy” robot cách tương tác với thế giới thực. “Chúng tôi giống như giáo viên, còn robot là học sinh”, Zhang Jia, quản lý chương trình 21 tuổi tại cơ sở Vũ Hán, cho biết. Ông cho rằng việc huấn luyện robot đòi hỏi phải lặp lại một hành động hàng trăm đến hàng nghìn lần trước khi máy có thể học được.
Nỗ lực này nằm trong chiến lược công nghệ của Chủ tịch Xi Jinping nhằm đưa Trung Quốc trở thành siêu cường khoa học – công nghệ. Bắc Kinh gần đây đã xác định “trí tuệ hiện thân” (embodied intelligence) là một trong sáu ngành công nghiệp tương lai trong kế hoạch phát triển giai đoạn 2026–2030.
Khái niệm này đề cập đến việc đưa trí tuệ nhân tạo ra khỏi môi trường phần mềm để tương tác trực tiếp với thế giới vật lý thông qua robot.
Theo các chuyên gia, thiếu hụt dữ liệu huấn luyện dành riêng cho robot hiện là một trong những rào cản lớn nhất của ngành. Trong khi các mô hình ngôn ngữ như ChatGPT hay DeepSeek được đào tạo bằng lượng lớn văn bản từ Internet, dữ liệu phục vụ robot thực tế vẫn còn rất hạn chế.
Các công ty trên thế giới đang thử nhiều phương pháp để thu thập dữ liệu, từ thử nghiệm thực tế đến mô phỏng hoặc dữ liệu do AI tạo ra. Chẳng hạn, Tesla từng thử sử dụng video do con người thực hiện để huấn luyện robot Optimus, trong khi startup 1X Technologies tại Thung lũng Silicon muốn đưa robot vào các hộ gia đình để học hỏi qua điều khiển từ xa.
Tại trung tâm ở Vũ Hán, Zhang giám sát khoảng 70 huấn luyện viên làm việc theo ca 8 tiếng để đào tạo 46 robot. Họ sử dụng bộ điều khiển từ xa hoặc thiết bị gắn cảm biến để điều khiển robot lặp lại các động tác.
Trong khi đó, các nhân viên khác kiểm tra video đầu ra và dán nhãn dữ liệu, đánh dấu từng hành động như “xoay trái” hay “giơ tay”. Mỗi ngày, cơ sở này tạo ra khoảng 100 giờ dữ liệu huấn luyện có thể sử dụng.
Dữ liệu thu được bao gồm video, tín hiệu cảm biến và thông tin về vị trí, vận tốc hoặc mô-men xoắn của các bộ phận robot. Những dữ liệu này sau đó được đưa vào các mô hình AI dành cho robot, thường được gọi là mô hình “hành động – ngôn ngữ – thị giác”.
Theo Zhao Xiang, đồng sáng lập startup mô phỏng robot Motphys, một bước đột phá về trí tuệ robot có thể cần tới hàng trăm triệu, thậm chí hàng tỷ giờ dữ liệu huấn luyện.
Dù vậy, các chuyên gia cảnh báo rằng việc thu thập dữ liệu quy mô lớn vẫn đối mặt với nhiều thách thức. Một vấn đề quan trọng là dữ liệu thu thập từ một loại robot thường khó chuyển sang robot khác do khác biệt về phần cứng.
Một số nghiên cứu từ Google DeepMind cho thấy tiềm năng chuyển giao kỹ năng giữa các nền tảng robot khác nhau, nhưng lĩnh vực này vẫn đang trong giai đoạn phát triển.
Theo các nhà phân tích, việc xây dựng mạng lưới trung tâm dữ liệu huấn luyện robot cũng mang lại lợi ích trước mắt cho ngành công nghiệp phần cứng robot của Trung Quốc. Những cơ sở này đã mua hàng nghìn robot để phục vụ quá trình huấn luyện.
Chẳng hạn, trung tâm tại Vũ Hán đã mua hàng chục robot từ AgiBot với giá khoảng 350.000 nhân dân tệ mỗi máy.
Tuy nhiên, nghịch lý vẫn tồn tại. Tại một trung tâm thu thập dữ liệu mà báo chí tới thăm, nhiều robot hình người treo bất động trong một góc sảnh. Một nhân viên cho biết những robot này không dùng để huấn luyện mà chỉ được mang ra biểu diễn mỗi khi có quan chức đến tham quan.

Bình luận
0