Tuyên bố trên được Google đưa ra trong bối cảnh các "gã khổng lồ" công nghệ trên thế giới nỗ lực cạnh tranh để thống trị thị trường Internet. Dữ liệu là yếu tố quan trọng nhằm hướng tới những tiến bộ trong AI. Google cũng như các đối thủ công nghệ lớn của hãng này đều muốn khai thác thông tin để giúp sản phẩm hoạt động tốt hơn và hữu dụng hơn với nhiều đối tượng nhất có thể.
Nhà nghiên cứu Johan Schalkwyk tại Google dẫn chứng tình huống của một người ở châu Phi nói tiếng Wolof, mới bắt đầu sử dụng Internet và có thể gặp khó khăn khi muốn dùng điện thoại để hỏi địa chỉ hiệu thuốc gần nhất. Ông cho rằng những tình huống như vậy rất thường xảy ra, nhưng ngôn ngữ đó "không phải ai trên thế giới cũng biết".
Cũng theo chuyên gia Schalkwyk, hiện có hơn 7.000 ngôn ngữ trên toàn cầu. Tuy nhiên, Google tới nay mới chỉ cung cấp các bản dịch cho hơn 130 ngôn ngữ. Do đó, công ty này đang nhắm tới việc mở rộng đáng kể chức năng dịch thuật và muốn khai thác dữ liệu trên các ngôn ngữ mới, không chỉ từ các văn bản sẵn có trên internet mà còn từ video, hình ảnh và các đoạn ghi âm bài phát biểu.
Nhóm nghiên cứu của Google cũng đang nỗ lực tìm cách thu thập các đoạn ghi âm của các ngôn ngữ mà có thể không có nhiều tài liệu văn bản. Công ty này dự kiến sẽ tích hợp những thành tựu phát triển AI nói trên vào các sản phẩm của Google, trong đó bao gồm cả YouTube và Google dịch.
Hồi đầu năm nay, Meta - công ty mẹ của Facebook - cũng đã công bố một kế hoạch tương tự mang tên "No Language Left Behind" (tạm dịch: Không ngôn ngữ nào bị bỏ lại phía sau). Dự án của Meta đặt mục tiêu xây dựng các hệ thống dịch thuật hàng trăm ngôn ngữ trên thế giới.
* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV Online và VTVGo!