Nhiều tác giả không hề biết sách của mình đang được sử dụng để "huấn luyện" AI

Mai Linh (theo CNN)-Chủ nhật, ngày 15/10/2023 06:00 GMT+7

VTV.vn - Gần 200.000 cuốn sách đang được một số công ty công nghệ lớn sử dụng để đào tạo hệ thống trí tuệ nhân tạo mà tác giả không hề hay biết.

Ảnh: Getty Images

Một hệ thống có tên Books3 đã sử dụng dữ liệu dựa trên bộ sưu tập sách điện tử vi phạm bản quyền thuộc mọi thể loại để giúp các hệ thống AI “học” cách truyền đạt thông tin, theo một cuộc điều tra của The Atlantic.

Theo Atlantic, một số văn bản đào tạo AI có thể được lấy từ các bài viết đăng trên internet. Nhưng với AI tiên tiến hơn, chúng đòi hỏi phải có một nguồn văn bản chất lượng cao để tiếp thu ngôn ngữ, đó là lý do sách được sử dụng. Books3 là đề tài của nhiều vụ kiện Meta và các công ty khác, xoay quanh việc sử dụng hệ thống này để huấn luyện trí tuệ nhân tạo.

Giờ đây, nhờ vào một cơ sở dữ liệu được lấy từ Books3 của The Atlantic, các tác giả đã có thể tra xem liệu cuốn sách của họ có đang được sử dụng để huấn luyện AI hay không.

Nhiều tác giả tỏ ra không hài lòng với điều này. Theo The Atlantic, Nora Roberts, tiểu thuyết gia lãng mạn nổi tiếng, có tới 206 cuốn sách bị lấy dữ liệu. Roberts nói: “Chúng tôi là con người, chúng tôi là nhà văn, và chúng tôi đang bị lợi dụng bởi những người sử dụng tác phẩm của chúng tôi mà không được phép hay không trả thù lao”.

Tuy nhiên, không phải tác giả nào cũng khó chịu về việc tác phẩm của họ bị AI sử dụng. James Chappel, người có cuốn sách học thuật về nhà thờ Công giáo hiện đại, chia sẻ trên mạng xã hội rằng: “Tôi không quan tâm chút nào. Tôi muốn cuốn sách của tôi được đọc! Tôi muốn nó mang tính giáo dục!”.

* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV Online và VTVGo!