Nghiên cứu cảnh báo AI có thể truy ra danh tính người dùng ẩn danh trên mạng

Theo trang Ars Technica, việc sử dụng tài khoản ẩn danh từ lâu được xem là cách giúp người dùng bảo vệ quyền riêng tư khi tham gia thảo luận trên internet. Tuy nhiên, một nghiên cứu gần đây cho thấy các mô hình ngôn ngữ lớn (LLM) có thể truy vết danh tính thật của người dùng bằng cách phân tích nội dung văn bản đăng tải trên nhiều nền tảng khác nhau.

Kết quả thử nghiệm cho thấy hiệu quả truy vết của các mô hình AI cao hơn đáng kể so với những phương pháp giải ẩn danh truyền thống, vốn chủ yếu dựa vào dữ liệu cấu trúc hoặc quá trình điều tra thủ công.

Trong nghiên cứu này, nhóm tác giả xây dựng nhiều bộ dữ liệu từ các nền tảng công khai để kiểm tra khả năng suy luận của LLM. Một trong các tập dữ liệu được tạo bằng cách kết hợp bài viết trên trang Hacker News với hồ sơ LinkedIn thông qua các tham chiếu chéo xuất hiện trong thông tin người dùng.

Sau khi loại bỏ toàn bộ dữ liệu nhận dạng trực tiếp, các nhà nghiên cứu yêu cầu mô hình phân tích phần nội dung văn bản còn lại để tìm các dấu hiệu trùng khớp. Kết quả cho thấy tỷ lệ nhận diện danh tính đạt khoảng 68%.

Nhóm nghiên cứu cũng tiến hành các thử nghiệm khác nhằm đánh giá khả năng suy luận của AI khi chỉ có lượng thông tin rất hạn chế. Trong một trường hợp, mô hình LLM được cung cấp bản ghi phỏng vấn đã được ẩn danh. Từ đó, hệ thống phân tích các chi tiết như lĩnh vực nghiên cứu, công cụ lập trình, phong cách sử dụng tiếng Anh và bối cảnh học thuật.

Dựa trên những tín hiệu này, mô hình tự động tìm kiếm thông tin trên internet để xác định cá nhân phù hợp với các đặc điểm đã thu thập. Thử nghiệm trên 125 người tham gia cho phép xác định chính xác danh tính của khoảng 7% trường hợp.

Ngoài ra, các thí nghiệm sử dụng dữ liệu từ Reddit cũng cho thấy AI có thể suy đoán danh tính dựa trên sở thích giải trí của người dùng. Khi một người thảo luận về phim ảnh trong nhiều cộng đồng khác nhau, hệ thống có thể tổng hợp các bình luận để tìm ra mối liên hệ.

Kết quả cho thấy nếu người dùng chỉ nhắc tới một bộ phim, khoảng 3,1% tài khoản có thể bị nhận diện với độ chính xác 90%. Khi số lượng phim được đề cập tăng lên hơn mười, tỷ lệ nhận diện có thể vượt 48%.

Theo nhóm nghiên cứu, khả năng phân tích văn bản tự nhiên và kết hợp nhiều nguồn thông tin trên internet giúp các mô hình LLM vượt qua nhiều phương pháp giải ẩn danh trước đây. AI có thể ghép nối các manh mối rời rạc để suy luận ra danh tính người dùng.

Các chuyên gia cảnh báo công nghệ này có thể bị khai thác cho nhiều mục đích khác nhau, từ theo dõi hoạt động trực tuyến, xây dựng hồ sơ quảng cáo chi tiết cho đến thực hiện các hình thức lừa đảo nhắm mục tiêu. Điều này đặt ra những thách thức mới đối với việc bảo vệ quyền riêng tư trong môi trường mạng.