Trang chủKhácNghiên cứu nhân chủng học cho biết AI có thể tiết lộ...

Nghiên cứu nhân chủng học cho biết AI có thể tiết lộ hàng loạt tài khoản internet ẩn danh

Nghiên cứu mới có sự tham gia của các nhà khoa học từ Anthropic và ETH Zurich cho thấy các hệ thống trí tuệ nhân tạo hiện đại có thể xác định danh tính trong thế giới thực đằng sau các tài khoản internet được cho là ẩn danh. Nghiên cứu được xuất bản dưới dạng in sẵn trên arXivcho thấy các mô hình ngôn ngữ lớn (LLM) có thể có khả năng phân tích hoạt động trực tuyến và liên kết các hồ sơ ẩn danh với các cá nhân thực trên quy mô lớn.

Nghiên cứu có tiêu đề Hủy ẩn danh trực tuyến quy mô lớn với LLM, khám phá cách các tác nhân AI có thể tự động hóa quá trình hủy ẩn danh – hành động kết nối các tài khoản trực tuyến ẩn danh hoặc bút danh với danh tính thực. Theo truyền thống, quá trình này yêu cầu các nhà phân tích phải điều tra thủ công đáng kể, những người đã tìm kiếm qua các bài đăng, phong cách viết và các manh mối rải rác trên mạng. Tuy nhiên, các nhà nghiên cứu chứng minh rằng các mô hình AI hiện đại có thể tự động thực hiện nhiều bước này.

Video được đề xuất

Trong nghiên cứu, hệ thống AI đã phân tích văn bản công khai từ các nền tảng trực tuyến và trích xuất các tín hiệu liên quan đến danh tính như sở thích cá nhân, manh mối nhân khẩu học, phong cách viết và các chi tiết ngẫu nhiên được tiết lộ trong bài đăng. Sau đó, AI sẽ tìm kiếm các hồ sơ phù hợp trên web và đánh giá xem các manh mối có phù hợp với các cá nhân đã biết hay không.

Để kiểm tra phương pháp này, các nhà nghiên cứu đã tạo ra một số bộ dữ liệu có danh tính thực tế cơ bản đã biết

Một thử nghiệm đã cố gắng so khớp người dùng Hacker News với hồ sơ LinkedIn của họ, ngay cả sau khi xóa các thông tin nhận dạng rõ ràng như tên và tên người dùng. Một tập dữ liệu khác liên quan đến việc liên kết các tài khoản Reddit có biệt danh trên các cộng đồng khác nhau. Tập dữ liệu thứ ba chia lịch sử đăng bài của một người dùng thành hai hồ sơ riêng biệt để xem liệu AI có thể xác định rằng họ thuộc về cùng một người hay không.

Kết quả cho thấy các hệ thống dựa trên LLM vượt trội đáng kể so với các kỹ thuật khử ẩn danh truyền thống. Trong một số trường hợp, các mô hình đạt được khả năng thu hồi lên tới 68% với độ chính xác khoảng 90%, nghĩa là AI đã xác định chính xác nhiều tài khoản trong khi vẫn duy trì tỷ lệ lỗi tương đối thấp. Các phương pháp thông thường trong cùng các thí nghiệm đạt được gần như không thành công.

Bảo mật dữ liệu Bapt

Các nhà nghiên cứu cho biết những phát hiện này nêu bật cách AI có thể tái tạo các nhiệm vụ mà trước đây các nhà điều tra phải mất hàng giờ làm việc. Hệ thống AI có thể tự động trích xuất các đặc điểm liên quan đến danh tính từ văn bản, tìm kiếm các kết quả phù hợp tiềm năng trong số hàng nghìn hồ sơ và đưa ra lý do về ứng cử viên nào có khả năng đúng nhất.

Sự phát triển này rất có ý nghĩa vì tính ẩn danh từ lâu đã được coi là biện pháp bảo vệ cơ bản đối với nhiều người dùng internet.

Tài khoản ẩn danh được sử dụng rộng rãi bởi các nhà báo, người tố cáo, nhà hoạt động và những cá nhân bình thường muốn thảo luận về các chủ đề nhạy cảm mà không tiết lộ danh tính thực sự của họ.

Nghiên cứu cho thấy rằng lớp bảo vệ này – đôi khi được gọi là “sự che khuất thực tế” – có thể yếu đi khi hệ thống AI trở nên tốt hơn trong việc kết nối các đầu mối kỹ thuật số trên các nền tảng. Nếu các công cụ tự động có thể thực hiện công việc này một cách nhanh chóng và rẻ tiền thì rào cản xác định người dùng ẩn danh có thể giảm đáng kể.

Sự riêng tư

Quyền riêng tư Bapt

Các nhà nghiên cứu ước tính rằng chi phí xác định một tài khoản trực tuyến bằng hệ thống thử nghiệm của họ có thể rơi vào khoảng từ 1 đến 4 USD cho mỗi hồ sơ, nghĩa là các cuộc điều tra quy mô lớn có thể được tiến hành tương đối rẻ.

Tuy nhiên, các tác giả cũng lưu ý rằng nghiên cứu được thực hiện trong môi trường được kiểm soát bằng cách sử dụng dữ liệu công khai. Bài báo vẫn chưa được bình duyệt và các nhà nghiên cứu đã cố tình giữ lại một số chi tiết kỹ thuật để giảm nguy cơ bị lạm dụng.

Mặc dù vậy, những phát hiện này đã làm dấy lên cuộc tranh luận giữa các chuyên gia về quyền riêng tư và công nghệ

Nghiên cứu gợi ý rằng các cá nhân có thể cần phải suy nghĩ lại về lượng thông tin cá nhân họ tiết lộ trực tuyến – ngay cả trong những không gian có vẻ ẩn danh. Nhìn về phía trước, các nhà nghiên cứu cho biết cần phải nghiên cứu thêm để hiểu cả những rủi ro và các biện pháp phòng vệ có thể chống lại quá trình ẩn danh do AI cung cấp. Các giải pháp tiềm năng có thể bao gồm các công cụ bảo mật được cải tiến, các biện pháp bảo vệ nền tảng mạnh mẽ hơn hoặc hệ thống AI được thiết kế để ẩn danh dữ liệu nhạy cảm trước khi chia sẻ công khai.

Khi trí tuệ nhân tạo ngày càng có khả năng phân tích khối lượng lớn nội dung trực tuyến, nghiên cứu nêu bật thách thức ngày càng tăng: cân bằng sức mạnh khám phá do AI điều khiển với nhu cầu bảo vệ quyền riêng tư cá nhân trong thời đại kỹ thuật số.



Nguồn DigitalTrend

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới