Nghiên cứu nhân chủng học cho biết AI có thể tiết lộ hàng loạt tài khoản internet ẩn danh

08/03/2026

0

Nghiên cứu mới có sự tham gia của các nhà khoa học từ Anthropic và ETH Zurich cho thấy các hệ thống trí tuệ nhân tạo hiện đại có thể xác định danh tính trong thế giới thực đằng sau các tài khoản internet được cho là ẩn danh. Nghiên cứu được xuất bản dưới dạng in sẵn trên arXivcho thấy các mô hình ngôn ngữ lớn (LLM) có thể có khả năng phân tích hoạt động trực tuyến và liên kết các hồ sơ ẩn danh với các cá nhân thực trên quy mô lớn.

Nghiên cứu có tiêu đề Hủy ẩn danh trực tuyến quy mô lớn với LLM, khám phá cách các tác nhân AI có thể tự động hóa quá trình hủy ẩn danh – hành động kết nối các tài khoản trực tuyến ẩn danh hoặc bút danh với danh tính thực. Theo truyền thống, quá trình này yêu cầu các nhà phân tích phải điều tra thủ công đáng kể, những người đã tìm kiếm qua các bài đăng, phong cách viết và các manh mối rải rác trên mạng. Tuy nhiên, các nhà nghiên cứu chứng minh rằng các mô hình AI hiện đại có thể tự động thực hiện nhiều bước này.

Video được đề xuất

Trong nghiên cứu, hệ thống AI đã phân tích văn bản công khai từ các nền tảng trực tuyến và trích xuất các tín hiệu liên quan đến danh tính như sở thích cá nhân, manh mối nhân khẩu học, phong cách viết và các chi tiết ngẫu nhiên được tiết lộ trong bài đăng. Sau đó, AI sẽ tìm kiếm các hồ sơ phù hợp trên web và đánh giá xem các manh mối có phù hợp với các cá nhân đã biết hay không.

Mục lục

Để kiểm tra phương pháp này, các nhà nghiên cứu đã tạo ra một số bộ dữ liệu có danh tính thực tế cơ bản đã biết

Một thử nghiệm đã cố gắng so khớp người dùng Hacker News với hồ sơ LinkedIn của họ, ngay cả sau khi xóa các thông tin nhận dạng rõ ràng như tên và tên người dùng. Một tập dữ liệu khác liên quan đến việc liên kết các tài khoản Reddit có biệt danh trên các cộng đồng khác nhau. Tập dữ liệu thứ ba chia lịch sử đăng bài của một người dùng thành hai hồ sơ riêng biệt để xem liệu AI có thể xác định rằng họ thuộc về cùng một người hay không.

Kết quả cho thấy các hệ thống dựa trên LLM vượt trội đáng kể so với các kỹ thuật khử ẩn danh truyền thống. Trong một số trường hợp, các mô hình đạt được khả năng thu hồi lên tới 68% với độ chính xác khoảng 90%, nghĩa là AI đã xác định chính xác nhiều tài khoản trong khi vẫn duy trì tỷ lệ lỗi tương đối thấp. Các phương pháp thông thường trong cùng các thí nghiệm đạt được gần như không thành công.

Bảo mật dữ liệu Bapt

Các nhà nghiên cứu cho biết những phát hiện này nêu bật cách AI có thể tái tạo các nhiệm vụ mà trước đây các nhà điều tra phải mất hàng giờ làm việc. Hệ thống AI có thể tự động trích xuất các đặc điểm liên quan đến danh tính từ văn bản, tìm kiếm các kết quả phù hợp tiềm năng trong số hàng nghìn hồ sơ và đưa ra lý do về ứng cử viên nào có khả năng đúng nhất.

Sự phát triển này rất có ý nghĩa vì tính ẩn danh từ lâu đã được coi là biện pháp bảo vệ cơ bản đối với nhiều người dùng internet.

Tài khoản ẩn danh được sử dụng rộng rãi bởi các nhà báo, người tố cáo, nhà hoạt động và những cá nhân bình thường muốn thảo luận về các chủ đề nhạy cảm mà không tiết lộ danh tính thực sự của họ.

Nghiên cứu cho thấy rằng lớp bảo vệ này – đôi khi được gọi là “sự che khuất thực tế” – có thể yếu đi khi hệ thống AI trở nên tốt hơn trong việc kết nối các đầu mối kỹ thuật số trên các nền tảng. Nếu các công cụ tự động có thể thực hiện công việc này một cách nhanh chóng và rẻ tiền thì rào cản xác định người dùng ẩn danh có thể giảm đáng kể.

Sự riêng tư

Quyền riêng tư Bapt

Các nhà nghiên cứu ước tính rằng chi phí xác định một tài khoản trực tuyến bằng hệ thống thử nghiệm của họ có thể rơi vào khoảng từ 1 đến 4 USD cho mỗi hồ sơ, nghĩa là các cuộc điều tra quy mô lớn có thể được tiến hành tương đối rẻ.

Tuy nhiên, các tác giả cũng lưu ý rằng nghiên cứu được thực hiện trong môi trường được kiểm soát bằng cách sử dụng dữ liệu công khai. Bài báo vẫn chưa được bình duyệt và các nhà nghiên cứu đã cố tình giữ lại một số chi tiết kỹ thuật để giảm nguy cơ bị lạm dụng.

Mặc dù vậy, những phát hiện này đã làm dấy lên cuộc tranh luận giữa các chuyên gia về quyền riêng tư và công nghệ

Nghiên cứu gợi ý rằng các cá nhân có thể cần phải suy nghĩ lại về lượng thông tin cá nhân họ tiết lộ trực tuyến – ngay cả trong những không gian có vẻ ẩn danh. Nhìn về phía trước, các nhà nghiên cứu cho biết cần phải nghiên cứu thêm để hiểu cả những rủi ro và các biện pháp phòng vệ có thể chống lại quá trình ẩn danh do AI cung cấp. Các giải pháp tiềm năng có thể bao gồm các công cụ bảo mật được cải tiến, các biện pháp bảo vệ nền tảng mạnh mẽ hơn hoặc hệ thống AI được thiết kế để ẩn danh dữ liệu nhạy cảm trước khi chia sẻ công khai.

Khi trí tuệ nhân tạo ngày càng có khả năng phân tích khối lượng lớn nội dung trực tuyến, nghiên cứu nêu bật thách thức ngày càng tăng: cân bằng sức mạnh khám phá do AI điều khiển với nhu cầu bảo vệ quyền riêng tư cá nhân trong thời đại kỹ thuật số.

Nguồn DigitalTrend

Bài trước

Trump đưa ra mô tả mơ hồ về ‘đầu hàng vô điều kiện’; từ chối loại trừ việc triển khai quân đội Mỹ ở Iran

Bài tiếp theo

Nguồn: Packers mua lại cựu chiến binh Colts LB Franklin

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn

Vui lòng nhập tên của bạn ở đây

Bạn đã nhập một địa chỉ email không chính xác!

Vui lòng nhập địa chỉ email của bạn ở đây

Nghiên cứu nhân chủng học cho biết AI có thể tiết lộ hàng loạt tài khoản internet ẩn danh

Để kiểm tra phương pháp này, các nhà nghiên cứu đã tạo ra một số bộ dữ liệu có danh tính thực tế cơ bản đã biết

Sự phát triển này rất có ý nghĩa vì tính ẩn danh từ lâu đã được coi là biện pháp bảo vệ cơ bản đối với nhiều người dùng internet.

Mặc dù vậy, những phát hiện này đã làm dấy lên cuộc tranh luận giữa các chuyên gia về quyền riêng tư và công nghệ

Coursera muốn người dùng học thông qua nội dung ngắn hơn, nhanh hơn

Đừng nín thở chờ Muse Spark AI của Meta sớm xuất hiện trong ứng dụng điện thoại của bạn

Tai nghe nhét tai mở cuối cùng cũng hoạt động như những người lái xe hàng ngày thực sự

Corsair đã trang bị linh hồn của Elgato Stream Deck vào một phím nóng trên chuột Nightsword v2 của mình

Huấn luyện viên thể hình AI cảm nhận được cơ chế hoạt động của cơ khi bạn tập thể dục và ngăn ngừa chấn...

Bạn có thể cứu hành tinh theo đúng nghĩa đen bằng cách bớt lịch sự hơn với các bot AI như ChatGPT và Gemini

BÌNH LUẬN

Bài viết mới

QB Wilson tuyên bố giải nghệ sau 14 mùa giải

Coursera muốn người dùng học thông qua nội dung ngắn hơn, nhanh hơn

Hezbollah bác bỏ thỏa thuận ngừng bắn giữa Israel-Lebanon khi Trump nỗ lực chấm dứt chiến tranh Iran

Gói chủ quyền công nghệ của EU hạn chế đám mây của Hoa Kỳ, ra mắt Đạo luật Chips 2.0

Bình luận mới

BẢI VIẾT CHỌN LỌC

BÀI VIẾT NÔI BẬT

Đánh giá VAR: Trọng tài UCL đã gọi Mendes-Madueke…

Ngôi sao ‘Rocky’ Dolph Lundgren, vợ Emma Krokdal hòa mình vào Miami Sun sau trận chiến sức khỏe kéo dài nhiều năm của diễn...

Microsoft cuối cùng đã loại bỏ nguồn cấp dữ liệu MSN rác trong các widget của Windows

DANH MỤC NỔI BẬT

ABOUT US

FOLLOW US