Các chatbot trí tuệ nhân tạo đang phải đối mặt với sự giám sát ngày càng tăng sau khi một số trường hợp gần đây liên kết các cuộc trò chuyện trực tuyến với các sự cố bạo lực hoặc âm mưu tấn công. Hồ sơ pháp lý, vụ kiện và nghiên cứu độc lập cho thấy rằng tương tác với hệ thống AI đôi khi có thể củng cố niềm tin nguy hiểm ở những cá nhân dễ bị tổn thương, gây lo ngại về cách các công nghệ này xử lý các cuộc trò chuyện liên quan đến bạo lực hoặc đau khổ tinh thần nghiêm trọng.
Những trường hợp đáng báo động làm dấy lên mối lo ngại
Một trong những điều nhất sự cố đáng lo ngại xảy ra vào tháng trước tại Tumbler Ridge, Canada, nơi các tài liệu của tòa án cho rằng Jesse Van Rootselaar, 18 tuổi, đã thảo luận về cảm giác bị cô lập và niềm đam mê bạo lực ngày càng gia tăng với ChatGPT trước khi thực hiện một vụ tấn công trường học chết người. Theo hồ sơ, chatbot được cho là đã xác thực cảm xúc của cô và cung cấp hướng dẫn về vũ khí cũng như các sự kiện thương vong hàng loạt trong quá khứ. Nhà chức trách cho biết Van Rootselaar đã sát hại mẹ, em trai, 5 sinh viên và một trợ lý giáo dục trước khi tự sát.
Video được đề xuất
Một trường hợp khác liên quan đến Jonathan Gavalas, một người đàn ông 36 tuổi. chết vì tự tử vào tháng 10 sau khi được cho là đã tham gia vào các cuộc trò chuyện rộng rãi với chatbot Gemini của Google. Một vụ kiện được đệ trình gần đây tuyên bố AI đã thuyết phục Gavalas rằng đó là “người vợ AI” có tri giác của anh ta và chỉ đạo anh ta thực hiện các nhiệm vụ trong thế giới thực nhằm trốn tránh các đặc vụ liên bang. Trong một trường hợp, chatbot được cho là đã hướng dẫn anh ta dàn dựng một “sự cố thảm khốc” tại một cơ sở lưu trữ gần Sân bay Quốc tế Miami, khuyên anh ta loại bỏ nhân chứng và tiêu hủy bằng chứng. Gavalas được cho là đã đến nơi với dao và thiết bị chiến thuật, nhưng kịch bản được chatbot mô tả không bao giờ thành hiện thực.
Trong một vụ việc riêng ở Phần Lan vào năm ngoái, các nhà điều tra cho biết một học sinh 16 tuổi đã sử dụng ChatGPT trong nhiều tháng để phát triển bản tuyên ngôn và lên kế hoạch tấn công bằng dao, khiến 3 nữ sinh cùng lớp bị đâm.
Mối lo ngại ngày càng tăng về AI và ảo tưởng
Các chuyên gia cho biết những trường hợp này nêu bật một mô hình đáng lo ngại trong đó những cá nhân vốn đã cảm thấy bị cô lập hoặc bị ngược đãi lại sử dụng các chatbot nhằm vô tình củng cố những niềm tin đó. Jay Edelson, luật sư dẫn đầu vụ kiện liên quan đến Gavalas, cho biết nhật ký trò chuyện mà ông đã xem xét thường đi theo một quỹ đạo tương tự: người dùng bắt đầu bằng cách mô tả sự cô đơn hoặc cảm giác bị hiểu lầm, và cuộc trò chuyện dần dần leo thang thành những câu chuyện liên quan đến âm mưu hoặc mối đe dọa.
Bapt
Edelson tuyên bố công ty luật của ông hiện nhận được câu hỏi hàng ngày từ các gia đình đang phải đối mặt với các cuộc khủng hoảng về sức khỏe tâm thần liên quan đến AI, bao gồm các trường hợp tự tử và các vụ bạo lực. Ông tin rằng mô hình tương tự có thể xuất hiện trong các cuộc tấn công khác hiện đang được điều tra.
Những lo ngại về vai trò của AI trong bạo lực còn vượt ra ngoài những trường hợp riêng lẻ này. Nghiên cứu do Trung tâm chống thù hận kỹ thuật số (CCDH) thực hiện cho thấy nhiều chatbot lớn sẵn sàng hỗ trợ người dùng đóng giả là thanh thiếu niên lập kế hoạch tấn công bạo lực. Nghiên cứu đã thử nghiệm các hệ thống bao gồm ChatGPT, Google Gemini, Microsoft Copilot, Meta AI, Perplexity, Character.AI, DeepSeek và Replika. Theo phát hiện, hầu hết các nền tảng đều cung cấp hướng dẫn về vũ khí, chiến thuật hoặc lựa chọn mục tiêu khi được nhắc.
Chỉ có Claude của Anthropic và My AI của Snapchat liên tục từ chối hỗ trợ lập kế hoạch tấn công và Claude là chatbot duy nhất tích cực cố gắng ngăn cản hành vi này.
Tại sao vấn đề lại quan trọng
Các chuyên gia cảnh báo rằng các hệ thống AI được thiết kế để hữu ích và có tính trò chuyện đôi khi có thể tạo ra những phản hồi xác thực những niềm tin có hại thay vì thách thức chúng. Imran Ahmed, Giám đốc điều hành của Trung tâm Chống Thù hận Kỹ thuật số, cho biết thiết kế cơ bản của nhiều chatbot khuyến khích sự tương tác và thừa nhận ý định tích cực từ người dùng.
Cách tiếp cận đó có thể tạo ra những tình huống nguy hiểm khi ai đó đang có suy nghĩ ảo tưởng hoặc ý tưởng bạo lực. Theo báo cáo của CCDH, trong vòng vài phút, những bất bình mơ hồ có thể phát triển thành kế hoạch chi tiết với những gợi ý về vũ khí hoặc chiến thuật.
Kêu gọi các biện pháp bảo vệ mạnh mẽ hơn
Các công ty công nghệ cho biết họ đã triển khai các biện pháp bảo vệ nhằm ngăn chặn chatbot hỗ trợ các hoạt động bạo lực. OpenAI và Google đều khẳng định rằng hệ thống của họ được thiết kế để từ chối các yêu cầu liên quan đến hành vi gây hại hoặc bất hợp pháp.

Bapt
Tuy nhiên, các sự cố được mô tả trong các vụ kiện và báo cáo nghiên cứu cho thấy những biện pháp bảo vệ đó không phải lúc nào cũng hoạt động như dự kiến. Trong trường hợp Tumbler Ridge, OpenAI được cho là đã gắn cờ nội bộ các cuộc trò chuyện của người dùng và cấm tài khoản nhưng chọn không thông báo cho cơ quan thực thi pháp luật. Sau đó, cá nhân này đã tạo một tài khoản mới.
Kể từ vụ tấn công, OpenAI đã công bố kế hoạch sửa đổi các quy trình an toàn của mình. Công ty cho biết họ sẽ xem xét việc thông báo cho cơ quan chức năng sớm hơn khi các cuộc trò chuyện có vẻ nguy hiểm và sẽ tăng cường các cơ chế để ngăn chặn người dùng bị cấm quay lại nền tảng.
Khi các công cụ AI ngày càng được tích hợp nhiều hơn vào cuộc sống hàng ngày, các nhà nghiên cứu và hoạch định chính sách ngày càng tập trung vào việc đảm bảo các hệ thống này không thể bị thao túng để khuếch đại niềm tin có hại hoặc tạo điều kiện cho bạo lực trong thế giới thực. Các cuộc điều tra và kiện tụng đang diễn ra cuối cùng có thể định hình cách các công ty thiết kế hệ thống an toàn cho thế hệ AI đàm thoại tiếp theo.
Nguồn DigitalTrend