OpenAI đã bắt đầu triển khai Chế độ khóa cho ChatGPTmột cài đặt bảo mật mới được thiết kế để chặn kẻ tấn công lấy cắp dữ liệu thông qua các cuộc tấn công tiêm nhiễm nhanh chóng. Tính năng này vô hiệu hóa trình duyệt web trực tiếp, chế độ tác nhân, nghiên cứu sâu, truy xuất hình ảnh, kết nối mạng Canvas và tải xuống tệp. Nó có sẵn cho người dùng đã đăng nhập trên các gói ChatGPT Business miễn phí, Go, Plus, Pro và tự phục vụ.
Việc tiêm nhắc nhở vẫn là điều mà OpenAI gọi là “biên giới” vấn đề ảnh hưởng đến tất cả các mô hình ngôn ngữ lớn. Cuộc tấn công hoạt động bằng cách ẩn các hướng dẫn độc hại trong nội dung mà mô hình xử lý, chẳng hạn như trang web hoặc tệp đã tải lên. Nếu mô hình làm theo những hướng dẫn đó, nó có thể bị lừa gửi dữ liệu nhạy cảm đến máy chủ do kẻ tấn công kiểm soát.
Chế độ khóa không ngăn việc tiêm xảy ra. Tải trọng độc hại được nhúng trong trang web được lưu trong bộ nhớ đệm hoặc tệp PDF được tải lên vẫn có thể ảnh hưởng đến hoạt động của mô hình. Những gì nó làm là tắt các đường dẫn đi ra ngoài mà kẻ tấn công sẽ sử dụng để lấy cắp dữ liệu. Không có trình duyệt trực tiếp có nghĩa là không có yêu cầu mạng tới máy chủ bên ngoài. Không truy xuất hình ảnh có nghĩa là không có kênh dữ liệu dựa trên pixel.
TNW City Coworking Space – Nơi công việc tốt nhất của bạn diễn ra
Một không gian làm việc được thiết kế để phát triển, hợp tác và có cơ hội kết nối vô tận ở trung tâm công nghệ.
“Chế độ khóa được thiết kế để giảm đáng kể nguy cơ trích xuất dữ liệu dựa trên thao tác tiêm nhanh chóng, nhưng không đảm bảo rằng việc trích xuất dữ liệu không thể xảy ra,”OpenAI cho biết.”Rủi ro có thể vẫn tồn tại thông qua Ứng dụng được kích hoạt, sự kết hợp các khả năng không lường trước được hoặc các kỹ thuật mới được phát hiện.”
Sự đánh đổi là đáng kể. Khi bật Chế độ khóa, ChatGPT sẽ mất hầu hết những gì khiến tác nhân và tính năng nghiên cứu của nó trở nên hữu ích. Trình duyệt trực tiếp chỉ giảm xuống nội dung được lưu trong bộ nhớ đệm. Chế độ đại lý đã biến mất hoàn toàn. Nghiên cứu sâu bị vô hiệu hóa. Như OpenAI thừa nhận, “không dành cho tất cả mọi người.”
Tính năng này xuất hiện khi các cuộc tấn công tiêm nhiễm ngay lập tức vào các tác nhân AI đang ngày càng trở thành mối lo ngại. Các nhà nghiên cứu bảo mật đã chứng minh các vụ tấn công chống lại các tác nhân từ Anthropic, Google và Microsoft thông qua tích hợp GitHub Actions của họ. Cả ba đều trả tiền thưởng lỗi nhưng không công bố lời khuyên nào. Điểm yếu cơ bản là: LLM không thể tách dữ liệu khỏi hướng dẫn một cách đáng tin cậy.
Chế độ khóa và Chế độ nhà phát triển không thể được sử dụng đồng thời. Bật cái này sẽ vô hiệu hóa cái kia. OpenAI cũng ra mắt một tính năng quản lý phiên riêng biệt cho phép người dùng xem lại các phiên ChatGPT đang hoạt động và đăng xuất khỏi từng thiết bị nếu họ phát hiện hoạt động trái phép.
Đặc điểm này là một sự nhượng bộ thực dụng. OpenAI không tuyên bố đã giải quyết được việc tiêm nhắc nhở. Nó chấp nhận rằng vấn đề vẫn tiếp diễn và cung cấp cho người dùng một cách để giảm mức độ phơi nhiễm bằng cách từ bỏ chức năng. Đối với bất kỳ ai xử lý dữ liệu nhạy cảm trong ChatGPT, sự đánh đổi đó là đáng thực hiện. Đối với những người khác, hệ sinh thái tác nhân ngày càng mở rộng và bề mặt tấn công ngày càng tăng của nó đồng nghĩa với việc rủi ro chỉ ngày càng tăng lên.
Nguồn The Next Web