Các đại lý AI hiện đang được nhúng trên các chức năng kinh doanh cốt lõi trên toàn cầu. Chẳng mấy chốc, các đại lý này có thể lên lịch cho cuộc sống của chúng tôi, đưa ra các quyết định quan trọng và đàm phán các giao dịch thay mặt chúng tôi. Triển vọng là thú vị và tham vọng, nhưng nó cũng đặt ra câu hỏi: Ai thực sự giám sát họ?
Hơn một nửa (51%) các công ty đã triển khai các đại lý AIvà Giám đốc điều hành Salesforce Marc Benioff đã nhắm mục tiêu vào một tỷ đại lý vào cuối năm nay. Mặc dù ảnh hưởng ngày càng tăng của chúng, thử nghiệm xác minh là không có. Các đại lý này đang được giao trách nhiệm quan trọng trong các lĩnh vực nhạy cảm, chẳng hạn như ngân hàng và chăm sóc sức khỏe, mà không cần giám sát thích hợp.
Các đại lý AI yêu cầu lập trình rõ ràng, đào tạo chất lượng cao và những hiểu biết thời gian thực để thực hiện các hành động định hướng mục tiêu một cách hiệu quả và chính xác. Tuy nhiên, không phải tất cả các tác nhân sẽ được tạo ra như nhau. Một số đại lý có thể nhận được dữ liệu và đào tạo nâng cao hơn, dẫn đến sự mất cân bằng giữa bespoke, các đại lý được đào tạo tốt và các tác nhân sản xuất hàng loạt.
Điều này có thể gây ra một rủi ro hệ thống nơi các đại lý tiên tiến hơn thao túng và lừa dối các tác nhân kém tiên tiến. Theo thời gian, sự phân chia này giữa các tác nhân có thể tạo ra một khoảng cách về kết quả. Giả sử một đại lý có nhiều kinh nghiệm hơn trong các quy trình pháp lý và sử dụng kiến thức đó để khai thác hoặc vượt qua một tác nhân khác mà ít hiểu hơn. Việc triển khai các đại lý AI của các doanh nghiệp là không thể tránh khỏi, và sự xuất hiện của các cấu trúc quyền lực mới và rủi ro thao túng. Các mô hình cơ bản sẽ giống nhau cho tất cả người dùng, nhưng khả năng theo dõi nhu cầu khác nhau này.
Không gian làm việc chung của thành phố TNW – nơi mà công việc tốt nhất của bạn xảy ra
Một không gian làm việc được thiết kế để tăng trưởng, hợp tác và các cơ hội kết nối vô tận trong trung tâm của công nghệ.
Không giống như phần mềm truyền thống, các tác nhân AI hoạt động trong các cài đặt phức tạp, phát triển. Khả năng thích ứng của chúng làm cho chúng mạnh mẽ, nhưng cũng dễ bị bất ngờ và có khả năng thảm khốc.
Ví dụ, một tác nhân AI có thể chẩn đoán sai một tình trạng nguy kịch ở trẻ vì nó được đào tạo chủ yếu dựa trên dữ liệu từ bệnh nhân trưởng thành. Hoặc một đại lý AI chatbot có thể leo thang một khiếu nại của khách hàng vô hại vì nó giải thích sai về sự xâm lược, từ từ mất khách hàng và doanh thu do giải thích sai.
Theo nghiên cứu ngành, 80% các công ty đã tiết lộ rằng các đại lý AI của họ đã đưa ra các quyết định của Rogue Rogue. Các vấn đề liên kết và an toàn đã được thể hiện rõ trong các ví dụ trong thế giới thực, chẳng hạn như các tác nhân tự trị vượt qua các hướng dẫn rõ ràng và xóa các phần công việc quan trọng.
Thông thường, khi xảy ra lỗi lớn của con người, nhân viên phải đối phó với HR, có thể bị đình chỉ và một cuộc điều tra chính thức được thực hiện. Với các đại lý AI, những người bảo vệ đó không được áp dụng. Chúng tôi cung cấp cho họ quyền truy cập cấp độ con người vào các vật liệu nhạy cảm mà không có bất cứ điều gì gần với sự giám sát ở cấp độ của con người.
Vì vậy, chúng ta đang thúc đẩy các hệ thống của chúng ta thông qua việc sử dụng các đại lý AI, hay chúng ta đang từ bỏ cơ quan trước khi các giao thức thích hợp được đưa ra?
Sự thật là, những tác nhân này có thể nhanh chóng học hỏi và thích nghi theo môi trường tương ứng của họ, nhưng họ chưa phải là người lớn có trách nhiệm. Họ đã không trải qua nhiều năm và nhiều năm học tập, cố gắng và thất bại, và tương tác với các doanh nhân khác. Họ thiếu sự trưởng thành có được từ kinh nghiệm sống. Cung cấp cho họ quyền tự chủ với kiểm tra tối thiểu giống như trao các chìa khóa của công ty cho một sinh viên tốt nghiệp say rượu. Họ nhiệt tình, thông minh và dễ uốn nắn, nhưng cũng thất thường và cần giám sát.
Tuy nhiên, những gì các doanh nghiệp lớn không nhận ra là đây chính xác là những gì họ đang làm. Các đại lý của AI đang được cắm liền mạch vào các hoạt động với ít hơn một bản demo và từ chối trách nhiệm. Không có thử nghiệm liên tục và tiêu chuẩn hóa. Không có chiến lược thoát rõ ràng khi có sự cố xảy ra.
Những gì còn thiếu là một khung xác minh có cấu trúc, nhiều lớp-một khung xác minh thường xuyên kiểm tra hành vi của tác nhân trong các mô phỏng của các kịch bản thực tế và cổ phần cao. Khi việc áp dụng tăng tốc, việc xác minh đang trở thành điều kiện tiên quyết để đảm bảo các đại lý AI phù hợp với mục đích.
Các mức độ xác minh khác nhau được yêu cầu theo sự tinh tế của tác nhân. Các tác nhân khai thác kiến thức đơn giản hoặc những người được đào tạo để sử dụng các công cụ như Excel hoặc email, có thể không yêu cầu kiểm tra sự nghiêm ngặt giống như các tác nhân tinh vi sao chép một loạt các tác vụ mà con người thực hiện. Tuy nhiên, chúng ta cần phải có các lan can phù hợp, đặc biệt là trong các môi trường đòi hỏi, nơi các đại lý làm việc với sự hợp tác với cả con người và các đặc vụ khác.
Khi các đại lý bắt đầu đưa ra quyết định ở quy mô, biên độ cho lỗi sẽ co lại nhanh chóng. Nếu các tác nhân AI, chúng tôi đang để kiểm soát các hoạt động quan trọng không được kiểm tra tính toàn vẹn, chính xác và an toàn, chúng tôi có nguy cơ cho phép các tác nhân AI tàn phá xã hội. Hậu quả sẽ rất thực tế – và chi phí kiểm soát thiệt hại có thể đáng kinh ngạc.
Nguồn The Next Web