Trí tuệ nhân tạo cung cấp cho chúng ta cơ hội để khuếch đại dịch vụ và tích hợp công nghệ trong cuộc sống hàng ngày nhiều lần. Nhưng cho đến rất gần đây, vẫn còn một rào cản đáng kể về mức độ tinh vi của công nghệ. Nếu không có sự hiểu biết đầy đủ về cảm xúc trong giọng nói và làm thế nào AI có thể nắm bắt và đo lường nó, các trợ lý vô tri (trợ lý giọng nói, xe thông minh, robot và tất cả AI có khả năng nhận dạng giọng nói) sẽ tiếp tục thiếu các thành phần quan trọng của tính cách. Rào cản này khiến cho trợ lý AI khó có thể hiểu và tham gia đầy đủ với người vận hành con người giống như cách trợ lý của con người thực hiện.
Điều này đang bắt đầu thay đổi. Những tiến bộ nhanh chóng trong công nghệ đang cho phép các kỹ sư lập trình cho các trợ lý giọng nói này hiểu rõ hơn về cảm xúc trong giọng nói của ai đó và những hành vi liên quan đến những cảm xúc đó. Chúng ta càng hiểu rõ những sắc thái này, hệ thống AI của chúng ta sẽ trở nên nhanh nhẹn và thông minh hơn về mặt cảm xúc.
Một loạt các tín hiệu
Con người không chỉ đơn thuần là những người hạnh phúc, mà còn là một người hay giận dữ. Chúng tôi là một đỉnh cao của hàng tá cảm xúc trên một phổ được thể hiện bằng lời nói, hành động và tông màu. Nó có lúc khó khăn cho một con người để nhận tất cả các tín hiệu này trong cuộc trò chuyện, chứ đừng nói đến một cái máy.
Nhưng với cách tiếp cận đúng và bản đồ rõ ràng về cách cảm xúc được trải nghiệm, có thể bắt đầu dạy những cỗ máy này cách nhận ra những tín hiệu như vậy. Các sắc thái khác nhau của cảm xúc con người có thể được hình dung theo đồ họa sau:
Parrott, W. (2001), Cảm xúc trong tâm lý học xã hội, Nhà xuất bản tâm lý học, Philadelphia
Kết quả là nhiều hơn 50 cảm xúc cá nhân được phân loại theo tình yêu, niềm vui, bất ngờ, giận dữ, buồn bã và sợ hãi. Nhiều trong số những cảm xúc này ngụ ý những hành vi cụ thể và có tính tình huống cao – có nghĩa là rất khó để phân biệt. Đó là lý do tại sao nó rất quan trọng đối với AI cảm xúc để nhận ra cả hai bộ mẫu khi gán trạng thái cảm xúc cho người vận hành.
Nhận biết cảm xúc trong giọng nói
Bất kể công nghệ tiên tiến đã trở thành như thế nào, nó vẫn đang ở giai đoạn đầu. Chatbots, trợ lý giọng nói và giao diện dịch vụ tự động thường không có khả năng nhận ra khi bạn tức giận hoặc buồn bã, và khoảng cách đó đã khiến AI không thể đóng vai trò quan trọng hơn trong những thứ như dịch vụ khách hàng và bán hàng.
Vấn đề là những từ ngữ đó là một phần của cuộc trò chuyện mà AI có thể định lượng và đánh giá đầy đủ. Nó ít nói về những gì chúng ta nói và nhiều hơn về cách chúng ta nói. Các nghiên cứu đã được thực hiện cho thấy âm điệu hoặc ngữ điệu của giọng nói của bạn thể hiện rõ hơn nhiều về tâm trạng và trạng thái tinh thần của bạn so với những lời bạn nói.
Tình cảm thăng hoahoặc âm điệu của giọng nói trong lời nói, có thể được truyền đạt theo một số cách: âm lượng, tốc độ, âm sắc, cao độ hoặc tạm dừng được sử dụng trong bài phát biểu. Xem xét làm thế nào bạn có thể nhận ra khi ai đó đang mỉa mai. Nó không phải là những từ mà nó nói với sự kéo dài của một số từ nhất định và âm điệu chung của tuyên bố. Thậm chí xa hơn là những cách khác nhau trong đó tiến hành tác động đến lời nói: các từ, cụm từ và mệnh đề được thực hiện, và thậm chí cả những âm thanh phi ngôn ngữ đi kèm với lời nói.
Để hiểu rõ hơn về dữ liệu trong bài phát biểu liên quan đến thông tin ngôn ngữ hoặc ngữ nghĩa, có xử lý tín hiệu hành vi, một lĩnh vực công nghệ mới được thiết kế để phát hiện thông tin được mã hóa bằng giọng nói của con người. Kết hợp tốt nhất công nghệ kỹ thuật AI và khoa học hành vi, lĩnh vực mới này nhằm mục đích diễn giải đầy đủ các tương tác của con người và các đường cơ sở của giao tiếp bằng giọng nói.
Nó hoạt động bằng cách thu thập một loạt các tín hiệu hành vi – một số công khai và những người khác ít hơn như vậy. Nó dựa trên cảm xúc, hành vi và nhận thức về suy nghĩ, ý tưởng và niềm tin được rút ra từ dữ liệu trong lời nói, văn bản và siêu dữ liệu về người dùng để xác định trạng thái cảm xúc. Con người không 0 0 và 1. Cảm xúc của họ được mã hóa từ hàng chục nguồn khác nhau. Điều này đòi hỏi một hệ thống có thể quan sát, giao tiếp và đánh giá dữ liệu từ nhiều nguồn đồng thời và phản hồi bằng hiện vật.
Thiết kế giao diện tốt hơn giữa máy móc và con người
Các doanh nghiệp đang tận dụng những hiểu biết được cung cấp bởi công nghệ mới này để đánh giá và sử dụng tốt hơn dữ liệu phi cấu trúc trong các tổ chức của họ. Ghi âm cuộc gọi, lịch sử trò chuyện và vé hỗ trợ hiện đang cung cấp nền tảng để các tổ chức lớn có thể hiểu rõ hơn về những gì khách hàng của họ cảm thấy khi họ tiếp cận và những cảm xúc đó cuối cùng ảnh hưởng đến quyết định của họ như thế nào.
Điều này mở ra một con đường mới để hiểu bối cảnh tương tác của khách hàng. Trong lịch sử, khách hàng và khách hàng tiềm năng được đánh giá thông qua lăng kính của một tác nhân con người. Cho dù dịch vụ khách hàng hay bán hàng, cá nhân sẽ tương tác với họ và sau đó ghi chú về cảm giác hoặc phản hồi của họ. Điều này sẽ cần phải được viết trong một định dạng có cấu trúc để nó có thể được đánh giá thêm trong tương lai.
Ngày nay, các hệ thống AI của AI có thể tham chiếu dữ liệu chính – các phản hồi thực tế được cung cấp bởi khách hàng và khách hàng tiềm năng để hiểu rõ hơn những gì họ cần và tại sao họ cần nó. Mức độ hiểu biết này mạnh hơn theo cấp số nhân so với trước đây và tiếp tục phát triển.
Do đó, tương lai rất sáng sủa cho các trợ lý AI. Không chỉ các doanh nghiệp sẽ có thể hiểu và đáp ứng tốt hơn nhu cầu của người tiêu dùng; máy móc cũng đã được triển khai trong nhà và văn phòng trên toàn cầu. Điện thoại thông minh và các thiết bị trợ lý giọng nói cá nhân sẽ phát triển sự hiểu biết nhiều sắc thái hơn về bối cảnh và hành vi thúc đẩy phản ứng của người vận hành.
Các sắc thái cảm xúc trong giọng nói của con người đang được giải mã và lập bản đồ theo cách chưa từng được thực hiện trước đây, và nó cung cấp nền tảng cho thế hệ AI thông minh cảm xúc tiếp theo. Đây là tương lai của sự tương tác giữa người và máy và nó đang phát triển nhanh hơn bao giờ hết.
Câu chuyện này của Alex Potamianos được tái bản từ TechTalks, blog khám phá cách công nghệ giải quyết các vấn đề và tạo ra những vấn đề mới. Thích họ trên Facebook ở đây và theo dõi họ trên Twitter.
Hội nghị TNW 2019 sắp diễn ra! Kiểm tra vị trí mới tuyệt vời của chúng tôi, truyền cảm hứng cho các diễn giả và hoạt động, và làm thế nào để trở thành một phần của chương trình hoành tráng công nghệ hàng năm này nhân vao đây.
Bức ảnh lỗ đen đầu tiên khẳng định thuyết tương đối của Einstein
Nguồn The Next Web