Trang chủCông nghệbên trong AI thời gian thực của Intercall dành cho phiên dịch...

bên trong AI thời gian thực của Intercall dành cho phiên dịch viên chuyên nghiệp

Trong số các thông dịch viên dựa vào nó, nhận định đều nhất quán: cuối cùng, một cái gì đó được xây dựng theo cách họ thực sự làm việc. Tiền đề rất đơn giản. Phiên dịch hoạt động hiệu quả nhất khi con người và máy kết hợp với nhau, chứ không phải máy thay thế con người.

Phiên dịch là một trong những điều khó nhất mà một người có thể làm trong thời gian thực. Phiên dịch viên phải nghe, hiểu, điều chỉnh lại và nói gần như cùng một lúc, thường thông qua một giọng lạ hoặc một dãy số đến nhanh hơn bất kỳ ai có thể viết ra. Các nhà nghiên cứu mô tả một “giả thuyết dây buộc chặt chẽ”: trong hầu hết các nhiệm vụ, thông dịch viên làm việc ở mức tối đa khả năng tinh thần của họ và độ chính xác sẽ giảm ngay khi khối lượng công việc đó tăng lên. Sự căng thẳng cũng là về thể chất. Áp lực thời gian làm tăng căng thẳng và nhịp tim, đồng thời chất lượng lần lượt giảm sút kéo dài hơn nửa giờ, đó là lý do tại sao phiên dịch viên phải luân phiên khoảng 30 phút một lần.

Áp lực đó chỉ tăng lên khi công việc chuyển sang trực tuyến. Phiên dịch là một Ngành công nghiệp trị giá 11,7 tỷ USD theo ước tính của Nimdzi, và hiện nay phần lớn hoạt động này diễn ra từ xa: qua video, qua âm thanh không đồng đều, trong các cuộc họp kết hợp hầu như không tồn tại cách đây 5 năm. Hệ thống phụ đề mà thông dịch viên có thể tiếp cận chưa bao giờ được xây dựng cho họ. Intercall được xây dựng để thu hẹp khoảng cách đó.

Được xây dựng cho thông dịch viên

liên lạc là một nền tảng dịch thuật và phụ đề theo thời gian thực, do con người thực hiện, được tạo ra cho một đối tượng: các phiên dịch viên chuyên nghiệp. Human-in-the-loop có nghĩa chính xác là như vậy. Con người chịu trách nhiệm, phần mềm hỗ trợ. Trong khi trình thông dịch hoạt động, Intercall sẽ hiển thị mọi nội dung được nói lên màn hình dưới dạng văn bản bằng cả hai ngôn ngữ vào thời điểm nó được nói.

Người sáng lập của nó, Bahodir Rajabov, bắt đầu từ điều mà hầu hết các sản phẩm đều bỏ lỡ. Phiên dịch viên không cần bản ghi chép gọn gàng sau cuộc họp; họ cần từ phù hợp vào lúc này, đủ nhanh để không làm mất tập trung của họ. Cái tên họ không bắt được. Bóng dáng đó trôi qua quá nhanh. Thuật ngữ kỹ thuật từ một lĩnh vực mà họ không làm việc hàng ngày.

Rajabov bắt đầu lập trình ở tuổi 14 tại Bukhara, Uzbekistan và sau đó gia nhập nhóm phát triển AI của IBM. Anh ấy đã xây dựng Intercall để giải quyết một vấn đề mà phần còn lại của thị trường đã bỏ qua và anh ấy là kiến trúc sư chính của cốt lõi của nó: thu âm tự nhiên, quy trình phiên âm có độ trễ thấp, hệ thống thuật ngữ và quy trình làm việc trên máy tính để bàn đa nền tảng. Hệ thống phụ đề chung dành cho phiên dịch viên chạy sau người nói từ ba đến năm giây. Điều đó tốt cho phụ đề. Đây thực sự là một vấn đề đối với một phiên dịch viên y tế khi truyền đạt các triệu chứng khi chúng được nói hoặc trong phòng xử án, nơi nửa giây có thể thay đổi ý nghĩa của một tuyên bố.

Như anh ấy đã nói: “Không ai xây dựng bất cứ thứ gì cho phiên dịch viên. Họ là những bậc thầy trong nghề, làm việc bằng những công cụ mượn. Chú thích dành cho người xem, ứng dụng dịch dành cho khách du lịch. Họ chỉ cần thứ gì đó dành cho họ.”

Nó hoạt động như thế nào

Bước ngoặt là rời khỏi trình duyệt. Intercall chạy dưới dạng phần mềm gốc trên máy của chính trình thông dịch, được cài đặt giống như Word hoặc Zoom thay vì mở dưới dạng trang web. Được viết bằng C++, nó hoạt động trực tiếp với hệ điều hành và nhận âm thanh trực tiếp từ bất kỳ cuộc gọi nào đang mở, cho dù là Zoom, Microsoft Teams hay Google Meet. Không có tiện ích mở rộng trình duyệt, không có bot họp và không chia sẻ màn hình.

- Quảng cáo -

Nó làm ba việc. Nó ghi lại cuộc trò chuyện ngay khi nó diễn ra, đủ nhanh để văn bản ở ngang tầm với người nói thay vì bị tụt lại phía sau. “Nó phải cảm thấy ngay lập tức,” Rajabov nói. “Khoảnh khắc văn bản rơi ra phía sau người nói là vô ích và người phiên dịch chỉ cần đóng nó lại.” Nó nắm bắt những phần dễ bị mất nhất và mắc sai sót đắt giá nhất, danh từ riêng và thuật ngữ chuyên môn, đồng thời cho phép phiên dịch viên tải tới 600 từ vựng của riêng họ trước một phiên: từ vựng về tim mạch trước cuộc hẹn khám tim mạch, tên ca bệnh trước phiên điều trần. Và trong một cuộc gọi đa ngôn ngữ, nó sẽ tự di chuyển giữa các ngôn ngữ và phương ngữ, trên hàng tá ngôn ngữ đó. Tiếng Anh của bác sĩ và tiếng Nga của bệnh nhân, được ghi lại cạnh nhau, trong một cuộc trò chuyện, cách diễn giải các cuộc gọi thực sự diễn ra.

Đối với hầu hết các thông dịch viên, một cửa sổ đó sẽ thay thế một loạt các công cụ được tạo cho người khác: chú thích cuộc họp, sổ ghi chú, tab dịch luôn mở trong trình duyệt. Sự khác biệt thể hiện ngay trong chính tác phẩm. Ít yêu cầu lặp lại hơn. Những đoạn văn dài, dày đặc được chuyển tiếp mà không làm đứt mạch cuộc trò chuyện. Ít hơn nhiều so với việc ghi chú điên cuồng khiến phiên dịch viên kiệt sức vào cuối ca làm việc, do đó, năng lượng dành cho việc nắm bắt và ghi nhớ các chi tiết sẽ quay trở lại phiên dịch.

Intercall được xây dựng để hỗ trợ chứ không phải để tiếp quản. Nó không giải thích cho người dùng. Nó hiển thị những gì lẽ ra sẽ bị bỏ qua và trao lại, để lại người phiên dịch phụ trách phần mà chỉ một người mới có thể làm: ý nghĩa và phán đoán. Lựa chọn đó sớm đưa Intercall vào danh mục con người trong vòng lặp mà các nhà phân tích hiện đang theo dõi, AI hỗ trợ các phiên dịch viên chuyên nghiệp trong quá trình làm việc trực tiếp thay vì thay thế họ. Những cái tên lớn hơn kể từ đó cũng đã di chuyển theo cách tương tự. Boostlingo đã bổ sung công cụ tăng năng suất AI vào năm 2024, KUDO đưa hỗ trợ vào bảng thông dịch vào năm 2025 và các nhà phân tích tại Slator và Nimdzi hiện đang phụ trách danh mục này.

Bảo mật

Các thông dịch viên gần như ngay lập tức đưa ra sự phản đối rõ ràng: nếu đó là AI, liệu nó có lưu trữ âm thanh và thông tin đào tạo về các cuộc trò chuyện riêng tư của khách hàng của tôi không? Câu trả lời của công ty nằm ở cách nền tảng được xây dựng chứ không phải ở chính sách quyền riêng tư. Theo Intercall, âm thanh, bản ghi và bản dịch chỉ tồn tại trong bộ nhớ và biến mất khi phiên kết thúc; không có gì được ghi vào máy chủ và không có gì được sử dụng để huấn luyện các mô hình. Bất cứ điều gì một thông dịch viên tạo ra vẫn là của họ. Nó được mã hóa và được xây dựng để bảo mật mà công việc y tế do HIPAA quản lý và tòa án yêu cầu, cài đặt mà bản ghi bị rò rỉ là vi phạm chứ không phải gây bất tiện.

Sự chấp nhận và tác động

Intercall đã hoạt động được hơn một năm rưỡi. Hơn 3.000 phiên dịch viên chuyên nghiệp trên 18 quốc gia đã sử dụng nó và hiện có hàng nghìn giờ phiên dịch trực tiếp chạy qua nền tảng này mỗi tháng. Điều nổi bật là phạm vi tiếp cận. Nhóm người dùng lớn nhất là ở Cộng hòa Dominica, với các phiên dịch viên trả phí trên khắp Hoa Kỳ, Ba Lan, Peru, Honduras, Mexico, Canada và hơn thế nữa, nhiều người trong số họ làm việc thông qua các nhà cung cấp dịch vụ phiên dịch bao gồm Propio Language Services, iCall International và các dịch vụ khác. Họ sử dụng nó trong các nhiệm vụ trực tiếp tại bệnh viện, phòng xử án và hội trường. Sự phát triển của nó chủ yếu đến từ chính nghề nghiệp: thông dịch viên giới thiệu nó với đồng nghiệp và nói điều đó trước công chúng.

- Quảng cáo -

Tác động mà họ mô tả chỉ gói gọn trong hai từ: hiệu quả và độ chính xác.

Hiệu quả, vì công cụ này hấp thụ phần công việc khiến người phiên dịch mệt mỏi, lưu giữ tên, số và chi tiết trong bộ nhớ trong khi vẫn nghe và nói. Thông dịch viên cho biết họ làm việc nhiều giờ hơn mà ít mệt mỏi hơn. Một số mô tả việc kết thúc ca làm việc với năng lượng mà họ sử dụng để đốt cháy ghi chú một cách điên cuồng. Một số người nói rằng điều đó đã kéo họ thoát khỏi tình trạng kiệt sức đến mức gần như đẩy họ ra khỏi nghề. Trong một lĩnh vực mà giới hạn làm việc là sự mệt mỏi về tinh thần hơn là kỹ năng, đó là sự khác biệt giữa một sự nghiệp bền vững và một lối thoát sớm.

Độ chính xác là nửa còn lại. Mọi điều được nói trong cuộc gọi đều được chép lại và dịch theo thời gian thực, bằng cả hai ngôn ngữ, trước mặt người phiên dịch, do đó, yêu cầu lặp lại giảm mạnh và các chi tiết đắt nhất nếu mắc sai sót, tên thuốc, liều lượng, số ca, địa chỉ, sẽ không bị lọt qua nữa. Trong bệnh viện, điều đó có nghĩa là bệnh nhân không nói được tiếng Anh sẽ nhận được hướng dẫn xuất viện chính xác như bác sĩ đã đưa cho họ. Trong phòng xử án, nó có nghĩa là lời khai được ghi vào hồ sơ hoàn chỉnh.

Một thông dịch viên tại Propio Language Services ở Colombia, ở xa hơn 5 năm, mô tả việc làm việc 48 giờ một tuần với những ghi chú bằng giấy và một bảng Boogie: “Vào cuối ngày, tôi thường cảm thấy kiệt sức về mặt tinh thần vì liên tục dựa vào trí nhớ và ghi chép”. Ngay cả khi các công cụ phụ đề chung đang chạy, “Tôi vẫn phải ghi lại số điện thoại, địa chỉ, tên và các chi tiết quan trọng khác theo cách thủ công… tải trọng nhận thức vẫn luôn ở đó.Sau đó anh ấy tìm thấy Intercall: “Nó đã giảm đáng kể khối lượng công việc trí óc của tôi và cho phép tôi tập trung vào điều quan trọng nhất: phiên dịch chính xác và phục vụ khách hàng một cách hiệu quả. Không còn phải sử dụng sổ ghi chú, trình dịch và nhiều công cụ tham khảo nữa. Tôi thực sự không thể tưởng tượng được làm việc mà không có nó.

Những người hành nghề độc lập cũng nói nhiều như vậy. Một cách chi tiết ôn tậpthông dịch viên Nourhane Atmani đã viết rằng “không làm giảm tải nhận thức không cần thiết, giúp chúng ta nắm bắt được những gì chúng ta có thể bỏ lỡ (tên, con số, v.v.) và hỗ trợ chúng ta khi làm việc trong những bối cảnh đòi hỏi khắt khe hoặc không quen thuộc,” đồng thời làm rõ rằng nó “KHÔNG thay thế thông dịch viên (và không bao giờ nhằm mục đích đó).Một người khác nói rõ ràng hơn: “Nó giống như làm việc với một phi công phụ. Tôi vẫn đang lái máy bay. Bây giờ tôi có nhạc cụ tốt hơn.

Điều gì xảy ra tiếp theo

Intercall được xây dựng và điều hành bởi một đội ngũ tinh gọn, tận tâm và công ty hiện đang tập trung vào việc mở rộng quy mô: tiếp cận nhiều phiên dịch viên hơn và đưa nền tảng này đến các cơ quan phiên dịch và nhóm doanh nghiệp. Công việc kỹ thuật cũng đi theo cùng một lộ trình, với phần lớn nỗ lực tập trung vào một vấn đề khó giải quyết: duy trì độ chính xác trong các trình thông dịch âm thanh ồn ào, chất lượng thấp thường phải làm việc.

Kỷ luật đó đã giành được sự tin tưởng của lĩnh vực này. “Chúng tôi bắt đầu với vai trò trợ lý. Chúng tôi đã chứng minh tính chính xác của mình và giành được sự tin tưởng đó trước tiên,” Rajabov nói. “Bạn không thể bỏ qua giai đoạn đó, đó là lúc những người khác đã mắc sai lầm.

Phiên dịch viên là trung tâm của công việc, lắng nghe, cân nhắc và chuyển đổi ngôn ngữ này sang ngôn ngữ khác theo thời gian thực. Intercall không ở đó để đảm nhận việc đó. Theo cách nói của Rajabov, nó ở đó để mang lại cho họ đôi tai thứ hai.



Nguồn The Next Web

- Có thể bạn thích -
BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới