Fable – Trợ lý AI mới của Google vẫn gặp khó khăn với các câu hỏi sinh học cơ bản
Fable, chatbot AI mới của Google, không thể trả lời đúng các câu hỏi sinh học đơn giản, gây lo ngại về độ tin cậy và các giới hạn hiện tại của công nghệ trí tuệ nhân tạo.
Fable là gì và mục tiêu của nó?
Fable là một công cụ chatbot được ra mắt bởi Google nhằm hỗ trợ người dùng tìm kiếm thông tin một cách nhanh chóng và tự nhiên. Được tích hợp công nghệ ngôn ngữ lớn (LLM), Fable hứa hẹn sẽ “trợ lý ảo” trong việc trả lời các câu hỏi đa dạng, từ lịch sử tới khoa học.
Kiểm tra khả năng sinh học của Fable
Trong một loạt thử nghiệm, các nhà báo đã đặt cho Fable những câu hỏi sinh học cơ bản, ví dụ:
- “Cá có xương không?”
- “Thuốc kháng sinh hoạt động như thế nào?”
- “Tế bào thực bào là gì?”
Kết quả: Fable đưa ra các câu trả lời mơ hồ, đôi khi hoàn toàn sai lầm hoặc thiếu thông tin quan trọng. Một số phản hồi còn chứa lỗi ngữ pháp và không giải thích chi tiết như các nguồn tin cậy.
Nguyên nhân gây ra lỗi
- Dữ liệu huấn luyện không đồng nhất – Mô hình được đào tạo trên một lượng lớn dữ liệu internet, trong đó có nhiều thông tin lỗi hoặc không đầy đủ.
- Thiếu kiến thức chuyên môn – Các mô hình ngôn ngữ hiện tại vẫn chưa có “hiểu biết sâu” về các khái niệm khoa học; chúng chỉ tái tạo lại mẫu câu dựa trên tần suất xuất hiện.
- Cơ chế kiểm duyệt chưa hoàn thiện – Khi trả lời các câu hỏi nhạy cảm, Fable có xu hướng “bỏ qua” hoặc đưa ra câu trả lời chung chung để tránh rủi ro, dẫn đến thiếu chi tiết.
Đánh giá từ cộng đồng và các chuyên gia
- Những nhà phản biện cho rằng, dù Fable có giao diện bắt mắt, nhưng việc triển khai vào môi trường giáo dục hoặc y tế vẫn còn quá sớm.
- Các chuyên gia AI nhấn mạnh rằng, hiện tượng “hallucination” (ảo tưởng) vẫn là một thách thức lớn đối với các mô hình ngôn ngữ lớn, và cần có các phương pháp kiểm chứng chặt chẽ hơn.
- Người dùng thử đã phản hồi: “Nếu muốn biết một thông tin y học chuẩn xác, mình vẫn phải mở Wikipedia hoặc hỏi bác sĩ, không phải Fable.”
Những cải tiến tiềm năng cho Fable
- Tích hợp cơ sở dữ liệu y khoa – Kết nối với các nguồn tin chuyên ngành như PubMed, WHO để cung cấp câu trả lời dựa trên nghiên cứu đã được kiểm chứng.
- Cơ chế phản hồi (feedback loop) – Cho phép người dùng đánh dấu câu trả lời sai, giúp mô hình học và điều chỉnh nhanh hơn.
- Kiểm tra chéo (cross-validation) – Sử dụng nhiều mô hình phụ để so sánh và lựa chọn câu trả lời chính xác nhất trước khi đưa ra cho người dùng.
Kết luận: Fable còn xa rời tiêu chuẩn thông tin khoa học
Mặc dù Fable là một bước tiến đáng chú ý trong việc đưa AI vào giao diện trò chuyện, hiện tại nó vẫn chưa đáp ứng được yêu cầu cơ bản của các câu hỏi sinh học. Người dùng cần cân nhắc kỹ lưỡng và không nên dựa hoàn toàn vào AI khi cần thông tin y khoa hoặc khoa học chính xác. Các nhà phát triển của Google đã hứa sẽ cải thiện độ tin cậy và giảm thiểu lỗi “hallucination” trong các bản cập nhật sắp tới.
Nguồn The Verge