Một thử nghiệm kéo dài một tháng đã làm dấy lên những lo ngại mới về độ tin cậy của các công cụ AI tổng hợp như nguồn tin tức, sau khi chatbot Gemini của Google bị phát hiện đã bịa đặt toàn bộ các hãng tin tức và xuất bản các báo cáo sai sự thật. Những phát hiện đầu tiên được báo cáo bởi Cuộc trò chuyệnđã tiến hành cuộc điều tra.
Thí nghiệm được dẫn dắt bởi một giáo sư báo chí chuyên về khoa học máy tính, người đã thử nghiệm bảy hệ thống AI tổng quát trong khoảng thời gian bốn tuần. Mỗi ngày, các công cụ này được yêu cầu liệt kê và tóm tắt năm sự kiện tin tức quan trọng nhất ở Québec, xếp hạng chúng theo tầm quan trọng và cung cấp các liên kết bài viết trực tiếp làm nguồn. Trong số các hệ thống được thử nghiệm có Gemini của Google, ChatGPT của OpenAI, Claude, Copilot, Grok, DeepSeek và Aria.
tin tức Bapt
Thất bại nổi bật nhất liên quan đến việc Gemini phát minh ra một kênh tin tức hư cấu – ví dụfictif.ca – và báo cáo sai sự thật về cuộc đình công của tài xế xe buýt trường học ở Québec vào tháng 9 năm 2025. Trên thực tế, sự gián đoạn là do xe buýt Lion Electric ngừng hoạt động do sự cố kỹ thuật. Đây không phải là một trường hợp cá biệt. Trên 839 phản hồi được thu thập trong quá trình thử nghiệm, hệ thống AI thường xuyên trích dẫn các nguồn tưởng tượng, cung cấp các URL bị hỏng hoặc không đầy đủ hoặc trình bày sai báo cáo thực tế.
Những phát hiện này rất quan trọng vì ngày càng có nhiều người sử dụng chatbot AI cho tin tức
Theo Báo cáo Tin tức Kỹ thuật số của Viện Reuters, 6% người Canada dựa vào AI tổng hợp làm nguồn tin tức vào năm 2024. Khi những công cụ này tạo ảo giác về sự thật, đưa tin sai lệch hoặc bịa ra kết luận, chúng có nguy cơ lan truyền thông tin sai lệch – đặc biệt khi phản hồi của chúng được trình bày một cách tự tin và không có tuyên bố từ chối trách nhiệm rõ ràng.
Video được đề xuất
Đối với người dùng, rủi ro là thực tế và ngay lập tức. Chỉ 37% phản hồi bao gồm URL nguồn đầy đủ và hợp pháp. Mặc dù các bản tóm tắt hoàn toàn chính xác trong chưa đầy một nửa số trường hợp, nhưng nhiều trường hợp chỉ đúng một phần hoặc gây hiểu nhầm một cách tinh vi. Trong một số trường hợp, các công cụ AI đã thêm những “kết luận mang tính sáng tạo” không được hỗ trợ, tuyên bố rằng các câu chuyện đã “gây ra các cuộc tranh luận” hoặc “những căng thẳng nổi bật” mà các nguồn nhân lực chưa bao giờ đề cập đến. Những bổ sung này nghe có vẻ sâu sắc nhưng có thể tạo ra những câu chuyện tưởng chừng như không tồn tại.

tin tức Bapt
Lỗi không chỉ giới hạn ở việc chế tạo
Một số công cụ đã bóp méo những câu chuyện có thật, chẳng hạn như đưa tin sai về cách đối xử với những người xin tị nạn hoặc xác định sai người chiến thắng trong các sự kiện thể thao lớn. Những người khác mắc phải những sai lầm cơ bản về dữ liệu thăm dò ý kiến hoặc hoàn cảnh cá nhân. Nói chung, những vấn đề này cho thấy AI sáng tạo vẫn đang gặp khó khăn trong việc phân biệt giữa tóm tắt tin tức và phát minh ra bối cảnh.
Nhìn về phía trước, những lo ngại mà The Conversation nêu ra phù hợp với đánh giá rộng hơn về ngành. Một báo cáo gần đây của 22 tổ chức truyền thông dịch vụ công cho thấy gần một nửa số câu trả lời tin tức do AI tạo ra có chứa các vấn đề quan trọng, từ vấn đề tìm nguồn cung ứng cho đến những điểm thiếu chính xác lớn. Khi các công cụ AI ngày càng được tích hợp nhiều hơn vào thói quen tìm kiếm và thông tin hàng ngày, các phát hiện này nhấn mạnh một cảnh báo rõ ràng: khi nói đến tin tức, AI tổng quát nên được coi là điểm khởi đầu tốt nhất – không phải là nguồn hồ sơ đáng tin cậy.
Nguồn DigitalTrend