Trang chủKhácCác thử nghiệm ban đầu cho thấy đánh giá của ChatGPT Health...

Các thử nghiệm ban đầu cho thấy đánh giá của ChatGPT Health về dữ liệu thể chất của bạn có thể gây ra sự hoảng loạn không đáng có

Đầu tháng này, OpenAI đã giới thiệu một không gian mới tập trung vào sức khỏe trong ChatGPT, giới thiệu đây là cách an toàn hơn để người dùng đặt câu hỏi về các chủ đề nhạy cảm như dữ liệu y tế, bệnh tật và thể chất. Một trong những tính năng nổi bật khi ra mắt là khả năng phân tích dữ liệu từ các ứng dụng như Apple Health, MyFitnessPal và Peloton của ChatGPT Health để tìm ra các xu hướng dài hạn và mang lại kết quả được cá nhân hóa. Tuy nhiên, một báo cáo mới cho thấy OpenAI có thể đã phóng đại quá mức hiệu quả của tính năng này trong việc rút ra những hiểu biết đáng tin cậy từ dữ liệu đó.

Theo các thử nghiệm ban đầu được thực hiện bởi Bưu điện Washingtoncủa Geoffrey A. Fowler, khi ChatGPT Health được cấp quyền truy cập vào dữ liệu Apple Health có giá trị trong một thập kỷ, chatbot đã xếp loại sức khỏe tim mạch của phóng viên là điểm F. Tuy nhiên, sau khi xem xét đánh giá, một bác sĩ tim mạch gọi đó là “vô căn cứ” và cho biết nguy cơ mắc bệnh tim thực sự của phóng viên là cực kỳ thấp.

Video được đề xuất

Tiến sĩ Eric Topol từ Viện nghiên cứu Scripps đã đưa ra đánh giá thẳng thắn về khả năng của ChatGPT Health, cho biết công cụ này chưa sẵn sàng đưa ra lời khuyên y tế và phụ thuộc quá nhiều vào các số liệu không đáng tin cậy của đồng hồ thông minh. Xếp hạng của ChatGPT chủ yếu dựa vào ước tính của Apple Watch về VO2 tối đa và sự thay đổi nhịp tim, cả hai đều có những hạn chế đã biết và có thể khác nhau đáng kể giữa các thiết bị và bản dựng phần mềm. Nghiên cứu độc lập cho thấy ước tính VO2 tối đa của Apple Watch thường ở mức thấp, tuy nhiên ChatGPT vẫn coi chúng là chỉ báo rõ ràng về tình trạng sức khỏe kém.

ChatGPT Health cho điểm khác nhau cho cùng một dữ liệu

Các vấn đề không dừng lại ở đó. Khi phóng viên yêu cầu ChatGPT Health lặp lại bài tập chấm điểm tương tự, điểm số dao động giữa điểm F và điểm B trong các cuộc trò chuyện, chatbot đôi khi bỏ qua các báo cáo xét nghiệm máu gần đây mà nó có quyền truy cập và đôi khi quên các chi tiết cơ bản như tuổi và giới tính của người báo cáo. Claude for Healthcare của Anthropic, cũng đã ra mắt vào đầu tháng này, cho thấy sự nhất quán tương tự, chỉ định các điểm chuyển đổi giữa điểm C và điểm B trừ.

- Quảng cáo -

Cả OpenAI và Anthropic đều nhấn mạnh rằng các công cụ của họ không nhằm mục đích thay thế bác sĩ và chỉ cung cấp bối cảnh chung. Tuy nhiên, cả hai chatbot đều đưa ra những đánh giá tự tin và mang tính cá nhân hóa cao về sức khỏe tim mạch. Sự kết hợp giữa thẩm quyền và sự không nhất quán này có thể khiến những người dùng khỏe mạnh sợ hãi hoặc trấn an những người không lành mạnh một cách sai lầm. Mặc dù AI cuối cùng có thể mở ra những hiểu biết có giá trị từ dữ liệu sức khỏe dài hạn, nhưng thử nghiệm ban đầu cho thấy rằng việc cung cấp dữ liệu theo dõi thể dục trong nhiều năm vào các công cụ này hiện tạo ra nhiều nhầm lẫn hơn là rõ ràng.



Nguồn DigitalTrend

- Có thể bạn thích -
BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới