Nghiên cứu Harvard: AI của OpenAI chẩn đoán cấp cứu đúng hơn bác sĩ nội khoa
AI OpenAI chẩn đoán cấp cứu đúng hơn bác sĩ nội khoa

Một nghiên cứu mới từ Trường Y Harvard và Trung tâm Y tế Beth Israel Deaconess cho thấy mô hình AI o1 của OpenAI có thể chẩn đoán chính xác hơn bác sĩ nội tổng quát trong một số tình huống cấp cứu. Công trình được công bố trên tạp chí Science, đánh giá hiệu quả của các mô hình ngôn ngữ lớn trong y khoa.

Thí nghiệm với 76 ca cấp cứu

Nhóm nghiên cứu gồm các bác sĩ và nhà khoa học máy tính đã tiến hành thử nghiệm trên 76 bệnh nhân tại khoa cấp cứu của Beth Israel. Họ so sánh chẩn đoán của hai bác sĩ nội tổng quát với hai mô hình o1 và 4o của OpenAI. Kết quả cho thấy o1 đạt 67% chẩn đoán "trùng khớp hoặc rất gần" ở giai đoạn phân loại ban đầu, cao hơn so với 55% và 50% của hai bác sĩ.

Không làm sạch dữ liệu

Điểm đáng chú ý là nhóm nghiên cứu không xử lý trước dữ liệu. Các mô hình AI nhận được thông tin giống hệt như bác sĩ từ hồ sơ bệnh án điện tử. Theo Arjun Manrai, người điều hành phòng thí nghiệm AI tại Harvard, mô hình o1 vượt trội ở hầu hết các thước đo so với các mô hình trước đây và bác sĩ.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

AI chưa sẵn sàng quyết định sống còn

Dù kết quả ấn tượng, nghiên cứu không khẳng định AI có thể thay thế bác sĩ trong các quyết định sống còn. Nhóm tác giả nhấn mạnh cần có thử nghiệm thực tế và theo dõi trước-sau khi triển khai. Họ cũng lưu ý rằng nghiên cứu chỉ xem xét dữ liệu văn bản, trong khi AI còn hạn chế với hình ảnh và tín hiệu lâm sàng khác.

Adam Rodman, bác sĩ tại Beth Israel và đồng tác giả, cho biết chưa có khung quy chuẩn về trách nhiệm khi chẩn đoán bằng AI, và bệnh nhân vẫn muốn có con người đồng hành trong các quyết định quan trọng.

Tranh luận về cách so sánh

Kristen Panthagani, bác sĩ cấp cứu, chỉ trích nghiên cứu vì so sánh AI với bác sĩ nội tổng quát thay vì bác sĩ cấp cứu. Bà cho rằng mục tiêu chính của bác sĩ cấp cứu là xác định tình trạng nguy hiểm đến tính mạng, không phải đưa ra chẩn đoán cuối cùng. Bài viết và tiêu đề đã được cập nhật để làm rõ điều này.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình