Nghiên cứu Harvard: AI chẩn đoán cấp cứu vượt bác sĩ giàu kinh nghiệm

Theo nghiên cứu vừa được công bố trên tạp chí Science, nhóm chuyên gia gồm các bác sĩ và nhà khoa học máy tính đến từ Trường Y Harvard cùng Trung tâm Y tế Beth Israel Deaconess đã tiến hành một thử nghiệm thực tế nhằm đánh giá năng lực chẩn đoán của trí tuệ nhân tạo trong môi trường cấp cứu.

Cụ thể, nhóm nghiên cứu sử dụng dữ liệu từ 76 bệnh nhân nhập khoa cấp cứu để so sánh giữa hai bác sĩ nội khoa trực tiếp thăm khám và hai mô hình AI của OpenAI là o1 và GPT-4o. Toàn bộ kết quả sau đó được chuyển cho một hội đồng bác sĩ độc lập thẩm định, trong điều kiện không biết chẩn đoán nào đến từ con người và đâu là kết quả do máy đưa ra.

Kết quả cho thấy mô hình o1 thể hiện ưu thế rõ rệt ở giai đoạn phân loại ban đầu – thời điểm bác sĩ chỉ nắm trong tay lượng thông tin hạn chế nhưng phải đưa ra quyết định nhanh và chính xác nhất. AI này đạt tỷ lệ chẩn đoán chính xác hoặc gần chính xác tới 67% số ca bệnh. Trong khi đó, hai bác sĩ tham gia thử nghiệm lần lượt đạt 55% và 50%.

Nhóm tác giả cho biết các mô hình AI được cung cấp đúng lượng thông tin từ hồ sơ bệnh án điện tử tương tự như bác sĩ, không có bất kỳ bước tiền xử lý hay ưu tiên dữ liệu nào. Ông Arjun Manrai, Trưởng phòng thí nghiệm AI tại Trường Y Harvard, nhận định mô hình đã vượt lên trên hầu hết những chuẩn đánh giá hiện hành, đồng thời cho kết quả nổi trội hơn cả các hệ thống AI trước đó lẫn các mốc tham chiếu từ con người.

Không chỉ gây ấn tượng ở tốc độ xử lý dữ liệu, AI còn cho thấy khả năng tổng hợp triệu chứng, phân tích nguy cơ và đề xuất hướng chẩn đoán trong bối cảnh thông tin thiếu hụt – vốn là một trong những thách thức lớn nhất tại khoa cấp cứu, nơi từng phút trôi qua đều có thể quyết định tính mạng bệnh nhân.

Dẫu vậy, chính nhóm nghiên cứu cũng khẳng định kết quả này không đồng nghĩa AI đã đủ khả năng thay thế bác sĩ trong phòng cấp cứu. Tiến sĩ Adam Rodman, đồng tác giả nghiên cứu, cảnh báo hiện nay vẫn chưa tồn tại một khung pháp lý rõ ràng về trách nhiệm giải trình nếu AI đưa ra chẩn đoán sai. Theo ông, trong những quyết định điều trị khó khăn, bệnh nhân vẫn cần một bác sĩ bằng xương bằng thịt trực tiếp trao đổi, giải thích và đồng hành.

Bên cạnh sự hào hứng, nghiên cứu cũng làm dấy lên những tranh luận trong giới chuyên môn. Theo bác sĩ cấp cứu Kristen Panthagani, phép so sánh giữa AI với bác sĩ nội khoa chưa phản ánh đầy đủ thực tế, bởi nhiệm vụ ưu tiên của bác sĩ cấp cứu không chỉ là xác định bệnh mà còn phải đánh giá ngay liệu bệnh nhân có đang đối mặt với nguy cơ tử vong tức thì hay không.

Ngoài ra, phạm vi thử nghiệm hiện mới dừng ở việc xử lý dữ liệu dạng văn bản từ hồ sơ bệnh án điện tử. Những năng lực quan trọng như đọc hình ảnh X-quang, quan sát biểu hiện lâm sàng trực tiếp, đánh giá ngôn ngữ cơ thể hay cảm nhận mức độ đau đớn của bệnh nhân vẫn là những lĩnh vực AI chưa thể sánh ngang với kinh nghiệm con người.

Dù còn nhiều giới hạn, nghiên cứu từ Harvard tiếp tục cho thấy trí tuệ nhân tạo đang tiến rất nhanh vào lĩnh vực y tế. Trong tương lai gần, AI nhiều khả năng sẽ trở thành “cánh tay phải” hỗ trợ bác sĩ trong khâu sàng lọc, gợi ý chẩn đoán và giảm áp lực tại các khoa cấp cứu đông đúc, thay vì trở thành người thay thế hoàn toàn chiếc áo blouse trắng.