"의료 AI 판단이 '6인의 의사' 진단보다 정확…약물처방도 앞서"

네이처 게재…미라·에이미 등 의료 AI 모델과 인간 의사 비교
전문가 "제한적 사례일 뿐…복잡한 임상 상황 반영 못해"

이정환 기자

2026.06.18 오후 12:45

인공지능(AI) 일러스트 <자료사진> ⓒ AFP=뉴스1

(서울=뉴스1) 이정환 기자 = 의료 전문 인공지능(AI) 모델이 일부 진단과 치료 결정에서 의사와 대등하거나 의사를 능가하는 성능을 보였다는 연구 결과가 나왔다.

파이낸셜타임스(FT)에 따르면 17일(현지시간) 과학저널 네이처(Nature)는 독일 드레스덴공대·하이델베르크대병원 연구진이 개발한 의료용 AI 에이전트 '미라'(Mira)와 구글의 '에이미'(AMIE)가 일부 영역에서 인간 의사보다 더 나은 성과를 보여줬다는 두 연구 결과를 게재했다.

미라는 연구에서 환자 역할을 하는 AI 에이전트와의 채팅을 통해 500건 이상의 응급실 임상 사례를 전달받은 뒤, 진단 검사·약물 처방·수술 일정 수립 등 전반적인 진료 역량을 평가받았다.

연구 결과 미라는 췌장암과 폐렴 등 질병의 진단 정확도에서 의사보다 더 나은 결과를 보인 것으로 나타났다. 미라는 맹장염과 폐색전증 등 8개 질환에 87.1%의 진단 정확도를 기록했다. 의사 6명으로 구성된 패널이 달성한 78.1%보다 높은 수준이다.

미라는 진단 정확도와 치료 품질 면에서 비교 대상이었던 전문의·전공의로 구성된 의사 집단과 대등하거나 그 이상의 성과를 낸 것으로 확인됐다. 임상 지침 준수, 알레르기 점검 등 약물 안전성 측면에서도 탁월한 역량을 보여줬다.

에이미는 환자 역할을 맡은 배우들과의 모의실험에서 1차 진료 의사 21명과 비교해 전반적인 환자 관리에서 대등한 성과를 낸 것으로 나타났다.

또 다른 연구에서 에이미는 특히 검사 정밀성, 임상 지침과의 부합도 부문에서는 인간 의사보다 높은 점수를 기록했다. 에이미는 환자에게 투여 용량, 치료 기간, 투여 경로를 구체적으로 명시하는 등 정밀성이 높은 제안을 제공한 것으로 평가받았다.

구글은 이를 두고 "AI가 언젠가 의료 진료를 지원하여 의사들이 환자에게 더 많은 시간을 할애할 수 있도록 도울 수 있음을 시사한다"고 밝혔다.

다만 두 연구에 참여한 과학자들은 이들 AI 모델이 모두 한계가 있음을 인정했다. 연구진은 미라가 여전히 "적지만 0은 아닌" 비율의 환자에게 "최선책에서 벗어난 진료"를 제안했다고 설명했다.

연구진은 에이미 역시 "유망한 능력"을 보여줬지만, "실제 환경으로의 전환에는 준비가 되지 않았다"며 잠재적 추론 오류와 같은 문제를 억제하기 위해 더 많은 연구가 필요하다고 짚었다.

전문가들은 이번 연구에서 소개된 사례들이 인간 의사들이 현실에서 마주하는 혼란스럽고 복잡한 의료 상황과는 거리가 있을 수도 있다고 지적했다.

에든버러 대학교의 의료정보학·데이터과학 석좌교수인 줄리 자코는 "전반적으로 이는 강력한 실험적 연구이자 의미 있는 진전이지만, 실제 임상 의사 결정의 복잡성을 완전히 포착하기보다는 구조화된 표준에 대한 성능을 입증하는 것"이라고 FT에 전했다.

미라 개발에 참여한 야코프 카터 드레스덴 공대 교수는 FT에 "나는 AI 에이전트를 비행기의 자동 항법 시스템과 유사한 것으로 본다"며 "이러한 시스템은 일상적인 업무를 대신해 의료 전문가들을 지원하고 부담을 덜어줄 수 있지만, 궁극적인 책임은 항상 의사에게 남을 것"이라고 말했다.

jwlee@news1.kr

"의료 AI 판단이 '6인의 의사' 진단보다 정확…약물처방도 앞서"

많이 본 뉴스