AI vs 의사?…간암 치료 결정 AI가 대신할 수 없는 이유 드러났다
양경모 여의도성모병원 교수팀, 간암 환자 1만 3614명 분석
초기 간암선 효과, 진행성 간암선 불리…AI 권고-실제 치료 일치율 30%
- 김규빈 기자
(서울=뉴스1) 김규빈 기자 = 대규모 언어모델(AI)이 제시한 간암 치료 권고와 실제 임상 치료가 일치한 경우는 약 30%에 불과하다는 연구결과가 나왔다. 특히 초기 간암에서는 AI 추천과 같은 치료를 받은 환자들이 더 오래 생존하는 경향을 보였지만, 병이 진행된 상황에서는 오히려 AI 추천과 다른 치료를 받은 환자들의 경과가 호전됐다.
가톨릭대학교 여의도성모병원 소화기내과 양경모 교수, 한지원 서울성모병원 소화기내과 교수팀은 2008년부터 2020년까지 새로 진단된 간세포암 환자 가운데 초치료 환자 1만 3614명을 분석한 결과 이같이 나타났다고 21일 밝혔다.
연구진은 환자의 종양 특성, 간기능 지표, 전신 상태 등 구조화된 임상 정보를 입력해 챗(Chat)GPT, 제미나이(Gemini), 클로드(Claude) 등 세 가지 대규모 언어모델이 치료 권고를 생성하도록 했다. 이후 실제 의료진이 선택한 치료와 AI 권고가 일치하는지 여부를 분류하고, 병기별로 전체 생존 결과를 비교했다.
간세포암 치료는 종양의 크기나 전이 여부뿐 아니라, 간기능과 전신 상태를 함께 고려해야 하는 대표적인 복합 의사결정 영역이다. 같은 병기라도 환자마다 간기능과 동반 질환, 합병증 위험이 달라 치료 선택이 달라지는 경우가 많다. 이에 연구진은 AI가 제시한 치료 권고가 실제 임상 판단과 얼마나 일치하는지, 생존 결과와 어떤 연관성이 있는지 등을 분석했다.
이번 연구는 치료를 미리 정해 두고 비교한 임상시험이 아니라, 이미 진료가 끝난 환자들의 의료 기록을 모아 실제로 어떤 치료가 이뤄졌고 그 이후 생존 결과가 어땠는지를 사후적으로 분석한 연구다. 즉, 현실 진료에서 발생한 치료 선택과 결과를 그대로 반영했다는 점이 특징이다.
분석 결과, AI 권고와 실제 치료의 전체 일치율은 26.8~32.7%에 그쳤다. 실제 진료 현장에서 선택된 치료와 AI 권고가 같았던 경우는 3명 중 1명 수준인 셈이다. 이는 AI가 간암 치료 가이드라인을 일정 부분 반영할 수는 있지만, 복잡한 임상 상황을 그대로 재현하기에는 한계가 있다는 지적이다.
병기별로 살펴보면 차이는 더욱 뚜렷했다. 초기 간암(BCLC A) 환자군에서는 AI 권고와 실제 치료가 일치한 경우 생존이 더 나은 경향을 보였다. 반면 진행성 간암(BCLC C) 환자군에서는 AI 권고와 실제 치료가 일치한 집단에서 오히려 생존이 낮은 경향이 관찰됐다. 중간 단계(BCLC B)에서는 일관된 생존 차이가 뚜렷하지 않았다.
이 같은 차이는 AI와 의료진이 치료 결정을 내릴 때 중시하는 요소의 차이에서 비롯된다. 의료진은 치료 선택 과정에서 간기능, 전신 상태, 합병증 위험 등을 상대적으로 더 중요하게 고려한 반면, AI는 종양 크기, 혈관 침범 여부, 전이 여부 등 종양 중심 변수를 더 강하게 반영하는 경향을 보였다.
초기 간암에서는 간기능이 비교적 보존된 환자가 많아 가이드라인 중심의 판단이 실제 치료 선택과 잘 맞물릴 수 있다. 이 경우 AI 권고는 임상 판단을 보조하는 역할을 할 수 있다. 반면 진행성 간암에서는 같은 병기라도 간기능에 따라 치료 선택이 달라질 수 있는데, AI는 이런 환자별 차이를 충분히 고려하지 못했다.
실제 진행성 간암 환자 가운데 AI 권고와 일치한 치료를 받은 집단은, 일치하지 않은 집단보다 생존 위험이 더 높았다. 연구진은 임상 현장에서는 간기능과 전신 상태를 종합적으로 고려해 AI 권고와 다른 치료를 선택한 환자들이 더 나은 경과를 보였다고 설명했다.
양경모 교수는 "이번 연구는 AI가 간암 치료 의사결정에서 어디까지 의미 있는 보조 도구가 될 수 있는지, 그리고 어디서부터는 위험해질 수 있는지를 실제 생존 자료로 평가했다는 점에서 의미가 있다"며 "AI는 가이드라인 기반 판단을 보조할 수는 있지만, 치료 결정을 대신하는 주체가 될 수는 없다"고 말했다.
이번 연구에는 한계도 있다. 이미 치료가 끝난 환자 자료를 바탕으로 분석한 만큼, AI 권고와 생존 결과 사이의 인과관계를 단정할 수는 없다. 또한 영상 정보가 포함되지 않았고, 최신 면역항암 치료가 본격 도입되기 이전 자료가 일부 포함돼 현재 치료 환경을 모두 반영하지는 못한다.
한편 이번 연구는 국제학술지 공공과학도서관 의학 학회지(PLOS Medicine) 1월 호에 게재됐다.
rnkim@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









