고해상도 디지털 병리 저장공간 문제…AI 압축기술로 푼다

환자 1명당 3~4GB…기존 일괄 압축으론 필수 정보까지 훼손
AI 활용 단위별 구분 저장 플랫폼 '아다슬라이드' 개발

이성학 서울성모병원 병리과 교수(왼쪽)와 안상정 고려대안암병원 병리과 교수.(서울성모병원 제공)

(서울=뉴스1) 구교운 기자 = 디지털 병리 이미지의 진단 정확도를 유지하면서도 데이터 용량을 현저히 줄일 수 있는 새로운 적응형(Adaptive) 압축 프레임워크가 개발됐다.

22일 서울성모병원에 따르면 이성학 서울성모병원 병리과 교수·안상정 고려대안암병원 병리과 교수 공동 연구팀(제1저자 이종현 펜실베니아대 생물통계학과 박사)은 이같은 기술을 개발해 '아다슬라이드(AdaSlide)'라고 명명했다.

최근 이미지 스캔 기반의 디지털 병리 진단 시스템이 임상 전반에 확대되면서 발생한 데이터의 보관과 처리가 중요한 화두로 떠오르고 있다. 병리 진단을 위해 요구되는 고해상도 이미지 데이터 관리는 병원의 큰 부담으로 꼽힌다.

디지털 병리 시스템을 도입한 병원에서는 환자 한 명당 약 3~4기가바이트(GB), 매년 수백 테라바이트(TB)의 데이터를 보관하기 위해 막대한 저장공간이 필요한 것으로 알려졌다. 보관된 이미지를 재판독하는 경우도 있는 만큼 판독 품질에 영향을 최소화하면서도 효율적으로 용량을 감소시키는 압축 기술에 대한 필요성이 제기됐다.

지금까지 연구됐던 압축 방식은 슬라이드를 전체를 일괄적으로 처리하는 과정에서 필수적인 세포 정보를 훼손하거나 혹은 불필요한 배경 데이터까지 고화질로 저장하는 비효율성이 있었다.

연구팀은 이를 해결하고자 전체 슬라이드를 압축 처리하는 것이 아니라 인공지능을 활용해 한 슬라이드 내에서도 단위 영역별로 다르게 처리하는 하이브리드 압축 플랫폼 아다슬라이드(AdaSlide)를 개발했다.

예를 들어 암세포가 밀집해 정밀한 진단이 필요한 영역은 원본 화질을 보존하고 지방 조직이나 빈 배경처럼 진단적 중요도가 낮은 영역은 고배율로 압축하는 방식으로 학습된 인공지능(AI)으로 이미지를 자동 처리하는 방식이다.

병리 이미지 내에서 진단적 가치가 높은 영역과 그렇지 않은 영역 간 정보 불균형(Information Disequilibrium)을 적절히 처리한다면 중요한 진단 부위의 이미지 품질저하를 최소화하면서도 용량 효율화를 이룰 수 있다는 것이다.

31개 암종을 포함한 '판캔서'(PanCancer) 데이터셋의 약 180만 개 패널 이미지를 활용해 학습된 '압축 결정 에이전트'(Compression Decision Agent)는 이미지 내의 각 영역을 분석해 압축 여부를 스스로 판단하며 압축된 이미지는 이후 '기초 이미지 복원기'를 통해 분석 가능한 수준으로 복원이 가능하다.

13개의 다양한 병리 진단 과제(분류 및 분할)를 통해 성능을 검증한 결과 해당 기술은 원본 이미지 대비 저장 용량을 65%에서 최대 90%까지 줄이면서도 진단 성능은 원본과 동등한 수준을 유지하는 것으로 나타났다.

특히 기존의 균일 압축 방식이 세포 경계를 불분명하게 만들어 분석을 어렵게 했던 것과 달리 연구팀의 플랫폼은 정보 손실을 최소화해 정밀한 분석을 가능하게 했다.

이번 연구는 단순한 용량 압축을 넘어 인공지능이 진단에 필요한 정보를 스스로 선별하고 보존한다는 점에서 의미가 있다고 병원 측은 설명했다.

연구를 주도한 이 교수는 "진단적으로 중요한 정보가 무엇인지를 인공지능이 스스로 판단하고 선택적으로 보존하는 기술은 의료 데이터의 '의미 기반 관리'라는 새로운 방향성을 제시하는 접근"이라며 "향후 대규모 병리 AI 학습 데이터 구축과 국제 공동연구 환경에서도 실질적인 효율성을 제공할 수 있을 것"이라고 밝혔다.

이번 연구 성과는 저명한 국제 학술지 '네이처 커뮤니케이션즈'(Nature Communications, IF 15.7)에 게재됐다.

kukoo@news1.kr