실험노트에서 AI로… 과학 연구의 패러다임 전환[혁신의 창]

(서울=뉴스1) 최고야 한약자원연구센터장 = 요즘 연구현장에서 인공지능(AI) 챗봇을 활용하지 않는 연구자를 찾기 어려울 정도다. ChatGPT 등 생성형 AI 챗봇은 24시간 대기하며 지치지도 싫증내지도 않고 요약·번역·작성 등 업무를 순식간에 처리해낸다. 어느 소설의 표현을 빌리면 ‘전일 근무 가능한 무보수 만능 하인’에 가깝다.

그러나, 논문 분석, 발표자료 구성, 그래프 도식화, 영문법 교정 등 컴퓨터 화면에서 이뤄지는 일에는 압도적인 생산성을 발휘하는 AI도 실험대 위에서는 그 도움을 받기 어렵다.

바이오 분야에서 실험결과는 첨단 분석장비에서 자동으로 만들어져 나오는 것처럼 보이기도 한다. 그러나 ‘파이펫 노동’으로 대표되는 실험실 업무들, 즉 시약 조제, 무게 측정, 추출물 분리, 세포 계대배양, 약물 투여 등 비교적 단순하지만 필수적인 반복 공정들이 없으면 어떤 분석장비도 데이터를 만들어낼 수 없다. 그리고 이러한 전처리에 필요한 노동은 여전히 인간 연구자의 몫이다.

일각에서는 AI가 실험까지 대체할 수 있다고 기대하지만, 계단오르기·젓가락질·설거지·빨래개기가 모두 가능한 로봇이 나오기 전에는 인간 스스로가 ‘만능 실험 로봇’의 역할을 할 수 밖에 없다. 따라서 실험으로 얻은 데이터를 분석하고 예측하는 데 강점을 가진 AI와의 협업 구조를 설계하는 것이 현실적이다.

특정 조건에서 어떤 반응이 일어날지, 어떤 추출공정이 특정 생리활성 성분을 극대화할지를 예측할 수 있다면, 연구자는 그 결과가 기대되는 실험 조건만을 선별해 실험하고, 반복과 낭비는 줄일 수 있다. 즉, 예측형 AI는 물리적 실험의 효율을 극대화할 수 있는 도구가 될 수 있다.

하지만 이를 위해서는 한 가지 선결 조건이 필요하다. 양질의 연구데이터가 풍부하게 축적되어야 한다. 그런데 연구자들은 실험 데이터를 정리·보존하는 데 매우 큰 부담을 느낀다. 대부분의 연구자들은 자신만의 데이터 정리방식을 고수하고 있어, 표준화된 데이터 포맷을 요구하면 일단 ‘귀찮다’는 반응부터 나오는 것도 현실이다.

더욱이 연구데이터는 논문이나 보고서 작성이 끝난 이후에는 다시 들여다볼 일이 별로 없기 때문에, 과제 종료 후 1~2년이 지난 시점에 메타데이터를 포함한 데이터 제출을 요구받는 상황은 많은 연구자에게 비효율적 업무처럼 느껴진다. 이로 인해 제출되는 데이터는 종종 ‘정리하기 편한’ 수준에 머무르며, 실제 가치 있는 실험정보는 방치되기 일쑤다.

본 이미지는 챗GPT로 생성한 이미지입니다.

이러한 병목을 해소하려면 AI가 실험데이터의 정리와 가공에도 도움을 줄 수 있어야 한다. 연구노트나 실험기록지, PDF 파일 혹은 이미지 데이터를 읽어 표준화된 연구데이터로 자동 변환해주는 시스템이 제공된다면, 연구자들은 보다 부담 없이 데이터를 공개할 수 있을 것이다. 연구데이터가 많이 축적될수록 예측형 AI의 정확도도 향상될 것이고, 다시 그것이 실험 효율을 높이는 선순환으로 이어질 수 있다.

AI와 실험의 연동 구조를 얼마나 빨리 마련하느냐가, 향후 연구 생산성의 격차를 좌우할 것이다. 그 시작은 연구데이터를 제대로 남기는 일이다. 표준화된 연구데이터를 자동 수집·정리해주는 인프라, 그리고 데이터 공유를 장려하는 제도적 유인이 병행되어야 한다. 그래야 AI와 기초과학이 진정한 시너지를 낼 수 있을 것이다.

◇최고야 한국한의학연구원 한약자원연구센터장

△우석대학교 한의학 박사

△국가표준 한의약 전문위원

△중앙약사심의위원

*외부 필진의 기고문은 뉴스1의 편집 방향과 다를 수 있습니다.

esther@news1.kr