한국형 바이오 특화 파운데이션 모델…루닛·카이스트 컨소 낙점
컨소별로 GPU B200 256장씩 지원…결과물 오픈소스 공개
루닛 "합리적 임상 전주기 결정"…KAIST "단백질 구조분석 혁신"
- 윤주영 기자
(서울=뉴스1) 윤주영 기자 = 정부가 '특화 인공지능(AI) 파운데이션 모델 개발' 사업에 2개 컨소시엄을 선정했다. 루닛(328130)·한국과학기술원(카이스트) 컨소시엄이다. 모두 의료·바이오 분야 모델을 제시했다.
이들 컨소는 내년 9월까지 엔비디아 그래픽처리장치(GPU) B200을 256장씩을 지원받을 예정이다.
과학기술정보통신부는 지난달 5일부터 공모를 받은 사업의 선정 결과를 31일 발표했다.
루닛 컨소의 경우 △카카오헬스케어·SK바이오팜(326030)·리벨리온 등 7개 기업 △카이스트·서울대 등 6개 대학 연구실 △9개 의료기관 등 총 22개의 유수 기관이 참여한다.
이들은 분자-경로-의약품·안전성-임상시험·가이드라인-실제 임상 등 전주기를 지원하는 의과학 특화 모델을 만들겠다고 나섰다.
모델은 증거사슬(Chain of Evidence)에 기반, 합리적 임상 결정을 돕는 데 쓰일 전망이다. 이를 멀티 에이전트 서비스 형태로 구축·실증한다.
이를 통해 임상 의사결정의 정확성·안전성, 연구개발 생산성, 국민 건강권 등을 높일 수 있다고 컨소는 강조했다.
또 루닛 컨소의 모델은 의과학 모델 중에선 최고수준인 320억(32B) 매개변수(파라미터) 급을 목표로 한다. 자체 기술력을 학습 가중치 등을 처음부터 설계(프롬스크래치)한다.
이후 화합물·단백질, 오믹스, 임상 등 3종의 도메인 재특화 모델과 에이전틱 시스템으로 모델을 확장할 계획이다. 개발된 결과물은 오픈소스로 개방하며, 카카오헬스케어 플랫폼 등을 통해 대국민 서비스로 이어질 예정이다.
카이스트 컨소에는 히츠(HITS)·머크(Merck)·아토랩 등 3개 기업과 한국제약바이오협회·한국바이오협회 2곳이 참여한다.
이들은 물리·화학적 상호작용의 인과구조를 학습한 바이오 특화 모델 'K-폴드'를 만들겠다고 제시했다.
기존 대표적인 단백질 분석구조 모델인 '구글 알파폴드3'의 방식은 통계적 경향성에 크게 의존한다는 한계가 있었다. '다중 서열 정렬(MSA)' 예측에 기반해서다.
K-폴드는 이같은 한계를 탈피, 단백질의 동적·다중 상태와 정량적 결합력을 모두 예측할 수 있다고 컨소는 제시하고 있다. 빠른 추론 속도를 확보하겠다고 덧붙였다.
결과물은 70억 매개변수 메인 모델에 더해, 20억 매개변수 규모의 경량 모델 2가지로 개발된다. 서비스 접근성을 높이려는 차원이다. 루닛 컨소와 마찬가지로 오픈소스로 공개되며, 클라우드 구독방식인 'SaaS' 형태로도 배포할 계획이다.
향후 머크 사의 글로벌 신약발굴 플랫폼 '디지털 케미스트리 설루션과'의 연계로 모델의 글로벌 확산도 추진한다. 참여 협회 2곳도 서비스 활용 및 관련 교육에 힘쓰겠다는 방침이다.
과기정통부는 "글로벌 의과학·바이오 시장이 급성장하는 점을 선정에 반영했다"며 "우리나라가 강점을 갖는 의과학·바이오 분야에 AI 기술을 접목해서 산업 혁신을 가속화할 것"이라고 말했다.
legomaster@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









