인공지능도 '경력직' 시대…AI 간 지식 이전 기술 개발
KAIST-고려대 공동연구
- 김종서 기자
(대전=뉴스1) 김종서 기자 = 한국과학기술원(KAIST)은 전산학부 김현우 교수 연구팀이 고려대학교 연구팀과 공동연구를 통해 서로 다른 인공지능(AI) 모델 사이에서 학습된 지식을 효과적으로 이식할 수 있는 새로운 기술을 개발했다고 27일 밝혔다.
최근 AI 분야에서는 사진과 글을 함께 이해하는 시각–언어 모델(VLM)이 빠르게 발전하고 있다. 이는 사용자가 사진을 보여주며 질문하면 설명을 해주는 챗GPT와 같은 멀티모달 AI를 떠올리면 이해하기 쉽다. 이런 모델들은 대규모 이미지와 언어 데이터를 사전 학습해 적은 양의 데이터만으로도 새로운 분야에 비교적 빠르게 적응할 수 있다는 장점을 지닌다.
그러나 새로운 AI 모델이 나올 때마다 적응 과정을 처음부터 다시 수행해야 한다는 점이 큰 비효율로 지적돼 왔다. 기존 적응 기법들 역시 모델 구조가 조금만 달라져도 그대로 활용하기 어렵거나 여러 모델을 동시에 사용해야 해 메모리와 연산 비용이 크게 증가하는 한계를 안고 있었다.
연구팀은 문제를 해결하기 위해 모델의 구조나 크기에 상관없이 학습된 지식을 재사용할 수 있는 전이 가능한 적응 기법 '트렌스미터'(TransMiter)를 제안했다.
이 기술의 핵심은 한 AI가 학습하며 쌓은 적응 경험을 다른 AI 모델로 직접 옮기는 것이다. AI의 복잡한 내부 구조를 뜯어고치지 않고 예측 결과만 보고 배운 요령을 다른 AI에 전해주는 방식이다.
서로 생김새가 다른 AI 모델이라도 같은 질문에 내놓은 답변을 기준으로 정리해 주면 한 AI가 익힌 노하우를 다른 AI도 바로 활용할 수 있다. 복잡하고 시간이 많이 드는 학습 과정을 다시 거칠 필요가 없고 속도도 거의 느려지지 않는다.
이번 연구는 그동안 모델 구조나 크기가 다르면 재사용이 거의 불가능하다고 여겨졌던 AI의 적응 지식을 모델 종류에 상관없이 정밀하게 이식할 수 있음을 처음으로 입증했다는 점에서 의미가 크다고 연구팀은 설명했다.
이를 통해 반복적인 학습 비용을 줄이고 필요한 분야에 맞춰 거대언어모델을 실시간으로 업데이트하는 이른바 '지식 패치' 기술로의 활용도 기대된다.
김 교수는 "이번 연구를 확장하면 빠르게 발전하는 초거대언어모델이 등장할 때마다 반복적으로 수행해야 했던 후학습의 비용을 크게 줄일 수 있다"며 "특정 분야의 전문 지식을 손쉽게 추가하는 모델 패치가 가능해질 것"이라고 설명했다.
KAIST 전산학부 송태훈 석사과정 학생, 이상혁 박사후연구원, 고려대학교 박지환 박사과정 학생이 공동 저자로 참여한 이번 연구 결과는 AI 분야 국제 학술대회 'AAAI 2026'에 구두 발표로 채택됐다.
김 교수 연구실은 이번 논문 외에도 구글 클라우드 AI와 공동 진행한 문서 내 테이블 이해를 고도화한 기술 '탭플래시'(TabFlash)를 포함해 총 3편의 논문을 발표했다.
jongseo12@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









