(서울=뉴스1) 이정후 기자 = AI 스타트업 트릴리온랩스는 국내 최초로 700억 파라미터 규모의 대규모언어모델(LLM) 트리(Tri)-70B를 공개했다고 10일 밝혔다.
트릴리온랩스는 이번 모델이 현재까지 한국에서 '프롬스크래치'(완전히 처음부터 구축) 방식으로 개발된 가장 큰 언어모델이라는 점에서 의미가 크다고 강조했다.
또한 사후 학습을 최소화한 베이스모델 형태로 공개해 연구자와 기업들이 손쉽게 커스터마이징할 수 있다는 점에서 학계 및 산업계 모두에 기여할 것으로 전망했다.
트릴리온랩스는 이번 모델 공개와 함께 '오픈소스 먼스'(Open Source Month)를 선언하고 △0.5B △1.8B △7B △70B 전 라인업을 아파치 2.0 라이선스로 공개했다. 해당 모델들은 연구를 포함해 상업적 활용까지 가능하다.
오픈소스 먼스 기간에는 매주 최종 모델뿐 아니라 학습 도중 생성된 중간 체크포인트까지 전면 공개한다. 학계와 산업계는 대규모 모델의 학습 과정을 세밀하게 연구할 수 있으며 효율적인 재학습 및 응용 연구를 수행할 수 있다.
트릴리온랩스에 따르면 이와 같은 모델 공개는 전 세계적으로도 드문 시도다. 지금까지 비영리기관인 앨런연구소나 허깅페이스 정도만 제한적으로 공개했으며 트릴리온랩스는 전 세계 세 번째 사례다.
이번 공개에는 다국어 번역 특화 모델과 실시간 검색 특화 모델도 포함됐다. 검색 모델은 덕덕고 등의 검색 엔진과 연동해 최신 정보를 실시간 반영한다.
신재민 트릴리온랩스 대표는 "단순히 언어 모델을 만드는 데 그치지 않고 훈련 과정과 핵심 기법까지 모두 공개해 연구의 투명성을 확보해 글로벌 AI 연구 생태계 발전의 토대를 마련하고자 한다"며 "이번 시도는 국내 AI 기업들이 기술적 우수성과 개방적 연구 문화를 통해 글로벌 경쟁력을 확보할 수 있음을 보여주는 중요한 출발점이 될 것"이라고 강조했다.
한편 트릴리온랩스는 지난해 8월 설립된 스타트업으로 한국어 중심 LLM을 독자적으로 설계하고 사전 학습 단계부터 진행해 왔다.
신재민 대표를 주축으로 카이스트, 옥스퍼드대학교, 버클리대학교, 아마존, 네이버 출신 등 국내외 최고 수준의 AI 엔지니어 및 연구원으로 구성돼 있다.
지난해 9월 580만 달러(약 90억 원) 규모의 프리 시드 투자를 유치했으며 올해 3월 트릴리온-7B, 지난 7월 트리-21B를 오픈소스로 공개했다.
leejh@news1.kr
