업스테이지, 고품질 한국어 LLM 생태계 위해 '1T 클럽' 발족
"한국 문화 정서 담아낼 수 있는 언어모델 개발"
- 오현주 기자
(서울=뉴스1) 오현주 기자 = 인공지능(AI) 스타트업 업스테이지가 한국어 데이터 부족 문제를 해결하고 고성능 LLM(거대 언어 모델)을 개발하고자 '원티(1T)클럽'을 발족한다고 14일 밝혔다.
'1T 클럽'은 '1조 토큰 클럽'을 줄인 말이다. 1억 단어 이상 한국어 데이터에 기여할 수 있는 파트너사로 구성됐다.
업스테이지는 확보한 데이터로 한국 문화 정서를 담아낼 수 있는 고품질 LLM을 개발하고 다양한 분야의 생성형 AI 앱에 활용한다.
회사는 현재 20여 개 언론사 및 기업 학계 등 데이터 제공기업과 파트너십을 위한 긴밀한 협의를 진행 중이다.
업스테이지는 파트너사에 데이터 제공량에 비례해 API(응용프로그램 인터페이스) 사용료를 할인해 준다. 또 LLM의 API 사업으로 창출될 수익을 공유할 예정이다.
파트너사가 제공하는 데이터는 한글 프리 트레이닝 학습 용도로만 사용하며, 원문을 유출할 수 없도록 자체 탈옥 방지 기술을 적용한다.
1T 클럽에 관심 있는 기업·기관은 업스테이지 홈페이지에서 신청하면 된다.
김성훈 업스테이지 대표는 "'1T 클럽'을 통해 데이터 제공자들의 권익을 지키고 이를 바탕으로 한국문화 정서를 담아낼 수 있는 LLM을 개발해 국내 모든 기업이 AI 발전의 수혜를 볼 수 있도록 최선을 다할 것"이라고 말했다.
woobi123@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









