(서울=뉴스1) 김민재 기자 = 엔씨소프트(036570)의 인공지능(AI) 자회사 NC AI가 한국어 기반 멀티모달 AI '바르코 비전 2.0' 4종을 오픈소스로 공개했다.
NC AI는 16일 '바르코 비전 2.0'의 14B 모델과 임베딩 모델을 공개했다. 1.7B와 OCR모델은 다음 주에 선보일 예정이다.
이들은 이미지와 텍스트를 동시에 이해하고 질문에 답하는 차세대 AI 모델이다. 여러 장의 이미지를 동시에 분석해 복잡한 내용을 효율적으로 처리한다. 한국어와 영어를 이해하며 한국 문화 이해도와 텍스트 생성 능력이 개선됐다.

이중 '바르코 비전 2.0 14B'는 최상위 글로벌 오픈소스 비전 언어 모델(VLM)인 알리바바의 Ovis2-16B, Qwen2.5-VL 7B 등을 영문·한국어 이미지 이해, 광학 문자 인식(OCR) 벤치마크 등의 분야에서 능가했다.
NC AI는 산업 현장에서의 활용도를 높이기 위해 14B 파라미터 모델과 함께 1.7B 파라미터 경량 모델도 제공한다. 이를 통해 클라우드 환경뿐 아니라 개인 전자 기기에서도 고성능 멀티모달 AI를 활용할 수 있다.
이미지 내 문자를 인식하는 OCR 특화 모델인 '바르코 비전-1.7B-OCR'도 공개했다.
이 모델은 이미지와 언어 정보를 동시에 학습하는 VLM 기반 방식을 채택해 이미지 내 한국어 문자 인식 성능이 뛰어나다. 또한 'AnyRes 해상도 분할 입력 방식'을 적용해 다양한 해상도의 이미지를 손실 없이 처리한다.
NC AI는 이번에 공개하는 모델 4종을 모두 연구용 오픈소스로 제공한다. NC AI 관계자는 "기업과 개인, 공공기관 누구나 활용할 수 있도록 해 국내 AI 생태계 발전에 기여하겠다"고 말했다.
minjae@news1.kr
