
(서울=뉴스1) 김정현 기자 = 지능형 데이터 전문 기업 누리IDT는 고문헌 한문을 현대 한국어로 옮겨주는 '고문헌 자동 번역' 프로그램을 개발했다고 12일 밝혔다.
이번 프로그램은 최신 트랜스포머(Transformer) 계열 AI 모델을 기반으로 조선 시대 자료에서 구축된 다량의 학습 데이터로 훈련됐다. 전통 고문헌의 한문을 텍스트로 입력하면 한 번에 1000자까지 번역할 수 있다.
누리IDT 측은 "글로벌 자동 번역 서비스는 현대 언어 번역에 주력하고 있어 전통 고문헌의 옛 한문 등은 양호한 번역 품질을 기대하기 어렵다"며 "고문헌 자동 번역 프로그램은 고문헌의 언어를 현대 한국어로 번역하는데 특화됐으며, 특히 특히 조선 후기의 사서와 문집류 한문은 초벌 번역 이상의 번역 품질을 보인다"고 강조했다.

누리IDT는 이와 함께 두루마리 문서처럼 크기가 큰 대형 고문서의 수록 문자를 자동 인식하는 '대형 문서 광학문자인식(OCR)'과 구조가 복잡한 문서의 영역을 분할해 문자를 인식하는 '영역 인식 OCR' 프로그램도 공개했다.
배성진 누리IDT 대표는 "2년 전 고문헌 한자 OCR을 출시한 후 마침내 고문헌 토털 솔루션의 최종 3단계에 도달하게 됐다"며 "이번에 새로 공개하는 자동 번역 서비스가 고문헌 콘텐츠의 활용에 적극 사용되길 바란다"고 강조했다.
한편 누리 IDT의 고문헌 토털 서비스는 '고문헌 AI 시스템' 홈페이지에서 회원 가입을 거쳐 누구나 사용해 볼 수 있다.
Kris@news1.kr