검색 본문 바로가기 회사정보 바로가기

"디지털 자료, 텍스트 데이터 활용 물꼬 트여"…'옛 한글 문헌 전자화 프로젝트'

국립중앙도서관-한국 위키미디어 협회 '업무협약' 체결
"7월부터 AI-OCR 플랫폼 통한 저작권 해제 디지털 원문 활용도 가능"

(서울=뉴스1) 김정한 기자 | 2024-03-21 10:00 송고
19일 국립중앙도서관은 사단법인 한국 위키미디어 협회와 업무협약을 체결했다.(국립중앙도서관 제공)
19일 국립중앙도서관은 사단법인 한국 위키미디어 협회와 업무협약을 체결했다.(국립중앙도서관 제공)
문화체육관광부 국립중앙도서관은 사단법인 한국 위키미디어 협회와 업무협약을 체결했다. 지식정보 접근성을 높이고 데이터 공유를 통한 활용 확대를 위해서다.

20일 국립중앙도서관에 따르면 지난 19일 체결된 이번 협약으로 국립중앙도서관이 소장한 디지털화 자료 일부는 위키미디어가 진행하는 '옛 한글 문헌 전자화 프로젝트'를 통해 텍스트 데이터로 재탄생된다.
이 프로젝트는 대중의 참여를 통해 이미지 형태의 디지털화 자료를 텍스트화하는 작업으로, 누구나 참여할 수 있다. 프로젝트를 통해 생산된 데이터는 양 기관에서 모두 자유롭게 이용할 수 있다.

국립중앙도서관은 이용자 참여 기반의 새로운 방식의 디지털 서비스도 선보일 예정이다. 올해 7월부터 국립중앙도서관 AI-OCR 플랫폼을 통해 저작권이 해결된 디지털 원문을 이용자가 직접 인공지능(AI) 기술을 활용해 광학문자인식(OCR)으로 변환하고 텍스트로 활용할 수 있다.

국립중앙도서관 김수정 디지털정보기획과장은 "AI 기술의 급속한 발전으로 대량의 정제된 데이터가 필수적인 시대에 위키미디어와의 협약을 발판으로 고품질 데이터를 생산하고 공유함으로써 지식자원 활용이 확대되기를 기대한다"고 밝혔다.



acenes@news1.kr

이런 일&저런 일

    더보기