시각장애인 교수가 만든 정확도 100% 점자 번역 앤진 'K-브레일'
KAIST 재활인공지능연구실 가현욱 교수 연구팀
- 김종서 기자
(대전=뉴스1) 김종서 기자 = 한국과학기술원(KAIST)은 융합인재학부 재활인공지능연구실 가현욱 교수 연구팀이 일반 글자(묵자)를 시각장애인이 읽을 수 있는 점자로 변환하는 '점역' 기술을 고도화한 차세대 점자 번역 엔진 'K-브레일(Braille)'을 개발하고 대규모 성능 검증을 완료했다고 13일 밝혔다.
점역은 책, 문서, 웹페이지 등 일반 문자로 작성된 정보를 점자 체계에 맞게 변환하는 시각장애인의 정보 접근을 위해 필수적인 기술이다. 그러나 한국어 점자 규정은 띄어쓰기, 기호, 외국어 표기 등 다양한 예외 규칙이 존재해 정확한 자동 점역이 쉽지 않다.
현재 시각장애인들이 사용하는 기존 점역 프로그램들은 문자나 기호를 단순 규칙에 따라 변환하는 방식이다. 다국어(영문 등)·한글 혼용 표현이나 복합 단위 기호, 괄호 띄어쓰기 등 복잡한 규정 처리에서 오류가 발생하는 경우가 있다.
이에 점자 한 칸의 오류는 시각장애인에게 단순한 오타를 넘어 정보 왜곡으로 이어질 수 있다는 점에서 정확한 점역 기술의 중요성이 꾸준히 제기돼 왔다.
연구팀이 개발한 K-브레일 엔진의 가장 큰 특징은 '문장을 이해하는 점역 시스템'이라는 점이다. 기존 점역 프로그램이 문자나 기호를 단순히 바꾸는 치환 방식이라면, K-Braille은 형태소 분석과 문장 구조 분석(AST)을 통해 문장의 구조와 맥락을 분석하여 의미를 이해한 뒤 점자로 변환한다.
이를 통해 외국어와 한글이 혼용된 문장, 복잡한 기호 조합, 단위 표기 등 개정된 점자 규정의 다양한 예외 상황을 보다 정확하게 처리할 수 있다.
연구팀은 기술의 정확도를 확인하기 위해 국립국어원이 구축한 국내 최대 규모의 점자 데이터셋인 '묵자-점자 병렬 말뭉치(NLPAK)'를 활용했다. 이 데이터에는 일반 글자와 점자가 짝을 이루는 문장들이 함께 정리돼 있다. 연구팀은 여기서 1만7943개의 문장을 추출해 K-브레일의 점역 결과가 실제 점자와 얼마나 일치하는지 전수 평가를 진행했다.
그 결과 점자 규정을 실제로 얼마나 정확하게 따르는지를 나타내는 '실질 점역 규정 준수율'이 100%로 나타났다. 점자 문장의 구조가 정답과 얼마나 비슷한지를 보여주는 점역 형태소 구조 유사도도 평균 99.81%를 기록해 높은 점역 정확도를 확인했다.
국립국어원의 공식 점역 프로그램 점사랑과 동일 문장 세트를 이용한 비교 검증에서도 K-브레일이 더 높은 점역 일치율을 보이며 기술적 경쟁력을 확인했다.
선천적 중증 시각장애인 연구자인 가 교수는 "점자는 시각장애인에게 단순한 기호가 아니라 세상을 읽는 언어"라며 "이번 성과를 기반으로 향후 수학 수식과 과학 기호, 나아가 음악 악보까지 처리할 수 있는 차세대 점역 시스템으로 기술을 발전시킬 계획"이라고 말했다.
연구팀은 앞으로 기존 점자 파일 형식의 한계를 넘어 새로운 점자 파일 형식을 만들고, 그 파일을 작성·읽기·공유할 수 있는 소프트웨어와 장치 환경을 함께 만드는 차세대 전자 점자 파일 포맷 생태계도 구축할 계획이다.
개발한 점역 엔진은 포용적 인공지능(AI) 기술로서 사회에 전면 무상으로 환원하기로 했다. 다만 기술의 파편화를 막고 지속 가능한 생태계를 유지하기 위해 무분별한 소프트웨어 오픈소스화보다는 공공기관, 교육청, 점자 도서관, 보조기기 제조사 등 '책임 있는 기술 활용 주체'와 공식적인 기술 이전 및 제휴망을 구축할 예정이다.
이를 올해 안에 추진하면 점자 환경을 구축·운영 중인 기관이나 신규 점자 디스플레이 업체가 추가적인 소프트웨어 라이선스 비용 없이도 최신 점역 모듈(API 및 시스템 커널)을 즉각 통합 연동할 수 있을 전망이다.
jongseo12@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









