검색 본문 바로가기 회사정보 바로가기

"브루노 마스가 부른 하입보이"…AI 음성 기술, 어디까지 왔을까[미래on]

'시리·알렉사' 넘어 배우·가수·일반인 목소리 본뜬 'AI 목소리' 발전
네오사피엔스, 휴멜로, 네이버, KT 등 서비스 개발에 뛰어들어

(서울=뉴스1) 윤지원 기자 | 2023-05-18 05:30 송고 | 2023-05-18 08:29 최종수정
최근 미국 팝가수 브루노 마스가 국내 아이돌 뉴진스의 노래 '하입보이'를 부르는 유튜브 영상이 화제가 됐다. 영상은 게시된 지 약 2주 만에 조회수 100만회를 돌파했다.(유튜브 영상 화면 갈무리)
최근 미국 팝가수 브루노 마스가 국내 아이돌 뉴진스의 노래 '하입보이'를 부르는 유튜브 영상이 화제가 됐다. 영상은 게시된 지 약 2주 만에 조회수 100만회를 돌파했다.(유튜브 영상 화면 갈무리)

"한국말이 너무 자연스럽다. 진짜 브루노 마스가 부른 것 같아서 소름이 돋는다."

최근 미국 팝가수 브루노 마스가 국내 아이돌 그룹 뉴진스의 노래 '하입보이'를 부르는 유튜브 영상이 화제가 됐다. 영상은 게시된 지 약 2주 만에 조회수 100만회를 돌파했다.
반전은 노래를 부른 주인공이 실제 가수가 아닌 인공지능(AI)이었다는 점이다. 이는 한 이용자가 AI 음성 기술을 활용해 만든 영상이었다. 노래를 들은 누리꾼들은 '한국말이 이질적이지 않다'며 AI 기술 발전 수준에 연신 감탄했다.

이처럼 실제 사람의 목소리를 학습해 노래나 오디오북 등을 만들어 내는 'AI 보이스 기술'이 발달하고 있다. 애플의 '시리'나 아마존의 '알렉사' 등 음성 인식 AI 비서를 넘어 가수, 배우 심지어 일반인의 음성 데이터를 활용해 음성을 합성하는 수준까지 왔다.

음성 AI 기술의 기본 원리는 텍스트투스피치(TTS)와 스피치투텍스트(STT)다. 문자 그대로 문자를 음성으로, 음성을 문자로 변환시키는 기술을 말한다. AI 기술이 발달하면서 단어, 문장 단위의 음성 데이터를 분석한 후 원래 목소리의 발화 스타일을 학습해 음성을 합성할 수 있게 됐다.

국내에서는 네오사피엔스, 휴멜로 등의 스타트업이 AI 음성 기술 개발에 뛰어들었다.
2017년에 설립된 네오사피엔스는 AI 성우를 활용해 음성 및 영상 콘텐츠를 제작하는 '타입캐스트' 서비스를 운영하고 있다. 이용자가 문장을 작성해 성별, 연령, 콘텐츠 분위기 등에 맞춰 성우를 선택하면 전문 성우가 녹음한 것 같은 음성 파일을 만들 수 있다.

2018년에 설립된 휴멜로도 이같은 AI 음성 합성 서비스 '프로소디'를 개발했다.

네이버는 2020년에 다양한 AI 목소리로 콘텐츠에 더빙 음성을 입힐 수 있는 '클로바더빙'을 출시했다. 스마트폰으로 몇개의 문장을 녹음하면 바로 AI 목소리를 제작할 수 있는 '보이스 메이커' 서비스도 제공 중이다.(네이버 제공)
네이버는 2020년에 다양한 AI 목소리로 콘텐츠에 더빙 음성을 입힐 수 있는 '클로바더빙'을 출시했다. 스마트폰으로 몇개의 문장을 녹음하면 바로 AI 목소리를 제작할 수 있는 '보이스 메이커' 서비스도 제공 중이다.(네이버 제공)

네이버와 KT도 음성 합성 서비스를 선보이면서 AI 전문가가 아닌 일반인도 쉽게 AI 목소리를 제작할 수 있는 시대가 왔다.

네이버는 2020년에 다양한 AI 목소리로 콘텐츠에 더빙 음성을 입힐 수 있는 '클로바더빙'을 출시했다. 클로바더빙은 출시 2년여 만에 가입자 100만명을 돌파했다. 네이버는 스마트폰으로 몇개의 문장을 녹음하면 바로 AI 목소리를 제작할 수 있는 '보이스 메이커' 서비스도 선보였다.

네이버는 클로바 음성 합성 기술을 활용해 자사 가상인간 '로지'의 목소리를 만들기도 했다. 로지의 목소리는 성우 및 시연자의 목소리 녹음 데이터로 구현됐다. 네이버는 자체 개발한 'NES' 기술을 통해 목소리를 제작했다.

KT도 지난해 이와 유사한 'AI 보이스 스튜디오'와 '마이 AI 보이스' 서비스를 출시했다. 30개의 예시 문장을 녹음하면 실제 목소리와 닮은 AI 목소리를 제작할 수 있다.

현재 AI 음성 기술은 더빙, 오디오북 등 분야에서 활용되고 있다. 주로 배우, 가수, 성우 등의 목소리 데이터로 콘텐츠를 제작하는 식이다.

더 나아가 개인의 목소리를 서비스에 적용할 수 있는 시대도 머지않았다. 실제로 해외에서는 최근 한 인플루언서가 자신의 목소리를 합성해 유료 AI 음성 챗봇 서비스를 내놔 화제가 됐다.

미국의 인플루언서 카린 마저리는 자신의 목소리, 성격 등을 복제한 AI 음성 챗봇 '카린 AI' 서비스를 내놨다. 출시 첫 주에만 10만달러(약 1억3400만원)가 넘는 매출을 기록했다. 인간이 AI와 사랑에 빠지는 영화 '그녀'(Her)가 현실화됐다는 평가까지 나왔다.


g1@news1.kr

이런 일&저런 일

    더보기