디플리, 韓 AI 기술력 세계에 선봬…'음향 AI' 학회서 쾌거

'Interspeech 2025'서 마이크 간 음향 차이 해결 기술 선보여
총 4편 성과로 글로벌 연구 역량 입증

이재상 기자

2025.08.22 오후 01:08

INTERSPEECH 2025에 참석중인 디플리 류명훈 CIO.(디플리 제공)

(서울=뉴스1) 이재상 기자 = 국내 음향 인공지능(AI) 스타트업 디플리(Deeply·대표 이수지)는 세계 최정상 음향·음성 학회에서 한국 기술의 우수성을 입증했다고 22일 전했다.

디플리는 네덜란드 로테르담에서 지난 17일부터 21일까지 열린 세계 최고 권위의 음성 학회 'Interspeech 2025'에서 산업 현장의 오랜 난제였던 '마이크 간 음향 차이'를 해결한 핵심 기술을 성공적으로 선보였다.

이번 발표는 지난 4월 그리스에서 개최된 신호처리 분야 최대 학회 'ICASSP 2025'에서 2편의 논문이 채택된 데 이어 추가로 채택되며 2년 연속 세계적인 연구 성과를 인정받는 값진 성과로 이어졌다.

톱 티어 글로벌 학회에 총 4편의 논문을 게재한 것은 디플리의 기술력이 국내를 넘어 세계적으로도 인정받고 있음을 보여준다.

디플리가 이번 Interspeech 2025에서 발표한 'Unified Microphone Conversion' 기술은 음향 AI 분야의 오랜 숙원을 해결한 혁신으로 평가받는다. 서로 다른 마이크나 녹음 기기로 인해 발생하는 음향 데이터의 불일치 문제는 산업 현장에서 AI 정확도를 떨어뜨리는 주요 원인으로 꼽혀왔다.

디플리는 이 문제를 해결하기 위해 획기적인 접근법을 제시했다.

기존에 각 마이크 조합마다 별도의 AI 모델이 필요했던 번거로운 기존 방식과 달리, Feature-wise Linear Modulation(FiLM) 기법을 활용해 단일 모델로 다양한 마이크의 특성을 일반화하는 '다대다(Many-to-Many) 변환' 기술을 최초로 구현했다.

실험 결과 이 기술은 기존 최고 성능 모델 대비 인식 정확도를 2.6%p 향상시키고 장치 간 성능 편차를 0.8%p 줄이는 성능을 입증했다.

특히 실제 데이터 수집 없이 합성 데이터만으로도 높은 성능을 구현해 상용화에 따른 비용과 시간을 획기적으로 절감할 수 있는 가능성을 제시했다.

디플리 관계자는 "AI가 눈으로 보고 귀로 듣는 시대에 소리는 현장의 위험을 가장 먼저 알려주는 신호"라며 "Interspeech와 ICASSP 연속 발표를 계기로 글로벌 협업과 사업 확장을 가속화할 것"이라고 밝혔다.

alexei@news1.kr

디플리, 韓 AI 기술력 세계에 선봬…'음향 AI' 학회서 쾌거

많이 본 뉴스