카카오뱅크, 금융 AI 안전기술 국제무대서 인정…논문 4편 연속 채택

ICLR·ACL·LREC 등 세계적 AI 학회서 공개
유해 콘텐츠 주입 탐지, 멀티모달 공격 방어 등 연구 성과 입증

카카오뱅크 금융기술연구소 이미지.(카카오뱅크 제공).

(서울=뉴스1) 윤수희 기자 = 카카오뱅크 금융기술연구소가 생성형 인공지능(AI)의 안전성을 높이고 금융 특화 AI의 성능을 개선하는 연구 성과를 잇달아 국제 학술대회에서 인정받았다.

카카오뱅크는 생성형 AI 보안과 금융 AI 신뢰성 향상을 주제로 한 논문 4편이 올해 주요 국제 AI·언어처리 학술대회에 연이어 채택됐다고 30일 밝혔다.

우선 지난 4월 열린 국제표현학습학회(ICLR) 2026에서는 금융·법률 등 전문 분야 생성형 AI를 겨냥한 프롬프트 인젝션(Prompt Injection) 공격을 탐지하는 기술을 발표했다. 프롬프트 인젝션은 악의적인 명령을 입력해 AI의 정상적인 동작을 우회하거나 유해한 답변을 유도하는 공격 기법이다.

이번 연구는 카카오뱅크와 KAIST가 공동 구축한 약 5만9000건 규모의 데이터셋을 기반으로 이뤄졌으며, 금융 특화 AI 환경에서 프롬프트 공격을 효과적으로 식별할 수 있도록 설계됐다.

이어 5월 열린 자연어처리·언어자원 분야 국제학술대회 LREC 2026에서는 금융 AI의 보안성과 정확성을 높이는 연구 2편이 채택됐다.

첫 번째 연구는 이미지와 텍스트를 함께 처리하는 멀티모달 환경에서 발생하는 프롬프트 공격을 탐지하는 기술이며, 두 번째 연구는 복잡한 금융 데이터를 처리하는 과정에서 생성형 AI가 발생시킬 수 있는 숫자 계산 오류를 자동으로 찾아내는 기술이다. 회사는 해당 기술이 금융 AI 챗봇의 오류를 줄이고 보안 위협 대응 능력을 높이는 데 활용될 것으로 기대하고 있다.

또 지난 5월 KAIST와 공동 수행한 연구는 전산언어학회(ACL) 2026 산업 분야 트랙에도 채택됐다.

해당 연구에서는 보이스피싱, 금융사기, 개인정보 탈취 등 금융 분야에서 발생할 수 있는 위험 요소를 체계적으로 분류한 AI 안전성 평가 기준을 제시했다. 아울러 AI 모델이 위험하거나 부적절한 답변을 스스로 회피하도록 학습시키는 기술도 함께 공개했다.

카카오뱅크 관계자는 "이번 연구는 학술적 성과를 넘어 금융 AI 서비스의 안전성과 정확성을 높이는 실질적인 기술이라는 점에서 의미가 있다"며 "앞으로도 금융 환경에 특화된 AI 보안 기술과 연구를 지속해 안전하고 편리한 금융 서비스를 제공하겠다"고 말했다.

ysh@news1.kr