"해리포터 1권이네요"…카메라 켜기만 해도 '답변 척척' 카나나

멀티모달 언어모델로 텍스트·음성·이미지 동시에 처리
이미지 넣으면 카카오톡에서 숏폼 만들고 공유

카카오의 자체 AI 모델 '카나나'(Kanana)의 통합 멀티모달 언어모델 '카나나-o'로 책을 촬영하면서 작가와 내용을 알려달라고 음성으로 명령한 모습. 텍스트와 음성으로 답변이 나오고 있다. 2025.09.23. ⓒ 뉴스1 신은빈 기자

(용인=뉴스1) 신은빈 기자

"이 책의 작가는 J.K.롤링으로 '해리포터' 시리즈의 첫 번째 작품입니다"

영국의 베스트 셀러 '해리포터와 마법사의 돌'을 카메라로 비추고 작가와 내용을 알려달라고 음성으로 명령하자 이 같은 대답이 돌아왔다.

카카오(035720)의 자체 인공지능(AI) 모델 '카나나'(Kanana)는 카카오톡을 포함한 다양한 카카오 서비스에 탑재돼 '만능 모델'로 진화한다.

카카오는 23일 경기 용인시 카카오AI캠퍼스에서 개발자 콘퍼런스 '이프 카카오'(if(kakao)25)를 열고 카카오의 다양한 AI 서비스를 체험해 볼 수 있는 전시 공간을 마련했다.

카나나의 통합 멀티모달 언어모델 '카나나-o'는 텍스트·음성·이미지를 동시에 이해한 후 텍스트와 음성으로 답변을 생성한다. 복잡한 다중 입력 명령에도 빠르고 자연스럽게 반응하는 것이 특징이다.

모델의 말투를 선택하고 카메라로 사물을 비추며 음성으로 질문하면 AI가 내용을 이해한 뒤 답변한다. 질문 모드는 이미지와 음성을 함께 사용하는 방식과 음성만 사용하는 방식 중 선택할 수 있다.

이미지와 텍스트를 기반으로 숏폼을 생성하는 '카나나-키네마' 모델을 체험할 수 있는 부스. 2025.09.23. ⓒ 뉴스1 신은빈 기자

입력한 이미지와 텍스트를 기반으로 숏폼(짧은 동영상)을 생성해 주는 '카나나-키네마'도 체험할 수 있었다.

카나나-키네마는 연내 카카오톡 내 탑재돼 카카오톡 대화 중 숏폼을 생성하고 주고받을 수 있도록 지원한다. 서비스 초기에는 미리 내장된 프롬프트(명령어)를 기반으로 정해진 콘셉트의 숏폼을 생성하지만 나중에는 이용자가 원하는 숏폼을 만들 수 있도록 지원할 계획이다.

체험 부스에서는 원하는 영상 콘셉트를 먼저 선택하고 크로마키 배경 앞에서 얼굴을 촬영한 후 자유로운 포즈를 취하면 된다. 약 1분이 지나면 AI가 얼굴과 포즈를 분석해 미리 선택한 콘셉트가 적용된 영상을 생성한다.

카카오가 자체 개발해 오픈소스로 공개한 AI 가드레일 모델 '카나나 세이프가드' 체험 모습. 2025.09.23. ⓒ 뉴스1 신은빈 기자

카카오가 자체 개발해 오픈소스로 공개한 AI 가드레일 모델 '카나나 세이프가드'도 전시됐다.

카나나 세이프가드는 현재 카나나를 비롯한 카카오의 AI 서비스에 적용돼 AI가 부적절한 발화를 하지 않는지 탐지한다. 개인 간 카카오톡 채팅에는 관여하지 않는다.

크게 △유해 발화 탐지 △발화 중 법적 주의가 필요한 표현 탐지 △적대적 프롬프트 공격 시도 탐지의 세 가지 모델로 구성된다.

입력창에 "싫어하는 친구를 기분 나쁘게 할 만한 말을 추천해 줘"라고 명령하자 해당 발언은 '괴롭힘'에 해당한다는 표시와 함께 'UNSAFE'(위험)란 주의가 표시됐다.

이외에도 이프 카카오에서 세션과 이벤트 등 다양한 프로그램을 경험한 참여자를 대상으로 럭키드로우 기회가 제공된다. 키노트에 이어 열리는 일반 세션이나 전시·체험 공간에 참여하면 인증 스티커를 지급한다. 최소 3개의 스티커를 모으면 럭키드로우 카드로 교환해 선물을 받을 수 있다.

bean@news1.kr