
(서울=뉴스1) 김민석 기자 = 구글·오픈AI가 각자의 접근법으로 차별화한 차세대 AI 에이전트 기술(AI가 인간처럼 직접 컴퓨터 조작 또는 서비스 앱 실행)을 공개하며 플랫폼 선점 경쟁을 본격화했다.
10일 IT 업계에 따르면 구글은 이달 7일(현지시간) AI 에이전트가 컴퓨터 GUI(그래픽 사용자 인터페이스)와 직접 상호작용할 수 있는 '제미나이 2.5 컴퓨터 유즈'(Gemini 2.5 Computer Use) 모델을 프리뷰 형태로 공개했다.
제미나이 2.5 컴퓨터 유즈는 이용자 프롬프트와 컴퓨터 화면을 분석해 △마우스 클릭·스크롤 △키보드 타이핑 등 13가지 UI 액션을 실행할 수 있다. 이 모델은 스크린샷과 작업 기록을 분석한 후 다음 행동을 결정·실행하는 순환 구조로 작동한다. 개발자는 '구글 AI 스튜디오'와 '버텍스 AI'(Vertex AI)를 통해 이용할 수 있다.
구글은 시연 영상도 공개했다.
영상에는 AI가 반려동물 예약 정보가 담긴 사이트에서 캘리포니아 거주 동물의 데이터를 추출한 후 이를 별도의 CRM 웹사이트에 스스로 입력하거나 특정 전문의를 찾고 진료 예약 등을 자동으로 수행하는 장면이 담겼다.
구글은 제미나이 2.5 컴퓨터 유즈 성능이 경쟁 모델을 앞질렀다고 강조했다. 웹보이저 벤치마크에서 제미나이는 79.9%의 성능을 기록해 클로드(69.4%) 오픈AI(61.0%)를 상회했다.

오픈AI는 챗GPT를 중심으로 모든 서비스를 담아 AI 시대의 새로운 운영체제(OS)가 되겠다는 목표다.
오픈AI는 이를 실현하는 단계로 지난 6일(현지시간) 열린 연례 개발자 회의 '데브데이 2025'에서 '앱 SDK'를 공개했다.
앱 SDK는 이용자 요청에 따라 AI가 챗GPT 내에서 △질로우 △캔바 △스포티파이 등 외부 서비스를 직접 실행해 작업을 완료한다. 대화창에 '캔바를 활용해 반려견 산책 스타트업 포스터를 만들어줘'라고 요청하면 자동으로 템플릿을 선택해 완성된 디자인을 생성하는 식이다.
오픈AI는 캔바·스포티파이·질로우 외 코세라·피그마·익스피디아·부킹닷컴 등과 협약을 맺었다고 발표했다. 우버 서비스도 연내 추가한다는 방침이다.

전문가들은 양사가 기존 API 방식의 한계를 돌파한 기술을 선보였다고 평가하면서도 한계점이 아직 있다고 분석했다. 간단한 작업은 높은 정확도로 수행하지만, 고난도의 복잡한 작업을 명령하면 실패하는 경우가 많기 때문이다.
AI 에이전트 확산에 따른 보안·해킹 우려도 점점 커지고 있다.
스톡홀름국제평화연구소(SIPRI)는 "AI 에이전트 간 상호작용은 현재 겪는 사이버보안 문제를 훨씬 관리하기 어렵게 만들 수 있다"며 "악의적 행위자들이 에이전트 간 상호작용을 해킹해 민감한 정보를 빼내거나 바이러스를 전파할 경우 연쇄적 효과를 예측하기 힘들게 될 것"이라고 우려했다.
ideaed@news1.kr