오픈AI, 차세대 AI 모델 'GPT-5.5' 공개…"복잡한 업무 처리 강점"

(오픈AI 제공)
(오픈AI 제공)

(서울=뉴스1) 신은빈 기자 = 오픈AI가 복잡한 업무의 처리 능력을 높인 최신 인공지능(AI) 모델 GPT-5.5를 23일(현지시간) 공개했다.

이번 모델은 △코딩 △온라인 리서치 △데이터 분석 △문서 및 스프레드시트 작성 △소프트웨어 조작 등 실제 업무 전반을 지원하도록 설계됐다.

GPT-5.5는 에이전트형 코딩, 컴퓨터 활용, 지식업무, 초기 과학 연구 등 실제 업무와 맞닿은 영역에서 강점을 보인다.

실제 서비스 환경에서는 전 모델인 GPT-5.4와 유사한 토큰당 지연시간을 유지하면서도 더 높은 성능을 제공한다. 동일한 코덱스 작업을 더 적은 토큰으로 수행해 효율성도 높였다.

오픈AI는 공식 블로그를 통해 "GPT-5.5는 지금까지 개발한 모델 중 가장 똑똑하고 직관적인 모델"이라며 "컴퓨터에서 업무를 처리하는 새로운 방식을 돕는다"고 설명했다.

이외에도 사용자의 의도를 더 빠르게 이해하고, 필요한 도구를 활용해 결과를 점검하며 여러 단계의 업무를 이어서 수행할 수 있도록 설계됐다.

코딩 성능도 강화했다. 실제 개발 업무와 가까운 코딩 과제에서 GPT-5.4 대비 개선된 성능이 확인됐다.

복잡한 명령줄 작업 수행 능력을 평가하는 터미널 벤치 2.0(Terminal-Bench 2.0)에서는 82.7%를 기록해 GPT-5.4의 75.1%를 웃돌았고, 장시간이 걸리는 코딩 과제를 평가하는 내부 지표 엑스퍼트-SWE(Expert-SWE)에서도 GPT-5.4를 상회했다.

실제 소프트웨어 문제 해결 능력을 평가하는 SWE-벤치 프로(SWE-Bench Pro)에서는 58.6%를 기록했으며, 이전 모델보다 더 많은 작업을 단일 패스로 해결했다. 코드 작성, 디버깅, 테스트, 검증 등 실제 개발 업무에 가까운 작업에서 개선된 성능을 보였다.

리서치와 데이터 분석, 컴퓨터 활용, 문서 작성 등 실제 업무와 가까운 영역에서도 성능 개선이 확인됐다. GPT-5.5는 지식 업무 수행 능력을 평가하는 GDPval 지표에서 GPT-5.4 대비 개선된 성능을 보였다.

코덱스에서는 문서, 스프레드시트, 슬라이드 작성 성능도 향상됐다. 컴퓨터 활용 기능과 결합하면 화면을 인식하고 클릭·입력·탐색 등을 이어서 수행할 수 있다. 답변 생성에 그치지 않고 실제 소프트웨어 환경에서 작업을 이어갈 수도 있게 됐다.

이번 모델은 안정성 측면에서도 강화됐다. GPT-5.5는 보다 강력한 세이프가드와 함께 출시됐으며, 사이버 관련 고위험 요청에는 더 높은 수준의 거절 기준과 추가적인 보호 조치를 적용했다.

GPT-5.5는 이날부터 챗GPT 플러스·프로·비즈니스·엔터프라이즈 사용자와 코덱스에 순차 적용된다. GPT-5.5 프로는 챗GPT 프로·비즈니스·엔터프라이즈 사용자에게 제공된다. 응용 프로그래밍 인터페이스(API) 배포에는 별도의 안전과 보안 요건이 적용된다.

오픈AI는 GPT-5.5와 GPT-5.5 프로를 API에도 곧 제공할 예정이다.

bean@news1.kr