"내 일자리 뺏길까?" AI에 묻자…챗GPT·제미나이·클로드 '제각각'

회계사·광고관리자·CEO 등 직업별 'AI 대체 위험' 평가 엇갈려
연구진 "단일 지표 의존 위험…실제 업무 변화·도입 양상 봐야"

(서울=뉴스1) 장용석 기자 = 인공지능(AI)이 향후 어떤 일자리를 대체할지를 두고 AI 모델들조차 일관된 답을 내놓지 못한다는 연구 결과가 나왔다. 이에 따라 AI 확산에 따른 노동시장 충격을 예측하는 데 쓰이는 이른바 'AI 노출도' 지표의 신뢰성에 의문이 제기된다고 10일(현지시간) 월스트리트저널(WSJ)이 보도했다.

WSJ는 미국 노스웨스턴대와 아메리칸대 경제학자들로 구성된 연구진이 '챗GPT-5', 구글 딥마인드의 '제미나이 2.5', 앤스로픽의 '클로드 4.5'에 직업별 AI 노출도를 평가하게 한 결과, 모델별 답변이 상당히 엇갈렸다며 이같이 전했다.

WSJ에 따르면 'AI 노출도'는 특정 직업의 업무 중 AI가 수행하거나 속도를 크게 높일 수 있는 일이 얼마나 많은지를 따지는 지표다. 연구진은 미 노동부의 직무 데이터베이스를 활용해 각 직업의 세부 업무를 나눈 뒤 그 업무가 AI에 의해 얼마나 대체·보완될 수 있는지를 평가했다.

그러나 평가 방식에 따라 결과가 크게 달라졌다는 게 연구진의 설명이다. 기존 평가 방식은 사람이 직접 업무별 AI 적용 가능성을 평가하거나, 실제 AI 이용자를 설문 조사하거나, AI 모델 자체에 평가를 맡기는 것으로 나뉜다. 그러나 사람의 평가는 주관성이 크고, 이용자 설문도 특정 플랫폼 사용자에 치우칠 수 있다는 점이 한계로 꼽힌다. AI 모델에 평가를 맡기는 방식 역시 이번 연구에서 모델별 편차를 드러냈다.

연구진에 따르면 클로드는 회계사의 AI 취약성이 매우 크다고 평가한 반면, 제미나이는 상대적으로 적다고 봤다. 광고 관리자와 최고경영자(CEO) 등에 대해서도 AI 모델 간 판단이 엇갈렸다. 챗GPT와 제미나이는 3개 AI 모델 가운데 가장 비슷한 평가를 했지만, 같은 세부 업무를 두고도 약 4분의 1은 서로 다른 판정을 했다.

이에 대해 연구진은 "일부 차이는 AI 모델 특성에서 비롯됐지만, 현재 어떤 직업군이 AI를 많이 쓰고 있는지도 평가에 영향을 줬다"고 분석했다. 이를테면 금융분석가처럼 AI를 일찍 도입한 직종은 관련 사용 데이터가 더 많이 쌓여 이 데이터가 다시 AI 모델의 직업별 위험도 판단에 반영될 수 있다는 것이다.

연구진은 "AI 노출도 지표가 정책 결정이나 진로 선택에 활용될 수 있는 만큼, 단일 모델이나 단일 지표에 의존해선 안 된다"고 지적했다. 이번 연구에 참여한 미셸 인 노스웨스턴대 연구원은 "개인적으론 '직업을 바꿔야 한다'거나 '자녀의 전공을 바꿔야 한다'는 판단을 단 하나의 지표에 의존하지는 않을 것"이라고 말했다.

이번 연구 결과는 지난달 미국 전미경제연구소(NBER) 웹사이트에 게재된 작업논문으로 아직 동료 심사는 거치지 않았다.

ys4174@news1.kr