검색 본문 바로가기 회사정보 바로가기

일론 머스크·MS 투자한 AI…말귀 알아듣고 일 '척척'

3천억개의 데이터와 1750억개 변수로 학습…다양한 응용가능
연말께 상용 정식 공개…"오용 대응위해 API형식"

(서울=뉴스1) 김승준 기자 | 2020-09-11 06:00 송고 | 2020-09-17 10:41 최종수정
© News1 DB
© News1 DB

"내가 읽고 있는 기사가 인공지능이 만들어낸 가짜 기사라면?"

앞으로 이 고민을 해야할 날이 멀지 않았다. 일론 머스크가 설립에 참여하고, 마이크로소프트가 10억 달러를 투자한 미국의 비영리연구소 오픈AI(OpenAI) 때문이다.
오픈AI는 6월 GPT-3라는 인공지능을 공개했다. 이 인공지능은 사람과 구분이 안되는 기사를 쓰고, 다양한 용도로 응용할 수 있어 많은 이들의 관심을 끌고 있다.

GPT-3는 '자연어 처리' 인공지능이다. 사람의 자연스로운 말을 입력받아 사람처럼 문장을 만들어내는 프로그램이다. 사람은 의미를 중심으로 이해하고 문장을 만들지만, 자연어 처리 인공지능은 문장을 주면 다음에 올 단어를 예측하고, 그 단어를 가지고 다음 단어를 예측해 그럴듯한 문장을 만들어낸다. 이러한 예측력은 한 사람이 평생을 걸쳐 읽어도 시간이 모자랄 분량의 글을 학습해 만들어진다. 그래서 개발자들은 인공지능이 글을 쓴다고 표현하지 않고 글을 '합성' 혹은 '생성'했다고 표현하는 경우가 많다.

◇3천억 데이터·1750억 변수로 학습…'찰떡같이 알아듣고 알아서 척척'

GPT-3는 공개 언어 데이터를 이용해 만들어진 약 3000억개의 데이터(토큰)으로 사전훈련을 받았다. 내부연산에는 1750억개의 매개변수를 사용한다.
개발진은 매개변수가 다른 모델로 연구한 결과 미세 조정없이도 인공지능의 성능(정확도)를 높일 수 있다는 것을 증명해냈다. 미세 조정이 없으면 하나의 인공지능 시스템을 다양한 분야에 활용할 수 있다.

기존 인공지능은 특정한 분야에 쓰이기 위해 미세 조정(fine tuning)을 거친다. 예를 들어 '정의'라는 단어가 있을 때 상황에 따라서 '용어의 뜻'을 의미할 수도 있고, '진리에 맞는 올바른 도리'일 수도 있다. 이를 구분하기 위해 용도에 따라 가중치가 다르게 표시된 데이터로 '가중치 조정'을 거친다. 문제는 미세조정에는 분야별로 대규모 데이터 세트가 필요한 것.

상황과 분야에 따라서 이러한 데이터가 없을 수도 있다. 또 한 분야에 전문화된 인공지능은 그 분야를 벗어나면 엉뚱한 답을 내놓기도 한다. 사람의 말을 척척 알아들어 여러 일을 해내는 인공지능을 개발하기는 어렵다.

개발진은 이러한 한계를 매개변수의 양과 자체 알고리즘으로 돌파할 수 있다는 가능성을 보여줬다. GPT-3는 1750억개의 매개 변수를 통해서 연구진이 '샷'(Shot)이라고 표현한 추가 학습을 통해 정확도를 높인다. 이 샷은 미세조정과는 다른 문맥 학습방법이다.

미세조정 없이 정확도를 높이고 여러군데에 쓸 수 있다는 점 때문에 인공지능 학계의 눈길을 끌었다. GPT-3는 "한국어를 영어로 번역해줘, 그런데 사과는 apple"이야 같이 사례를 함께 넣어주면 가중치 조절없이 문맥을 파악하고 그에 맞는 답을 내놓는 것이다. 말 그대로 하나를 알려주면 열을 척척해내는 것이다.

매개변수가 많을 수록 정확도가 높다 (OpenAI가 공개한
매개변수가 많을 수록 정확도가 높다 (OpenAI가 공개한 "Language Models are Few-Shot Learners" 논문 갈무리) 2020.09.09 /뉴스1

◇사람·인공지능 기사 누가 썻는지 구분 안되는 수준 도달

개발진은 GPT-3의 성능을 시험하기 위해 실험을 했다. 일단 3개의 뉴스 기사를 인공지능에게 준다음 '뉴스'라는 맥락에서 일을 하는 것이라고 알려줬다. 사람이 쓴 기사를 고르고, 제목과 부제목을 인공지능에 입력시키고 기사를 합성했다. 그리고 원본 기사와 인공지능 합성기사를 80여명의 사람에게 보여주고 "사람이 쓴 것 같다"·"기계보다는 사람이 쓴 것같다"·"잘 모르겠다"·"사람보다는 기계가 쓴거 같다"·"기계가 쓴 것 같다"로 답하도록했다.

인공지능의 매개변수가 늘어날수록 사람들은 사람과 기계 중 누가 썼는지 구분하지 못했는데, 500단어 이하의 기사에서는 GPT-3 175B에서는 평균 절반의 사람이 구분에 성공했다. 무작위로 찍어서 맞출 확률이 50%이므로 사실상 인공지능과 사람의 기사가 구분되지 않는 것이다.

◇현재 베타 테스트 중 연내 상용화 예정…"오용 대응위해 API형식 공개"

오픈AI는 GPT-3를 API형태로 개발자와 관련 학계에 정식 출시전 베타테스트로 공개하고 있다. 테스트 참가자들은 이를 이용해 재무재표 작성, 그림그리기, 프로그램 코드 작성까지 다양한 응용법을 개발해 공개하고 있다. 오픈AI는 2020년내 유료 공개할 목표로 베타테스트를 진행하는 것으로 알려져있다. 공개형식은 API로 사용량에 따라 비용이 결정되는 방식이다.

오픈AI 측은 API형식 공개에 대해 "API형식으로 공개하면 상대적으로 저렴한 비용으로 소규모 기업까지 인공지능 기술에 접근할 수 있다"며 "사람들이 어떻게 응용할 지 예측하기 어려운데 (GPT-3를) 오용했을 경우 접속을 제한하는 등 대응하기 쉽다"고 밝힌바 있다.

이들은 논문을 통해서도 인종·성·젠더에 대한 인공지능의 편향성 위험부터, 가짜 뉴스·정보를 이용한 범죄까지 악영향이 있을 수 있다고 명시했다.


seungjun241@news1.kr

이런 일&저런 일

    더보기