최근 챗GPT(ChatGPT)를 개발한 오픈AI가 기업용 서비스인 챗GPT·위스퍼를 전격 공개했습니다. 오픈AI에 따르면, 기업용 챗GPT·위스퍼는 API(Application Programming Interface) 형태로 기업 고객에게 제공됩니다. 기업용 챗GPT·위스퍼는 기존 챗GPT가 갖고 있는 자연어 처리 및 코딩 작성 외에 다양한 기능을 포함하고 있는데요. 대표적으로 ‘이미지 생성’과 사용 목적에 맞게 모델을 ‘파인튜닝(Fine-tuning, 추가 학습)’하는 기능을 탑재했습니다. 또 그동안 논란이 됐던 인공지능 환각(hallucination, 참인지 거짓인지 모르고 참인 것처럼 답변하는 것)을 방지하고자 사실에 입각한 답변만 할 수 있는 기능도 넣었다고 하는데요. 얼마나 효과가 있을지는 조금 더 지켜봐야 할 것 같습니다.
빠르게 침투하는 기업용 챗GPT·위스퍼
기업용 챗GPT·위스퍼는 매우 빠른 속도로 챗봇 시장에 침투하고 있습니다. 산업의 판도를 바꿀 것이라는 기대를 받고 있는데요. 오픈AI가 뽑은 유스케이스를 살펴보겠습니다.
(1) 스냅챗(Snapchat)은 미국에서 매달 7억 5,000만 명이 사용하고 있는 소셜 미디어입니다. 스냅챗은 기업용 챗GPT·위스퍼를 활용해 나의 인공지능(My AI)을 개발했습니다. 이를 통해 유저에게 친근한 챗봇 서비스를 제공, 사용자 경험을 향상시키겠다는 목표를 갖고 있습니다.
(2) 쇼피파이(Shopify)는 이커머스 툴을 제공하는 캐나다 시총 1위 기업입니다. 엔드 유저(End User, 최종사용자)만 매달 약 1억 명이 넘는 것으로 알려졌습니다. 쇼피파이는 기업용 챗GPT·위스퍼를 활용해 새로운 쇼핑 도우미를 만들었습니다. 채팅을 통해 사용자에게 개인화된 맞춤 상품 등을 제공하는 방식입니다. 쇼피파이는 이를 위해 수백만 개에 달하는 제품을 스캔했고, 기업용 챗GPT·위스퍼는 이를 기반으로 맞춤 추천을 제공합니다.
(3) 퀴즈렛(Quizlet)은 6,000만 명 이상의 학생들이 사용하는 글로벌 학습 플랫폼입니다. 단어 학습, 모의 테스트 등 각종 서비스들은 GPT-3 기반으로 만들었는데요. 이번에는 학습 자료를 기반으로 적응형 질문을 만들었다고 합니다. 학생들을 참여시키는 완전 적응형 인공지능 튜터인 Q-Chat이 대표적인 서비스입니다.
(4) 인스타카트(Instacart)는 장을 대신 봐주는 미국의 앱 서비스입니다. 현재 7만 5,000개 이상의 소매 파트너를 보유하고 있습니다. 인스타카트는 챗GPT를 활용해 ‘인스타카트에 물어봐(Ask Instacart)’라는 서비스를 만들었습니다. “타코를 만들려면 어떻게 해야 하나요?”와 같은 질문을 입력하면 해당 제품을 추천하고 답변해주는 서비스입니다.
기업용 챗GPT·위스퍼, 챗GPT, GPT-3 뭐가 다를까?
GPT-3는 매개변수인 파라미터(Parameter)가 1,750억 개에 달하는 초거대 인공지능(Hyperscale model)인데요. GPT-3와 GPT-3.5, 챗GPT, 기업용 챗GPT·위스퍼의 차이점은 무엇일까요? 짧게 정리하면 이렇습니다. GPT-3는 오픈AI가 만든 초거대 인공지능 브랜드입니다.
스마트폰 브랜드인 애플의 예시로 비교해보겠습니다. 최근 신제품인 아이폰 14에서 가장 고가의 제품은 아이폰 14 프로맥스인데요. 최고급 스마트폰인 아이폰 14 프로맥스는 메모리 용량에 따라 128GB 175만 원부터 1TB 250만 원까지 다양합니다. 최하위 버전인 아이폰 14 역시 128GB는 125만 원 512GB는 170만 원으로 가격차가 있습니다.
오픈AI의 GPT-3역시 마찬가지입니다. GPT-3 역시 다양한 제품군으로 구성돼 있습니다. 인공지능에서 가장 중요한 요소 중 하나는 파라미터인데요. 인간의 두뇌로 치면 정보를 전달하는 시냅스(Synapse)에 해당합니다. 때문에 파라미터가 많다는 뜻은 그만큼 복잡한 일을 자유자재로 처리할 수 있다는 것을 의미합니다.
2020년 5월, 오픈AI는 GPT-3에 대해 다음과 같은 버전을 발표했습니다. 각 버전마다 파라미터 수가 천차만별입니다.
● GPT-3 small: 매개변수 1억 2,500만
● GPT-3 medium: 매개변수 3억 4,500만
● GPT-3 Large: 매개변수 7억 6,000만
● GPT-3 XL: 매개변수 13억(언어 처리 특화)
● GPT-3 2.7B: 매개 변수 27억(스마트폰 테스트용)
● GPT-3 6.7B: 매개변수 67억(제한적 컴퓨터 테스트용)
● GPT-3 13B: 매개변수 130억
● GPT-3 175B: 매개변수 1,750억(다양한 언어 처리 작업 특화용)
또 2022년에는 아래와 같은 버전을 발표했습니다.
● 인스트럭트GPT(InstructGPT): GPT-3 175B 보다 매개변수가 100배 적다고 알려졌는데요. 정확한 파라미터 수는 알려지지 않았습니다. 다만 100배 적다고 했기 때문에 GPT-3 XL일 것으로 추정됩니다. 인스트럭트GPT는 거짓을 사실처럼 인식하는 환각 현상과 편향을 줄인 것이 특징입니다. 2022년 1월에 공개됐습니다.
● GPT-3.5: 더 복잡한 명령어를 이해하는 “text-davinci-003″와 코드를 생성하는 “code-davinci-002″라는 기능을 추가했고, 파이썬 코드 159GB를 추가 학습한 버전입니다. 2022년 3월에 공개됐습니다.
오픈AI는 2022년 11월 말에 그동안 공개하지 않았던 GPT-3 버전들을 발표했습니다. 이것이 바로 우리가 잘 알고 있는 챗GPT입니다.
● 챗GPT: 오픈AI는 챗GPT가 인스트럭트GPT의 형제 버전이라고 밝혔습니다. 여기에 더해 코드 생성 기능을 탑재했으니, 인스트럭트GPT에 GPT-3.5의 장점을 결합한 모델로 추정됩니다. 역시 파라미터 수에 대한 정보는 없었는데요. 다만 일부에서는 GPT-3 small 또는 GPT-3 XL이 동적으로 적용될 것으로 추정하고 있습니다. 트래픽에 따라 1억 2,500만에서 13억 파라미터 모델이 작동되는 구조일 것으로 보입니다.
올해 오픈AI는 잇따라 챗GPT 유료 버전을 출시하고 있습니다. 자연스러운 수순입니다. 2020년 내부 테스트 버전을 발표하고, 2022년 일반 고객을 대상으로 한 베타 서비스인 챗GPT를 출시한 뒤 올해 들어 본격적으로 유료 서비스를 발표하는 것입니다.
● 챗GPT 플러스(plus): 2023년 2월 유료 공개한 버전인데요. 월 구독료는 20달러입니다. 현재는 미국 등 일부 국가에서만 지원됩니다. 기능은 챗GPT와 동일하나, 빠른 접근이 가능하다고 밝힌 것을 보면 GPT-3 2.7B를 제공하는 것 같습니다. 즉, 무료 버전 보다 적게는 2배에서 많게는 10배 이상의 파라미터를 갖고 있는 버전으로 추정됩니다.
● 챗GPT·위스퍼(Whisper) APIs: 2022년 3월에 출시한 기업용 버전입니다. 역시 파라미터 수는 공개하지 않았는데요. GPT-3.5에 비해 10배 저렴한 비용이 발생한다고 알려졌습니다. 때문에 GPT-3 13B를 제공하는 것으로 추정되나, 정확한 것은 알 수 없습니다. 향후 챗봇 시장에 빠르게 침투할 것으로 보이는 버전입니다.
● 챗GPT 프로페셔널(Professional): 오픈 AI는 해당 모델을 곧 출시할 예정이라고 밝혔습니다. 46달러로, 플러스 버전 보다 좋은 모델일 테니 GPT-3 6.7B를 제공하는 것으로 추정됩니다.
챗GPT를 쓰다 보면, 어떤 때는 구동이 잘 되다가 어떤 때는 또 안 되는 것 같은 느낌을 받으셨을 텐데요. 이는 챗GPT 무료 버전이 동적 버전이기 때문입니다. 파라미터 수와 학습 데이터가 적으면 인공 지능 환각 현상이 종종 벌어집니다. 훈련 분포를 벗어난 새 데이터가 들어오면, 비현실적 출력들이 나오는 과적합(Overfitting, 학습 데이터를 과하게 학습하는 것)이 벌어지기 쉽기 때문입니다.
챗봇을 넘어 또 다른 서비스로 진화하는 기업용 챗GPT·위스퍼
기업용 챗GPT·위스퍼 서비스는 챗봇 시장을 빠르게 바꿀 것으로 보입니다. 글로벌 시장조사 기관인 프리시던스리서치(Precedence Research)에 따르면, 전 세계 챗봇 시장 규모는 2022년 8억 4,000만 달러에서 2032년 49억 달러로 연평균 19.2%씩 성장할 것으로 보입니다. 현재 챗GPT 사용자 중 51%는 대기업이라고 하는데요. 용도로 따지면 마케팅이 56%로 가장 큽니다. 또 업종별로는 이커머스가 21%로 가장 크고요. 앞으로 챗GPT 기업 서비스는 대기업 중심의 마케팅 이커머스 시장에 속속 침투할 것으로 보입니다. GPT-3.5의 성능이 막강하다 보니 실리콘밸리에서는 조만간 GPT-4가 나올 것이라는 소문도 있습니다. 파라미터 수가 100조 개에 달해, 인간 시냅스 100조 개에 버금가는 능력을 지닐 것으로 추정하고 있습니다.
다만, 오픈AI의 공동창업자 샘 알트만은 2022년 9월 한 팟캐스트에 출연해 가까운 미래에는 멀티모달(Multi-Modal)이 장착된 인공지능이 출연할 것이라고 전망했습니다. 멀티모달은 시각, 청각 등 인간의 오감처럼 다양한 인터페이스를 통해 여러 정보를 전달받아 학습하는 인공지능을 뜻하는데요. 오픈AI가 다음 버전으로 멀티모달 기능이 장착된 인공지능을 내놓을 경우, 음성 비서나 스트리밍 서비스 등으로 영역이 확대될 가능성이 있습니다. 현재는 시장 태동 단계라 섣부른 전망은 조심스럽지만, 커다란 변화의 물결이 시작된 것은 확실합니다.
글 ㅣ 이상덕 ㅣ 매일경제 실리콘밸리 특파원