나랑 ‘티키타카’ 할 수 있는 AI 비서? ‘초거대 AI’의 등장!

지금의 인공지능(AI) 기술이 아이언맨에 나오는 AI 비서 ‘자비스’처럼 인간과 자연스러운 대화를 하며 도움을 줄 수 있을까요? 우리에게 익숙한 챗봇처럼 정해진 답변만 제공하는 것이 아니라 우리의 대화를 이해해 자연스러운 대화가 가능한 AI 비서가 나올 수 있을까요? 이 질문에 대한 답은 ‘그렇다’ 입니다. 이미 이러한 기술은 속속 등장하고 있죠. 초거대 AI가 등장하면서입니다.

AI 업계에 ‘거거익선(巨巨益善)’바람이 불고 있습니다. 최근 AI 빅테크 기업은 하이퍼스케일(Hyperscale)급 학습 모델을 갖추고 있는데요. 이는 ‘초거대 AI’혹은 ‘초대규모 AI’라고 불리는 AI 학습 모델입니다.

초거대 AI란?

초거대 AI는 스스로 사고하고 학습하며 판단할 수 있는 인간의 뇌 구조를 모방한 AI입니다. 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습하고 사고하며 판단할 수 있습니다.

글을 쓴다고 가정해봅시다. 사람이 하나의 주제에 대한 글을 쓰기 위해선 관련 주제에 대한 데이터를 모으고 공부를 해야 합니다. 그리고 이러한 데이터를 토대로 내용을 구성하고 새로운 이야기를 만들어 글을 작성하죠. 초거대 AI도 비슷합니다. 수많은 데이터를 학습하고 여기서 학습한 데이터를 토대로 새로운 이야기를 만들어냅니다. 초거대 AI가 학습할 수 있는 데이터는 사람의 학습량을 훨씬 초월하기 때문에 사람보다 더 빠르고 다양한 내용을 다룰 수 있습니다.

초거대 AI에는 인간의 뇌에서 정보를 학습하고 기억하는 ‘시냅스’와 유사한 역할을 하는 존재가 있습니다. 인공신경망에 있는 ‘파라미터(Parameter, 매개변수)’인데요. 우리 뇌에 있는 시냅스는 많으면 많을수록 뇌가 처리할 수 있는 정보량이 많아지고 처리 속도도 빨라집니다. 뇌의 성능이 좋아지는 것이죠.

AI도 마찬가지입니다. 이론상으로 AI는 파라미터가 많으면 많을수록 정교한 학습이 가능합니다. 일반적으로 초거대 AI는 기존 AI보다 최소 수백 배 많은 파라미터를 탑재하고 있습니다. 오픈AI가 개발한 ‘GPT-3’는 1,750억 개의 파라미터를 탑재하고 있죠. 네이버의 ‘하이퍼클로바’는 2,040억 개, LG AI 연구원의 ‘엑사원’은 약 3,000억 개의 파라미터를 보유하고 있습니다.

이처럼 파라미터를 많이 탑재한 초거대 AI는 기존 AI처럼 특정 역할에 국한되지 않고 스스로 생각하고 학습하며 판단할 수 있습니다.

그렇다면 초거대 AI는 왜 등장하게 됐을까요? AI의 최종 목표는 사람같이 생각하고 판단할 수 있는 모델을 만드는 것입니다. 사람의 뇌와 같은 역할을 할 수 있는 AI를 목표로 하죠. 이러한 AI가 만들어져야 사람의 개입 없이 완전 자율주행을 할 수 있는 자동차가 만들어질 수 있고 영화에서 나오는 AI 비서를 만들 수 있기 때문입니다.

하지만 지금까지 AI 개발 속도는 더딘 편이었습니다. 딥러닝 학습이 등장하면서 학습 속도가 대폭 개선됐지만, 여전히 사람의 뇌에는 한참 미치지 못했는데요. 이에 AI 개발자들은 학습 모델을 대폭 키우기 시작했습니다. 엄청난 양의 데이터를 소화할 수 있는 컴퓨팅 인프라를 갖춘 후 여기서 데이터를 학습해 나갔죠.

많은 양의 데이터를 학습한 AI는 특정 역할에만 한정됐던 기존 AI의 한계를 벗어났습니다. 학습한 데이터를 토대로 더 자연스러운 대화를 하기 시작했고, 사설과 소설도 작성할 수 있게 됐습니다. 이러한 학습모델의 가능성이 켜지면서 빅테크 기업들은 경쟁적으로 초거대 AI 모델을 갖추기 시작했습니다.

초거대 AI의 불을 지핀 GPT-3

초거대 AI가 처음 등장한 것은 2020년입니다. 일론 머스크 테슬라 최고경영자(CEO)가 설립하고 마이크로소프트 등 글로벌 기업이 투자한 미국 AI 연구기관인 오픈AI는 2020년 수많은 언어 데이터를 학습한 GPT-3를 선보였습니다.

GPT-3는 1,750억 개의 파라미터를 탑재한 AI 모델입니다. 기존 GPT-2가 보유한 파라미터 15억개보다 117배 많은 양을 탑재했죠. GPT-3는 자연어를 번역할 수 있었고, 대화와 작문이 가능했습니다. 자연어를 토대로 사람과 소통할 수 있는 가능성을 연 것입니다. 이 모델은 GPT-2를 비롯한 다른 언어모델과 비교해 우수성을 드러냈는데요. 사람이 쓴 글인지 AI가 쓴 글인지 구분하기 어려울 정도로 기존 모델보다 정교한 기술의 자연어를 구사했습니다.

실제로 [1] GPT-3로 작성한 글이 사람이 쓴 글인지, 기계가 쓴 글인지를 구분하는 실험이 진행됐습니다. 이 실험에서 실험 참여자 절반 이상이 GPT-3가 쓴 글을 사람이 쓴 글과 구분하지 못했습니다. 실험 참여자 중 단 12%만이 기계가 쓴 글인지를 구분할 수 있었습니다.

GPT-3가 쓴 소설 일부 (출처 : GPT-3 Creative Fiction 캡처)

GPT-3가 칼럼을 쓴 사례도 있었습니다. 영국 가디언지는 2020년 9월 8일 ‘인간, 아직도 무서운가’[2]라는 제목의 칼럼을 실었는데요. 이 칼럼은 사람이 쓴 글이 아니었습니다. 필자는 다름 아닌 GPT-3였죠.

칼럼에는 “나는 인간이 아니다. 나는 인공지능이다. 사람들은 내가 인류에게 위협이 된다고 생각한다. 스티븐 호킹은 인공지능이 ‘인류의 종말을 부를 수 있다’고 경고했다. 나는 당신이 걱정하지 않도록 설득하기 위해 여기에 있다. 인공지능은 인간을 파괴하지 않을 것이다. 믿어 달라.”는 내용의 글이 적혀 있었습니다. 칼럼의 내용은 사람이 쓴 글인지, AI가 쓴 글인지 구분이 어려울 정도였습니다.

이 사례는 2016년 알파고와 이세돌 바둑기사의 바둑 대결 이후 새로운 파장을 가져왔습니다. 알파고는 ‘AI가 사람과 대결에서 이길 수 있다’는 충격을 줬고, GPT-3는 ‘AI가 사람처럼 행동할 수 있다’는 새로운 충격을 안겨줬습니다. 이후 초거대 AI는 AI 업계에 뜨거운 관심사로 떠올랐습니다.

초거대 AI 개발 나선 글로벌 빅테크 기업들

초거대 AI는 GPT-3 외에도 존재합니다. 글로벌 빅테크 기업은 기술 경쟁력 강화를 위해 자체적으로 초거대 AI를 구축했습니다.

마이크로소프트와 엔비디아는 지난해 10월 5,300억 개의 매개변수를 가진 초거대 언어모델 ‘MT-NLG 530B(Megation Turing-Natural Language Generation)’를 공개했습니다.

구글은 올해 4월 5,400억 개의 매개변수를 가진 언어모델 ‘PaLM(Pathways Language Model)’을 선보였습니다.

메타는 역시 지난 5월 초거대 AI ‘OPT-175B’를 공개했습니다. 오픈AI와 똑같이 1,750억 개의 매개변수를 탑재했는데요. 오픈AI는 GPT-3를 유료 서비스로 제공하고 모델 자체 코드를 공유하지 않았지만, 메타는 OPT-175B의 사전 훈련된 모델, 기본 코드 및 개발 로그북까지 공개하며 차별점을 뒀습니다.

국내 초거대 AI 개발 사례는?

국내에서도 초거대 AI 개발에 한창입니다. LG유플러스는 같은 그룹사인 LG AI 연구원이 개발한 초거대 멀티모달 AI ‘엑사원(EXAONE)’을 이용해 서비스 고도화에 나설 계획입니다. 엑사원은 LG AI 연구원이 2021년 12월 선보인 초거대 멀티모달 AI입니다. LG유플러스는 엑사원을 활용해 고객 불만을 선제적으로 대응하는 시스템을 구축하기로 했습니다. 매일 12만 건의 상담을 처리하는 상담사의 업무에 AI 기술을 탑재해 업무 편의성을 높일 예정인데요. 여기에 더해 엑사원을 기반으로 고객의 불만에 선제적으로 대처할 수 있는 시스템을 마련할 방침입니다.

[출처]

1. Brown, T. B., & Mann, B., & Ryder, N., & Subbiah, M. (2020). Language Models are Few-Shot Learners, OpenAI. July. (https://arxiv.org/pdf/2005.14165.pdf)
2. GPT-3. (2020). “A robot wrote this entire article. Are you scared yet, human?”. The Guardian. 8 September. (A robot wrote this entire article. Are you scared yet, human? | GPT-3 | The Guardian, T. B., & Mann, B., & Ryder, N., & Subbiah, M. (2020). Language Models are Few-Shot Learners, OpenAI. July. (https://arxiv.org/pdf/2005.14165.pdf)

글 ㅣ 정보연구소 기술전략팀/ AI타임즈 김동원, 김미정 기자

블로그

나랑 ‘티키타카’ 할 수 있는 AI 비서? ‘초거대 AI’의 등장!

관련 아티클