지난 레터에서는 생성형 AI에 대해 다뤘는데요. 생성형 AI의 기반이 바로 대규모 언어 모델, LLM(Large language model)입니다. LLM은 2020년 오픈AI에서 만든 GPT-3가 1,750억 개의 파라미터를 갖고 있다고 해서 붙여진 이름입니다. 이후 ChatGPT(GPT3.5)가 발표되자 그 혁신적인 기능에 사람들이 주목하기 시작했고, 이에 ChatGPT와 같은 유형의 대규모 언어 모델을 ‘LLM’으로 지칭하게 되었습니다.1)
최근 LLM을 개발, 공개하고 있는 빅테크 기업은 LLM이 다른 기술, 서비스 등과 결합해 비즈니스나 일상에서 ‘활용’될 수 있도록 고민하고 있습니다.
앞으로 빅테크 기업은 LLM을 통해 어떤 파급효과를 일으킬까요? 일상에 LLM이 녹아든다면 우리가 생각해 봐야 할 지점은 무엇일까요? 오늘 레터에서는 LLM과 관련된 거의 모든 것에 대해 다뤄보겠습니다.
지난 몇 년간 다양한 LLM이 공개됐습니다. LLM은 출시하는 기업마다 성능과 특성이 다릅니다. 국내 기업의 LLM으로는 네이버의 HyperCLOVA X, 카카오의 KoGPT, SKT의 A., LG의 EXAONE 등이 있습니다. 기업이 각자 다른 LLM을 내세운 만큼 연계된 서비스도 달랐습니다.
HyperCLOVA X는 ChatGPT 대비 한국어를 6,500배 더 많이 학습하여 한국어 문제 해결에 강점이 있고, B2C 서비스를 기반으로 유행한 ChatGPT와 달리 B2B 서비스를 중심으로 시장 진입을 하였습니다.
카카오도 네이버와 마찬가지로 한국어 특화 AI 언어모델인 koGPT를 내세웠고, ‘이미지’ 생성을 경쟁력으로 삼아 카카오브레인의 AI 서비스인 Karlo와 연계하여 1,400만 장의 텍스트와 이미지 쌍을 사전학습시켜, 텍스트 명령어를 입력하면 실시간으로 이미지를 생성하는 minDALL-E를 공개하기도 했습니다.
LG의 초거대 AI EXAONE은 전문가에게 더 높은 전문가 역량을 제공하는 Expert AI를 지향하고 있습니다. LG 그룹의 파트너십을 통해 확보한 특허, 논문 등의 전문 문헌 등을 학습하여 신약, 신소재 개발 능력까지 갖춘 전문가용 AI인 것이 특징입니다. 데이터 보안 및 커스터마이징 기반 On-Premise와 On-device를 지원하는 EXAONE은 양질의 데이터 신뢰성을 확보하여 산업별로 특화된 기능을 구현합니다. 뿐만 아니라 전문 문헌을 스스로 학습하여 적정 규모 모델, 추론 최적화 등 전문가 연구보조를 위한 서비스도 제공하고 있죠. SKT는 통신 회사의 특성을 살려 A.을 통해 오래전에 대화했던 내용 중 중요한 정보를 기억하는 ‘장기기억’ 기술을 활용했죠. 이미지 리트리벌 기술을 적용해 10억 장의 ‘이미지-한글 텍스트 쌍’ 학습 데이터를 구축하기도 했고요.
현재 LLM은 뜻이 미묘한 단어, 뉘앙스도 이해하는 수준에 이르렀다고 평가받습니다. LLM이 대규모 언어 데이터를 학습해 문장 구조나 문법, 의미, 단어에 내재된 다른 의미를 이해하고 새롭게 어휘를 조합해서 문장을 생성하고 있으니까요. 이러한 역량은 LLM이 단독으로 이뤄낸 것은 아닙니다. 자연어 처리(NLP) 기술이 발전했기 때문에 가능했습니다. 쉽게 말해, LLM이 방대한 양의 데이터로 잘 훈련된 AI 모델이라면, 자연어 처리(NLP) 기술은 인간과 상호작용을 할 수 있도록 모델에 기름칠한 셈이죠. NLP는 ‘자연어 이해(NLU)’와 ‘자연어 생성(NLG)’, 크게 두 가지에 초점을 두는데요. 인공어와 달리, 우리가 일상적으로 쓰는 언어(자연어)를 이해하고 우리의 일상 언어로 텍스트를 생성하는 데까지의 역할을 한답니다.
시장조사 전문 기관인 Valuates Reports가 발표한 ‘전 세계 LLM 시장 보고서’에 따르면 LLM 시장 규모는 2022년에 105억 달러(한화 약 13조 9,169억 원)였다고 하는데요. 연평균 21.4%로 성장하여 2029년에는 시장 규모가 408억 달러(한화 약 53조 7,050억 원)에 이를 것으로 전망했습니다.2) 기본적인 언어 능력을 갖췄으니, 활용할 영역이 무궁무진하게 늘어나는 것입니다.
현재 LLM은 미국 기업을 필두로 멀티모달(Multi Modal) 생태계에 진입했습니다. LLM의 언어 역량을 기반으로 한 다양한 변환 능력이 막 주목받기 시작한 것인데요. 멀티모달은 텍스트로 묻고 텍스트로 답하는 것을 넘어서, 이미지, 음성, 영상 등의 데이터를 인식해서 결과물을 내놓는 것을 말합니다. 결과물도 마찬가지로 영상이나 이미지가 될 수 있습니다.
최근 Google이 내놓은 차세대 LLM ‘Gemini 1.5 Pro’는 한 시간 분량의 영상 등 방대한 정보를 입력하면 한 번에 텍스트로 요약하는 능력을 갖췄습니다. OpenAI는 ‘Sora’를 통해 텍스트나 이미지 기반의 영상을 생성하는 멀티모달 LLM을 공개했고요. Meta는 텍스트나 참조 이미지를 입력하면 비디오를 생성하는 ‘Emu Video’를 공개했습니다.3)
OpenAI의 대항마로 불리는 기업이자, OpenAI 출신 연구자들이 설립한 Anthropic은 사진, 차트, 그래프, 기술 다이어그램을 처리하는 ‘Claude 3’를 내놨습니다. OpenAI의 ‘Sora’와 같은 이미지 생성 기능은 없지만, 한 번에 최대 20개까지 여러 이미지를 분석할 수 있는 능력이 있어요.4) Google은 이 Anthropic에 4억 달러(약 5,000억 원)를 투자했습니다.5)
Anthropic의 'Claude 3' 출시에 대해 OpenAI는 GPT-5를 준비 중이라고 답했습니다. 샘 올트먼 OpenAI CEO는 “GPT-5는 말하기, 이미지, 코딩, 비디오를 아우르는 완벽한 멀티 모달이 될 것”이라고 언급했습니다.
이렇게 대형언어모델뿐 아니라, sLLM(소형언어모델) 출시 경쟁도 치열합니다. sLLM은 LLM과 비교해 파라미터(매개변수)가 적은 언어모델을 말합니다. 따라서 훈련이나 운영 비용이 적은 장점이 있어요. 오픈소스로 공개해 누구나 사용할 수 있고요. 얼마 전 멀티 모달 이미지 생성 AI 모델 개발과 배포 분야에서 혁신적이라고 일컬어지는 미국의 AI 스타트업, Stability AI가 sLLM인 ‘Stable LM2 1.6B’를 출시했습니다. 16억 개 매개변수의 기본 모델로 인스트럭션 튜닝(특정 지시에 근거해 튜닝)을 했고요. 오픈 커뮤니티의 특성을 살려 성능이 비슷한 모델을 재현할 수 있도록 데이터 세부 정보도 함께 제공합니다.
그 밖에 스탠퍼드대학교의 연구진은 ‘Alpaca’, Databricks는 ‘Dolly’, Got It AI는 ‘ELMAR’ 등을 출시했는데요. 빅테크 기업은 B2B를 겨냥해 자본과 기술력을 바탕으로 고도화된 모델들을 내놓은 반면, sLLM은 빅테크 기업이 개발한 LLM처럼 크고 강력한 모델은 아니지만, 오픈소스를 활용해 누구나 제품이나 기술을 만들 수 있도록 만들어 대중성을 잡은 모델이라고 할 수 있습니다. 모든 분야를 아우르진 못하지만, 특정 분야 전용으로 쓰일 수 있도록 한 것이고요. 스타트업 입장에서 개발하기에 더 적절하죠.
LLM의 전망은 밝아 보입니다. 이전의 질의응답 기능은 초보 단계에 불과했다는 이야기가 나올 정도로 그 능력이 빠르게 발전하고 있습니다. 앞으로는 기업과 비즈니스, 도메인에 최적화된 LLM을 만드는 것이 중요해질 거예요. LLM이 컴퓨터와 휴대폰에 쓰이는 걸 넘어서, 어떤 디바이스에 담기는지에 따라 새로운 생태계가 형성되고 또 다른 시너지를 낼 수 있으니까요.
산업 현장에서는 LLM의 크기나 성능이 압도적으로 중요할 겁니다. 더 많은 데이터를 분석할수록 더 정확하고 고도화된 제품을 만들 수 있으니까요. 그러니 풍부한 데이터셋은 필수이고, 다양한 답변 중 선택하도록 LLM을 돕는 매개변수도 많을수록 좋겠죠. 하지만 일상생활에서 사용하는 LLM이라면 이야기가 달라질 수 있습니다. 앞으로는 ‘온디바이스 AI’ 형태로 디바이스와 에지 컴퓨팅에서 LLM을 구동하려고 할 거예요. 온디바이스 시스템에선 자체 하드웨어를 활용해 작업을 처리하기 때문에 LLM은 메모리 한계가 있죠. 따라서 앞으로 경량화하면서도 사용자에게 필요한 부분에만 특화하는 것이 필요할 거예요. 모든 기업이 전체 영역을 아우르는 보편적인 LLM을 개발하기보다는, 강점이 있는 버티컬 영역에서 승부를 보기도 할 것입니다. 그러니 LLM은 앞으로 그 목적과 쓰임에 따라 다양하게 변화하겠죠.
최근 기업들은 ‘전문 분야 특화 LLM’ 출시를 선언하고 있어요. 서비스의 차별화를 주면서, 특화 LLM으로 LLM 안에서도 틈새시장을 찾는 것입니다. 아시아 최초로 법률 전문 LLM을 만든 Intellicon은 법률에 최적화한 알고리즘으로 ‘LawGPT’를 개발했습니다. 법률 문제를 이해하기 쉽도록 풀어주고, 관련 법률 조항과 판례를 제공하죠.6)
비영리 단체인 EleutherAI는 그간 LLM의 약점으로 지적된 수학 문제를 해결하기 위해 수학 특화 LLM ‘LLeMA’를 출시하기도 했죠. 그 밖에 SKT를 비롯한 독일 Deutsche Telekom, 싱가포르 SingTel Group 등 통신사들은 합작법인 계약을 맺고 통신 산업에 특화된 다국어 LLM 개발 계획을 내놓기도 했어요.
더 나아가 LLM을 각각 사용하는 것이 아니라, 복수의 LLM이 협력하고, 스스로 생각하는 ‘멀티 에이전트’ 시대에 대한 기대도 있습니다. 멀티 에이전트는 다양한 능력을 보유합니다. 그중 인상 깊은 논의 중 하나는 LLM이 서로 대화하고, 협업하여 제품을 개발하는 ‘챗 체인(Chat Chain)입니다. 사람이 협력하여 일을 도모하듯, LLM도 서로 소통하고 역할을 분담하여 결과를 내는 방식으로 가는 것이죠.7) 명령어를 하나하나 입력할 필요 없이, ‘알아서’ 돕는 멀티 에이전트 프레임워크가 적용된다면, 앞으로 일이 훨씬 편해지지 않을까요?
LLM의 발전과 쓰임새는 상당히 기대가 되지만, 우리가 상상하고 현실화하려는 LLM을 구현하기까지 몇 가지 허들이 있습니다.
먼저, LLM을 위한 하드웨어가 부족한 현상인데요. 최근 AI 반도체 공급 부족 현상으로 IT기업과 스타트업이 골머리를 앓고 있습니다. AI 반도체 점유율이 97%에 달하는 NVIDIA는 차세대 AI 반도체인 L40과 L4를 시장에 풀지 않고 일부 미국 빅테크 클라우드 업체와 파트너사에게만 공급했죠. 수요가 폭발적으로 늘어 그런 것이지만, 다른 입장에서 보면 하드웨어 인프라를 구하기 어려워 개발에 차질을 빚을 수 있는 상황입니다.
또한 여러 가지 보안 문제도 있습니다. 접근 권한을 적절히 설정하지 않아 프롬프트를 통해 보안을 침해당하는 문제가 있습니다. 또는 LLM에 의존해 만든 보안 보고서나 자료로 인해 잘못된 보안 결정을 내릴 수도 있죠. 공격자가 학습 데이터 중독을 통해 LLM의 학습 데이터나 미세 조정 절차를 조작할 수도 있습니다.
LG CNS는 데이터의 외부 유출에 민감한 기업을 위해 고객 기업의 자체 인프라를 활용해 소스코드나 개인정보 유출을 방지할 수 있는 자체 LLM을 개발했습니다.8) 기존 시스템에 부가 기능을 추가하는 플러그인 방식으로 연결되기 때문에 소스코드, 개인 정보 유출에 대한 부담을 덜 수 있습니다. 특히 기업이 LLM을 사용할 때 보안 문제만큼은 꼭 해결해야 할 텐데요. 이에 대한 자세한 내용은 다음 레터에서도 다뤄보겠습니다.
🤔4월 에브릿띵에서 다양한 LLM의 종류와 전망, 그리고 안전한 LLM을 사용하기 위한 주의점까지 알아봤습니다. 앞으로 LLM은 스스로 작동하고 연동하는, 마치 살아 숨 쉬는 듯한 시스템이 될 텐데요. LLM이 계속해서 발전하면서, 우리가 예측하지 못한 문제도 함께 생길 겁니다. LLM이 좋은 시스템으로 자리 잡을 수 있도록 긍정적인 사용처와 활용 방식, 그리고 다양한 문제 해결 방법을 앞서 고민해야겠습니다.
1) ChatGPT의 파급효과와 기관의 LLM 도입 전략, 한국지능정보사회진흥원
2) AI 활용 확대로 광폭 성장하는 '대규모 언어 모델 LLM', GTT KOREA
3) 텍스트 입력 → 동영상 생성… AI전쟁, 이젠 ‘멀티’ 싸움, 동아일보
4) ‘오픈AI 대항마’ 앤스로픽, 새모델 공개, 매일경제
5) 챗GPT에 대항할 엔스로픽에 4억달러 투자, 서울파이낸스
6) 인텔리콘, 아시아 최초 법률전문 생성형AI 출시, 전자신문
7) LLM끼리 협업, ‘멀티 에이전트’ 시대 활짝?, 애플경제
8) LG CNS, 코드 생성형 AI에 최적화된 LLM 개발…보안성 강화, 아시아경제
기업명을 두 글자 이상 입력해주세요.
소식을 받아 보시려면 마케팅 정보 활용과 마케팅 정보 수신에 모두 동의해 주셔야 합니다.
제출이 완료되었습니다.
제출이 완료되었습니다.
확인 버튼을 누르시면 자사 홈페이지 홈화면으로 이동됩니다.
요청하신 자료가 이메일로 발송되었습니다.
구독 설정이 저장되었습니다.
잘못된 접근입니다. 정상적인 경로를 통해 다시 시도해 주세요.
검색 중 오류가 발생했습니다. 다시 시도해주세요.
제출에 실패하였습니다.
다시 시도해주세요.
사업자등록번호는 10자리를 입력해주세요.