“웹은 사회적인 창조물에 가깝다. 웹의 힘은 모든 사람이 접근할 수 있는 그 보편성에 있다.”
월드와이드웹(WWW, World Wide Web, 인터넷을 통해 접근 가능한 공용 웹 페이지의 상호연결 시스템)을 창시한 ‘웹의 아버지’ 팀 버너스리(Sir Timothy John Berners-Lee)는 웹 3.0을 플랫폼이 아닌 ‘개인이 소유한 인터넷’으로 규정한 바 있습니다. 웹3 시대에는 피트니스 정보에서 쇼핑 패턴까지 모든 데이터를 ‘나만의 스토리지’에 저장하고, ‘나만의 인공지능(AI)’을 활용해 ‘나만의 삶’을 누릴 수 있을 것이라 본 것인데요. AI와 함께 대규모 언어 모델(LLM, Large Language Model)이 등장하면서 우리는 이러한 미래 인터넷의 가능성을 미리 엿볼 수 있었습니다. 인터넷 포털 검색이 아닌, 챗봇을 통해 문답을 주고받고, 자신만의 데이터를 활용해 나만을 위한 업무를 할 수 있게 된 것입니다.
온디바이스 AI가 주목받는 이유
AI 시대가 본격화되며 ‘온디바이스 AI’가 주목받고 있습니다. 간단한 AI는 디바이스와 에지 컴퓨팅에서 구동 시키려는 움직임이 나타나고 있는 건데요. 서버 기반의 AI는 막대한 전력을 소모하기 때문입니다. 오늘날 데이터센터는 전 세계 전력 사용량의 1~1.5%를 차지고 있는데요. 이에 전문가들은 향후 AI가 클라우드 / 에지 컴퓨팅 / 디바이스 3개 축으로 분화될 것으로 내다보고 있습니다. 그동안 AI가 클라우드 중심이었다면 이제는 하이브리드 AI로의 전환점을 맞이하고 있는 것이지요.
생태계를 확산시켜라! 빅테크 기업의 온디바이스 AI 전략
온디바이스 AI는 디바이스 자체 하드웨어를 활용해 AI 작업을 처리합니다. 이는 개별 디바이스에 가속기를 장착해 AI 모델을 더욱 효율적으로 구동시킬 수 있습니다. 또, 기존에는 클라우드 기반 AI에서 그래픽 처리 장치인 GPU(Graphics Processing Unit)가 중요했다면, 온디바이스 AI에서는 인공신경망인 NPU(Neural network Processing Unit) 칩이 중요합니다. NPU 칩을 활용하면 서버와 통신 없이 소모 전력을 적게 들이며 AI를 이용할 수 있기 때문입니다. 온디바이스 AI 생태계 확산을 위해 빅테크 기업들은 어떤 전략을 구사하고 있을까요?
• 구글
구글은 차세대 생성형 AI인 ‘제미나이(Gemini)’ 나노 모델을 스마트폰 픽셀8 프로에 탑재했습니다. 사용자의 민감한 데이터가 휴대폰을 벗어나지 않게 보호하고, 네트워크 연결 없이도 AI 기능을 사용할 수 있는데요. 특히 픽셀8 프로에는 ‘녹음 요약’과 ‘지보드(Gboard) 스마트 답장’ 기능이 강화됐습니다. ‘녹음 요약’ 기능은 녹음된 대화나 인터뷰, 발표 등을 요약하고, ‘스마트 답장’은 왓츠 앱 등에서 대화 내용을 자동 인식해 고품질의 응답을 제안합니다. 또한 새로운 AI 기반 도구들을 활용해 사용자에게 보다 더 많은 도움을 제공합니다. 예를 들면, 구글 텐서 G3를 이용해 비디오 색상, 조명 등을 조정하는 ‘비디오 부스트’, AI를 사용해 저조도나 야간에 촬영된 비디오의 선명한 디테일과 색상 제공하는 ‘야간 시야 비디오’와 같은 기능인데요. 구글은 애플의 iOS 생태계 확장에 제동을 걸기 위해 픽셀 스마트폰을 넘어 향후 태블릿, 스마트워치로 대상을 넓힐 예정입니다.
• 마이크로소프트(MS)
마이크로소프트(MS) 역시 AI를 활용해 윈도우 서비스와 검색 엔진 ‘빙(Bing)’ 강화에 나섰습니다. 특히 MS는 2024년 6월 차세대 AI PC ‘서피스 프로(Surface Pro)’ 태블릿과 ‘서피스 랩톱(Surface Laptop)’ 노트북을 출시할 예정입니다. 해당 제품 군은 생성형 AI ‘코파일럿’과 온디바이스 AI를 지원하는 것이 가장 큰 특징인데요. 윈도우 센트럴(Windows Central)에 따르면 서피스 프로 10과 서피스 랩톱 6에는 NPU가 장착됩니다. 윈도우 센트럴은 “130억 개 파라미터 AI 모델을 노트북에서 네트워크 없이 구동할 수 있다”고 설명했습니다. MS가 지난해는 ‘코파일럿’을 중심으로 한 AI 구축에 전력을 다했다면, 2024년에는 하드웨어 영역으로 확장할 것으로 보입니다.
• 애플
애플은 AI 영역에서 오픈소스 개방형 전략을 취하고 있습니다. 2023년 10월 차세대 AI 칩 ’M3’를 공개하며 온디바이스 AI 시대를 예고했는데요. 애플은 “M3 칩에 있는 뉴럴 엔진은 M1 칩보다 최대 60% 더 빠르다”며 “개인정보 보호를 위해 데이터를 개별 장치에 머무르게 하면서 AI와 머신 러닝 작동 흐름을 더욱 빠르게 만든다”고 강조했습니다. 특히 M3는 인간 두뇌에 해당하는 파라미터 수를 최대 수십억 개 지원합니다. IT 업계는 애플이 이를 기반으로 각종 AI 서비스를 구현할 것으로 전망하고 있습니다
애플은 두 편의 논문을 아카이브에 공개하기도 했습니다. 첫 번째 논문은 휴먼 ‘가우시안 스플랫(HUGS, Human Gaussian Splats)’ 기술 사례가 대표적입니다. 동영상에서 배경과 인물을 분리하고 이를 다시 재활용하는 기술인데요. 예를 들어 눈밭을 걸어가는 사람 영상을 학습한 AI가 인물과 배경을 마음대로 조합할 수 있는 것입니다. 두 번째 논문은 ‘제한된 메모리로 효율적인 대규모 언어 모델을 추론하는 법(Efficient Large Language Model Inference with Limited Memory)’입니다. 이는 메모리가 제한된 기기에 LLM을 구축하는 기술입니다. 연구진은 이 방법을 활용해 애플 M1 맥스 CPU(Central Processing Unit, 컴퓨터 시스템을 통제하고 프로그램의 연산을 실행, 처리하는 가장 핵심적인 컴퓨터 제어 장치 혹은 그 기능을 내장한 칩)에서 추론 시간을 4~5배 앞당기고, 속도는 20~25배까지 향상할 수 있다고 설명했습니다.
또한, 깃허브를 통해 M3 칩에서 실행할 수 있는 프레임워크와 모델 라이브러리를 공개했습니다. 바로 MLX라 불리는 AI 개발 툴킷인데요. 애플의 머신 러닝 연구자인 아우니 한눈은 X(구 트위터)를 통해 MLX 데이터를 “데이터 로딩을 위한 프레임워크에 구애 받지 않는 효율적이고 유연한 패키지”라며 “MLX, 파이토치, JAX 프레임워크에서 함께 작동한다”고 설명했습니다. MLX는 파이토치, JAX와 같은 AI 프레임워크에서 영감을 얻은 것으로 보여집니다. 다만 공유 메모리에 대한 내용이 없다는 점에서 애플 반도체를 사용하는 맥북에 적합할 것이라는 평가도 있습니다.
온디바이스 AI 흐름에 응하는 LG
2020년 8월, LG CNS는 온디바이스 AI 솔루션 업체 ‘노타’에 일찌감치 투자했습니다. 노타는 딥 러닝 모델 경량화ᆞ자동화 솔루션인 넷츠프레소(NetsPresso)를 공개한 스타트 업인데요. 넷츠프레소는 성능 저하를 최소화해 스마트폰과 소형 IoT 기기에서 독립적으로 AI를 구동시킬 수 있다는 평가를 받고 있습니다. 최근에는 기업용 AI 서비스를 잇따라 선보이고 있는데요. 대표적으로 기업용 생성형 AI 플랫폼인 ‘DAP GenAI’가 있습니다. DAP GenAI는 기업이 가진 내부 정보만을 활용하고, 다양한 보안 필터 등을 적용해 거짓이나 왜곡된 내용을 생성하는 정보 왜곡현상(Hallucination)을 줄여 업무 효율을 높인 AI입니다. 이를 통해 오픈AI ‘챗GPT’, 엔스로픽의 ‘클로드(Claude), 구글의 ‘팜2(PaLM2), LG AI연구원의 ‘엑사원(EXAONE)’ 등 다양한 LLM을 활용해 서비스를 구축할 수 있습니다. 예를 들어 금융사가 보험상품 추천 AI 서비스를 개발하고 싶다면 고객 정보 데이터베이스를 연동해 알맞은 프롬프트를 구성하며 추천과 답변에 적합한 LLM을 각각 선택해 설정합니다.
2022년 LG전자는 스마트 온디바이스 AI칩인 ‘LG8111’을 개발해 공개했습니다. LG8111은 다양한 AI 가속 하드웨어 내장은 물론 2.4GHz와 5GHz 듀얼 밴드 와이파이를 지원해 인터넷에도 연결할 수 있습니다. 예를 들어 LG8111을 장착한 냉장고는 사용자 음성을 인식해 동작합니다. LG8111은 가전제품뿐만 아니라 스마트카, 스마트팩토리 등 다양한 영역에서 사용 가능합니다.
또한 LG전자는 AI 프로세서를 탑재한 2024년형 LG 그램 신제품 ‘LG 그램 프로’를 런칭할 예정입니다. LG 그램 프로(모델명: 17Z90SP/16Z90SP)에는 차세대 프로세서인 인텔 코어 울트라 CPU가 탑재됐습니다. 인공지능 연산에 특화된 NPU인 AI 부스트가 내장된 CPU인데, 네트워크 연결 없이도 AI를 구동할 수 있다는 장점이 있습니다. 예를 들어 사진을 분석해 인물 장소, 날짜 등 38개 카테고리에 따라 자동으로 분류해 낼 수 있습니다. 또한 제품에 탑재된 ‘AI 그램 링크’ 기능은 최대 10대까지 안드로이드 및 iOS 기기와 파일, 사진 등 파일을 편리하게 주고받거나 화면을 공유할 수 있도록 지원합니다. 여기에 더해 엔비디아의 지포스 RTX™ 3050 랩톱 GPU 외장 그래픽 카드를 탑재한 모델은 1초에 5장에 달하는 AI 이미지를 생성할 수 있는데요. 이는 내장 그래픽 모델에 비해 약 3배 빠른 속도입니다. LG전자 이윤석 IT 사업부장은 “AI 성능을 강화한 그램 최상위 라인업 LG 그램 프로를 앞세워 휴대성과 타협하지 않는 고성능을 원하는 고객에게 최적의 사용 경험을 제공하겠다”고 말했습니다.
하이브리드 AI, 새로운 AI시대 열까
이제 AI가 클라우드, 에지 컴퓨팅, 디바이스 영역에 걸쳐 뿌리내릴 것으로 보입니다. 이른바 ‘하이브리드 AI시대’가 도래하려는 모습인데요. 특히 하드웨어를 보유한 빅테크 기업은 온디바이스 AI에 힘을 싣는 분위기입니다. 인터넷 연결 없이도 가전제품이 AI를 활용해 각종 서비스를 제공할 수 있기 때문입니다. 클라우드 AI 시대의 절대 강자가 엔비디아였다면, 온디바이스 AI 시대에는 새로운 칩의 강자가 나타날 수 있을 조짐입니다. 특히 퀄컴과 같은 반도체 기업이 이 틈을 파고들고 있습니다. 퀄컴은 2023년 10월에 열린 스냅드래곤 서밋 2023에서 메타의 라마2를 압축한 모델을 퀄컴 칩이 장착된 디바이스에서 구동하는 기술을 시연했습니다. 인터넷이나 와이파이 연결 없이 맛집 등의 정보를 확인할 수 있는 기술이었습니다. 퀄컴은 앞서 ‘AI의 미래 하이브리드(The future of AI is hybrid)’라는 보고서에서 가까운 미래에 AI가 온디바이스와 클라우드에서 병렬적으로 작동할 것으로 내다봤는데요. 향후 AI는 클라우드와 디바이스를 오가며 고객이 원하는 데이터를 적재적소에 처리하는 하이브리드 AI로 거듭날 것이라는 관측입니다.
이러한 하이브리드 AI는 팬데믹을 정점으로 위축되었던 IT 가전 산업을 다시 부활시킬 것으로 보입니다. 모건스탠리에 따르면 스마트폰 출하량은 온디바이스 AI에 힘입어 지속적으로 성장할 전망입니다. 또한, PC 산업 역시 큰 폭으로 성장할 전망인데요. 캐널리스에 따르면 “2024년 PC 산업은 8% 성장할 전망이며 새로운 AI 기능 장치가 등장하면서, 고객들이 팬데믹 시대에 사들인 PC를 새롭게 교체할 것”이라고 설명했습니다. HP의 최고 경영 책임자(CEO)인 엔리케 로레스(Enrique Lores)는 CNBC를 통해 “AI PC가 PC 시장의 성장을 가속할 것”이라며 “AI PC를 처음에는 특정 기업만 구입하겠지만, 향후에는 더 많은 고객이 구입할 수밖에 없을 것”이라고 말했습니다.
글 ㅣ 이상덕 ㅣ 매일경제 디지털테크부 기자· <챗GPT 전쟁: 실리콘밸리는 지금 무엇을 준비하고 있는가> 저자