본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

IT Trend

“알아서 척척” 초거대 AI 품은 로봇이 온다!

2023.08.23

100년이 넘은 역사를 가진 로봇은 오늘날 인공지능 발전과 맞물리면서 그 어느 때보다 빠르게 발전하고 있습니다. 이번 글에서는 로봇의 역사와 초거대 AI를 탑재한 현재, 그리고 향후 로봇의 전망을 살펴보도록 하겠습니다.

로봇의 등장

세계 최초의 로봇은 1928년 등장한 ‘에릭’으로 알려져 있습니다. 에릭은 1차 대전 참전 용사인 영국인 윌리엄 리처드가 만들었는데요. 에릭은 사실 ‘분노’의 산물입니다. 리처드는 런던 RHS에서 열릴 모델 엔지니어 전시회를 준비하며 한 공작에게 전시회 개막 연설을 부탁했으나, 일방적으로 취소를 당하게 됩니다. 화가 난 리처드는 “양철로 된 사람을 대신 개막식에 세우겠다”고 외쳤습니다. 당시 에릭은 전시회 개막식에서 일어나 인사를 하고 4분간 개회사를 하게 됩니다. 물론 걸을 순 없었고 성우가 무선으로 목소리를 대신했습니다.

이후 1959년 첫 산업용 로봇이 등장하고, 1974년에는 컴퓨터를 제어하는 로봇의 모습이 드러났습니다. 1997년 혼다는 아시모의 전신인 P2를 내놓았고, 2003년에는 NASA에서 스피릿을 화성에 보냈는데요. 더디지만 꾸준히 발전한 결과, 오늘날의 로봇은 우리의 생활 곳곳에 함께하고 있습니다.

[그림 1]

로봇의 3요소: 감각, 계획, 활동

로봇공학자 데니스 홍은 최근 농식품 테크 스타트업 콘퍼런스 아프로(AFRO) 강연에서 로봇을 다음과 같이 정의했습니다. 로봇은 적어도 세 가지의 기능인 센서(시각/촉각/청각 등 감각을 받아들이는 장치), 플랜(결정을 내리는 장치), 액트(걸어가던/굴러가든/움직이던)를 갖추고 있어야 합니다. 예를 들면, 스마트폰은 카메라와 마이크 센서가 있고 고성능 컴퓨터가 탑재되어 있어 플랜을 세울 수 있지만 움직이지는 않기 때문에 로봇은 아닙니다. 엘리베이터도 센서가 달려있어 사람들이 누른 층수를 판단하고 움직이지만 역시 로봇은 아닙니다.

데니스 홍은 이러한 예시들을 통해 “로봇 학계에서는 감각/계획/활동으로 로봇을 판별하지만, 정의에 얽매이면 안 된다”라고 강조했습니다. “로봇은 인간이 하기 싫거나 할 수 없는 일을 대신해 주는 존재인데, 중요한 점은 인간을 위한 따뜻한 기술로써 작동하는 것”이라고 덧붙이며, 엔지니어들에게 이러한 관점에서 기술을 개발하도록 격려했습니다. 엔지니어들은 기술을 개발하고 적용하는 것에 중점을 두지만, 그 과정에서 기술의 본질과 철학이 매우 중요함을 한 번 더 일깨워준 것이죠.

[그림 2] 데니스 홍 UCLA 기계항공공학과 교수 (출처: 매일경제)

초거대 AI, 로봇의 판을 바꾸다!

오늘날 빅 테크는 단순한 인공지능을 넘어 초거대 AI(Hyperscale model)와 로봇을 결합하고 있습니다. 챗GPT의 뼈대가 되는 GPT-3은 파라미터 수가 1750억 개에 달하는데요. 인간 두뇌의 시냅스에 해당하는 파라미터가 많으면 많을수록 인공지능의 연산 능력은 크게 향상됩니다.

2023년 7월, 구글은 RT-2라는 로봇을 선보였습니다. RT-2는 초거대 AI를 접목해 명령 수행 능력이 급격히 올라간 로봇입니다. 예를 들어, “테이블 위에 있는 수많은 과일 가운데 딸기만 골라 담아”라고 명령하면 로봇 RT-2는 팔을 들어 올려 딸기만 바구니에 담기 시작합니다.

[그림 3] 구글의 AI 로봇 RT-2 (출처: 구글 딥마인드 블로그)

그동안 수많은 로봇들은 학습한 대로, 혹은 정해진 경로로만 임무를 수행했습니다. 로봇의 움직임을 일일이 프로그래밍해야 했기 때문에 로봇 훈련에도 막대한 시간을 투입했습니다. 하지만 초거대 AI를 연결한 로봇은 다릅니다. 구글 딥마인드의 로봇공학 책임자인 빈센트 반호크는 “초거대 AI 등장으로 이전 연구를 백지화 해야했다”고 설명을 덧붙였습니다.

초거대 AI를 연동한 로봇은 자율성이 상상을 초월합니다. 이 로봇들은 별도의 학습 없이도 사람의 목소리를 인식하고, 정확히 사용자가 원하는 임무를 수행하며 사람과도 스스럼없는 대화를 나눕니다. 초거대 AI가 이미 대규모 언어 모델을 학습했기 때문에 로봇이 별도로 학습할 필요가 없는 것이죠.

시각 언어 행동 모델 기반의 로봇은 사람의 언어를 이해하고, 카메라를 활용해 이를 감지하고 행동합니다. 이러한 기술을 우리는 멀티 모달(Multi Modal)이라고 부르는데요. 이 기술이 로봇에 접목된다면 로봇의 쓰임새와 용도도 크게 달라집니다. 현재 요리 로봇은 특정 요리만 할 수 있지만, 앞으로는 메뉴에 대한 학습 없이 모든 요리를 자유자재로 만들 수 있는 범용 요리 로봇이 나올 수 있다는 전망입니다. 2023년 6월에는 미국 프린스턴대와 스탠포드대, 구글 공동 연구팀이 청소봇인 ‘타이디 봇’을 시연했습니다. 그동안 로봇 청소기가 먼지만 빨아들이고 걸레질만 했다면, ‘타이디 봇’은 어지럽힌 방에 있는 쓰레기를 들어 올려 쓰레기통에 옮겨 담을 수 있습니다.

[그림 4] 타이디봇이 집안을 정리하는 모습 (출처: 스탠포드대)

타이디봇은 70개에 달하는 전혀 다른 물체가 바닥에 놓여있어도 11개로 분류하는 작업을 척척 진행했습니다. 이에 프린스턴대는 “현재 85% 성공률을 보이고 있으며, 향후 이 같은 로봇이 청소 산업을 획기적으로 바꿀 수 있다”라고 설명을 덧붙였는데요. 이런 로봇을 응용한다면 세탁물이나 재활용품 분류에도 직접 투입시킬 수 있습니다.

로봇의 개발은 농업에도 큰 변화를 불러일으킵니다. 유럽의 로잔연방 공과대와 델프트 공과대는 토마토를 수확하는 로봇에 초거대 AI를 접목했습니다. 네이처에 따르면, 이들은 대규모 언어 모델을 토대로 수확 로봇에 적합한 소재와 모터 등을 추천받아 설계했다고 하는데요. 로잔연방 공과대 연구진은 “대규모 언어 모델은 로봇 설계 단계부터 유익했다”면서 “이를 기반으로 만든 수확 로봇은 농장을 돌아다니며 토마토를 손상 없이 수확한다”라고 설명했습니다.

IoH와 로봇의 미래

로봇의 발전은 오픈 소스와 결합되면서 그 속도가 더욱 빨라질 전망입니다. 특히 마이크로소프트는 챗GPT를 활용해 누구나 초거대 AI 로봇을 개발할 수 있도록 무료 개발 도구인 ‘프롬프트 크래프트’를 선보였는데요. 해당 도구를 활용한다면, 손쉽게 로봇에 챗GPT를 장착할 수 있고 로봇 개발을 위한 파이썬 코드도 생성할 수 있습니다.

앞으로 먼 미래에는 로봇이 휴먼 인터넷인 IoH(Internet of Human)와 연결될 것이라는 전망도 있는데요. IoH가 발전한다면 걸어 다니는 위치를 네트워크에 연동하고, 주변 데이터를 수집/분석하며 현재 내 감정 상태를 상대방에게도 전달하거나, 뇌파만으로도 로봇 팔을 조정할 수 있을 것입니다. 미래 인류를 위협하는 적이 아닌 친구가 될 로봇의 모습을 기대해 봅니다.

글 ㅣ 이상덕 ㅣ 매일경제 실리콘밸리 특파원·<챗GPT 전쟁: 실리콘밸리는 지금 무엇을 준비하고 있는가> 저자

챗봇과 대화를 할 수 있어요