본문 바로가기

블로그

IT 트렌드의 최신 소식을 만나보세요.

IT Trend

문장 하나로 2,000점의 그림을 그려내는 LG AI ‘엑사원’

2022.07.20

반 고흐 10년에 2,000여 점 그렸는데…

LG 엑사원이 그린 그림(출처: LG AI연구원)

인상파 화가로 유명한 빈센트 빌럼 반 고흐(Vincent Willem van Gogh, 이하 반 고흐)는 그림을 많이 그린 다작 화가로 알려져 있습니다. 반 고흐는 1890년 자살을 감행하기 직전까지 약 10년간 900여 점의 그림과 1,100여 점의 습작을 그렸는데요. 10년간 2,000여 점이니, 반 고흐는 1년에 그림을 200여 점씩 쏟아낸 셈입니다. 적어도 그림을 이틀에 한 점 이상씩 그려낸 것이죠.
 
하지만 1시간이 채 안 된 시간에 2,000점의 그림을 그리는 화가가 있다면 어떨까요? 네, 그렇습니다. AI라면 충분히 가능한 일이죠. LG가 개발한 초거대 AI ‘엑사원(EXAONE)’은 문장 하나를 입력하면 이를 7분 만에 그림 256장을 그려냅니다.
 
올해 6월 미국 뉴올리언스에서 열린 ‘국제 컴퓨터 비전 및 패턴 인식 학술대회(CVPR) 2022’에서 LG는 차세대 AI 기술을 대거 선보였는데요. 그중 가장 주목받은 것이 바로 엑사원의 그림 기술입니다. 김승환 LG AI연구원 비전랩장이 ‘반 고흐 스타일로 그린 풍경 그림’이라는 문장을 엑사원에 입력했는데, 요청한 스타일대로 각종 그림들을 그려낸 것이죠.


LG 엑사원 3,000억 개 파라미터로 훈련

LG 엑사원이 반 고흐 스타일로 그린 그림(출처: LG AI연구원)

LG의 AI는 무려 3,000억 개의 파라미터로 훈련시켜 주목을 받았습니다. 여기서 파라미터란 어떤 시스템이나 함수의 특정한 성질을 나타내는 변수를 뜻하는데요. 파라미터의 양이 많을수록 출력되는 값이 늘어납니다. 세계적인 AI 업체 ‘오픈AI’의 GPT-3의 파라미터가 1,750억 개라고 하는데요. 파라미터의 수를 기준으로 비교해 보면 LG의 AI가 약 70% 정도 데이터가 더 많다는 뜻입니다.
 
물론 GPT-3는 2020년에 출시된 AI이고 엑사원은 그로부터 1년 후 개발된 AI이긴 하지만 엑사원이 대단한 것은 사실입니다. 특히 엑사원은 해상도에서도 높은 실력을 보여주는데요. 오픈AI가 지난해 내놓은 이미지 생성 AI ‘달리’가 가로세로 1,024화소까지 그림을 그릴 수 있는 것과 비교해 엑사원은 그 2배인 2,048화소까지 이미지를 생성할 수 있다고 합니다.


“문장 그림 양방향 전환은 LG 엑사원이 처음”

김승환 LG AI연구원 비전랩장

이에 대해 김승환 LG AI연구원 비전랩장은 “텍스트와 이미지를 양방향으로 전환할 수 있도록 한 것은 LG가 처음”이라면서 “인간과 경쟁하는 AI가 아닌, 인간에게 도움과 영감을 주는 AI를 개발하는 것이 LG AI연구원의 목표”라고 설명을 했습니다.
AI는 자연어 처리 과정에서 말뭉치(corpus)를 의미가 있는 단위로 나누는 작업을 거치는데요. 이를 토큰화(tokenization)라고 합니다. 그리고 나누어진 각 단위를 토큰이라고 하죠. 엑사원에 그림 한 장을 입력하면 영어 기준으로 토큰 64개에 달하는 문장을 만드는데요. 쉽게 말해 엑사원은 그림 한 장 당 64개에 달하는 단어로 된 문장을 만든다고 봐도 좋을 것 같습니다. 그만큼 엑사원이 풍성한 문장을 만들 수 있다는 뜻이죠.
 
이를 위해 LG는 문장 속 단어에서 맥락과 의미를 학습하는 신경망 ‘트랜스포머 모델’을 개발했습니다. 또한 백지 상태에서 수백 단계를 거쳐 그림을 완성해가는 ‘디퓨전 모델’도 개발 중에 있는데요. ‘디퓨전’이란 초점이 흐리다는 뜻으로, 디퓨전 모델이란 노이즈를 연속해서 학습시킨 뒤 이를 역으로 적용하는 방식을 말합니다. 마치 초고해상도 사진을 백지가 될 때까지 문지르고, 이후에 다시 이를 반대로 백지에서 초고해상도 사진으로 바꾸는 작업과 유사하죠. 디퓨전 모델은 기존 모델과 달리 해상도 높은 그림을 다양하게 그릴 수 있다는 장점이 있습니다.


AI와 함께한 패션쇼

LG 엑사원과 협업한 패션쇼(출처: 박윤희 디자이너 유튜브)

이러한 컴퓨터 비전 AI 기술은 향후 다양한 영역에 활용될 것 같습니다. LG가 올해 초 박윤희 디자이너와 협업해 뉴욕 패션위크에서 엑사원이 디자인한 의상을 대거 선보였던 것이 대표적인 사례데요. LG를 상징하는 ‘금성에 핀 꽃’을 주제로 엑사원이 약 3,000장에 달하는 디자인을 만들어 이를 박 디자이너에게 제공했습니다. 박 디자이너는 이 가운데 약 200장을 고르고 다듬어 의상을 완성했는데요. 패션쇼는 디자인에서 마무리 작업까지 약 4개월이 소요되는데, 엑사원을 통해 이 기간을 한 달 반으로 기간을 단축했습니다.
 
아울러 LG의 AI 아티스트인 ‘틸다(Tilda)’에 엑사원을 접목한다는 큰 그림도 그리고 있는데요. AI 아티스트와 대화를 주고받고 그림을 그려 달라고 말하면, 요청한 그림을 실시간으로 받아 볼 수 있는 날이 가까운 미래에 올지도 모릅니다.
 
LG 관계자는 “스스로 학습하는 엑사원은 AI가 각 분야의 전문가가 될 수 있는 가능성을 열었다”면서 “앞으로 엑사원이 전문가의 손길이 필요한 창작, 화학, 제조, 금융 등 각종 분야에서 사람들의 일손을 덜어주는 AI로 거듭날 수 있도록 노력하겠다”고 말했는데요. 더 많은 사람들이 AI를 통해 창조적인 일을 보다 손쉽게 해낼 수 있는 세상이 오기를 기대해 봅니다.
 
 
글 ㅣ 이상덕 ㅣ 매일경제 실리콘밸리 특파원
 

챗봇과 대화를 할 수 있어요