본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

IT Trend

글·그림·영상 무엇이든 만든다! 생성형 AI가 뒤흔든 콘텐츠 창작의 미래

2023.03.27

생성형 인공지능 챗GPT(ChatGPT)가 스마트폰을 뒤이을 ‘게임체인저’로 부각되고 있습니다. 오픈AI가 내놓은 챗GPT는 많은 양의 언어 데이터를 학습해 이용자가 원하는 콘텐츠를 생성하는 대화형 인공지능인데요. 이 외에도 구글 ‘바드(Bard)’, 마이크로소프트 ‘빙(Bing)’, 메타 ‘라마(LLaMA)’까지! 다양한 생성형 AI서비스가 콘텐츠 창작의 신시대를 열고 있습니다. 이번 글에서는 생성형 AI가 바꿀 콘텐츠 창작의 미래에 대해 알아보겠습니다.

#소설·논문을 써드립니다

생성형AI는 학습한 데이터를 토대로 이용자가 원하는 내용의 글과 그림, 이미지, 음성, 동영상 등의 결과물을 만듭니다. 사람이 하는 창작 활동을 AI가 대신하는 것인데요. 실제로 생성형AI를 활용해 각종 창작물을 만들었다는 사례가 다수 나오고 있습니다.

미국 세일즈맨 브렛 쉬클러는 챗GPT에 접속해 “아빠가 아들에게 금융 문해력에 대해 쉽게 알려줄 수 있는 이야기를 써달라”는 명령을 입력했습니다. 이에 챗GPT는 숲속에 사는 다람쥐 ‘새미’가 도토리를 저장하고 투자해 숲에서 가장 부유한 다람쥐가 되는 30페이지 분량의 동화책을 만들었습니다. 아마존 킨들 스토어에는 챗GPT가 메인 저자나 공동 저자로 등록된 책이 무려 200권이 넘는데요. 챗GPT는 소설뿐만 아니라 프로그래밍, 문학작품, 논문, 기사, 판결문 작성도 얼마든지 가능합니다.

#이미지·그림·일러스트를 만들어드립니다

생성형AI는 일러스트레이터, CG 디자이너를 대체할 수 있어 미래 창작 세계에 지각변동을 일으킬 수 있습니다. 대표적인 인공지능 콘텐츠 생산기(AI-Content-Generators)로는 오픈AI의 달리2(DALL-E2), 영국 스타트업 스태빌리티(Stability) AI의 ‘스테이블 디퓨전(Stable diffusion)’, 인공지능 연구소 미드저니의 ‘미드저니(Midjourney)’ 등이 있습니다. 이런 생성형AI는 텍스트만 입력하면 그림을 생성해 주는 마법 같은 기능을 갖고 있습니다.

최근 셔터 스톡(Shutterstock)은 오픈AI와 파트너십을 맺고 ‘달리(DALL-E)’를 적용한 이미지 생성 AI 플랫폼을 출시했습니다. 이 플랫폼 검색창에 자신이 원하는 문장을 입력하면 관련 이미지를 자동으로 생성하는데요. 클릭 몇 번만으로 깜짝 놀랄만한 이미지를 완성할 수 있고 자신이 원하는 제품도 디자인할 수 있게 된 것이죠.

셔터스톡 AI가 생성한 이미지 예시 (출처: 셔터스톡)

#동영상을 만들어드립니다

생성형AI는 원하는 이미지를 만들 뿐만 아니라, 영상까지 편집할 수 있습니다. 미국 스타트업 런웨이는 텍스트 프롬프트에서 지정한 스타일을 적용해 기존 비디오를 새로운 비디오로 변환해 주는 AI코델 ‘젠-1(Gen-1)’을 출시했습니다. ‘페이드 아웃(fade-out)’이라고 입력하면 화면이 점차 어두워집니다. ‘도시 장면을 보여줘’라고 하면 도시 장면이 나타나며, 원하는 물체를 지정한 뒤 ‘삭제해줘’라고 하면 삭제된 영상이 나타납니다. ‘꽃밭 정원을 생성해줘’라고 입력하면 정원이 나타나고 ‘아름다운 정원’이라는 글자를 넣어달라고 하면 바로 글자가 삽입됩니다. 배경화면도 원하는 장면으로 바꿀 수 있습니다. 생성형AI를 활용해 원하는 동영상을 생성하고 자유자재로 편집도 할 수 있습니다.

런웨이 비디오 생성형AI ‘젠-1’ (출처: 런웨이)

#노래를 만들어드립니다

구글은 만들고 싶은 음악을 문장으로 설명하면, 그대로 음원을 만들어주는 생성형 AI ‘뮤직LM (MusicLM)’ 기술을 발표했습니다. 뮤직 LM은 장르 및 악기를 가리지 않고 이용자의 주문에 따라 30초 분량의 음원을 만들어줍니다. 예를 들어 “플루트, 기타와 함께 차분하고 진정되는 명상 음악”을 주문하면 요청에 맞는 음악을 만들어줍니다. 저작권 문제로 아직 상용화되지는 않았지만, 곧 AI 작곡가로 맹활약할 전망입니다.

이전에도 텍스트에서 음악을 생성하는 ‘리퓨전(Riffusion)’, 기존 노래를 수백 시간 동안 훈련해 음악 클립을 생성할 수 있는 ‘댄스 디퓨전(Dance Diffusion)’, 신경망으로 새로운 음악을 생성하는 오픈AI 의 ‘주크박스(Jukebox)’, 짧은 음성·음악을 들려주면 유사한 후반부 오디오를 생성해 주는 구글 ‘오디오LM(AudioLM)’ 등이 있었는데요. 이들 모델은 구성이 복잡하거나 완성도가 높은 곡을 제작하는 데는 어려움이 있습니다. 기술적 한계와 제한된 학습 데이터로 인해 설득력을 지니지 못했기 때문인데요. 뮤직LM은 텍스트 설명으로 모든 음악을 생성할 수 있기에, 기존의 한계를 극복할 수 있는 혁신적인 모델로 주목받고 있습니다.

생성형AI에 텍스트만 입력하면 각종 콘텐츠를 창작할 수 있는 세상이 다가오고 있습니다. 생성형AI가 야기할 저작권 논란이 새롭게 극복할 과제인데요. 다가올 AI 시대에 대한 제도적 고민이 필요한 시점입니다.

비즈니스 특성에 최적화된 AI 서비스를 만나보고 싶다면?

글 ㅣ 최은수 ㅣ 미래경영전략학 박사·MBN 보도본부장

챗봇과 대화를 할 수 있어요