본문 바로가기

블로그

IT 트렌드의 최신 소식을 만나보세요.

IT Trend

광고 카피부터 소설까지 OK! 글 쓰는 AI의 진화

2022.09.19

AI가 텍스트 영역으로 빠르게 확장하고 있습니다. AI에 특정 문장을 입력하면 곧 문맥에 맞는 다음 문장을 만들어 내는데요. 2019년 오픈 AI(Open AI)가 GPT-2를 내놓은 이후 AI를 기반으로 한 글쓰기 시대가 열렸습니다.
 
현재 AI는 이미 많은 영역에서 대량의 글을 빠르게 생산해내고 있습니다. 게다가 글의 품질 역시 이전과 비교할 수 없을 정도로 향상되고 있죠. 물론 AI가 전문 작가를 바로 대체하지는 않겠지만, AI가 글을 쓰는 미래는 우리의 생각보다 빠르게 다가오고 있습니다.

AI 글쓰기의 시작

최근 유튜브와 틱톡 등의 영상 콘텐츠가 대세이기는 하지만 글로 이루어진 콘텐츠도 꾸준히 소비됩니다. 우리는 뉴스레터를 읽거나 플랫폼에서 웹소설을 읽는 등 다양한 형태로 글을 접하고 있죠. 회사 업무를 위해 이메일을 작성하거나 학교 과제를 할 때도 글을 써야 하는 일이 종종 있습니다.
 
글과 관련된 영역에서 AI의 존재감은 나날이 커지고 있습니다. 많은 이메일 서비스에서는 AI가 이메일 내용에 맞는 여러 표현을 자동으로 추천하고, 클릭 한 번이면 AI가 작성한 답장을 보낼 수 있죠. 문장을 분석해 오타를 찾거나 더 매끄러운 문장으로 바꾸는 것도 가능합니다.
 
AI는 자동 문장 완성과 같은 간단한 기능부터 소설과 같은 장문의 글쓰기도 가능한데요. 제품의 광고 카피도 작성해 추천하기도 합니다. 교열과 같이 오랜 시간이 걸리는 출판 작업을 자동화하거나 사람들이 시간을 절약할 수 있도록 기사를 요약해 추천하는 등 여러 방면에서 도움을 줄 수 있죠.
 
구글이 지메일에 스마트 답장 기능을 도입한 시점은 2015년입니다. 당시에는 간단한 글 작성이나 문구 추천 등이 가능한 수준이었는데요. 약 4년이 흐른 2019년, GPT-2가 등장한 이후 AI가 더 많은 데이터를 학습하면서 뉴스 기사 작성 등 본격적인 글쓰기를 하기 시작했습니다.
 
AI가 글쓰기 분야에 어떤 영향을 미치고 있을까요? AI는 주어진 키워드로 광고에 쓰일 카피와 소셜 미디어에 올릴 게시물, 제품 홍보용 제목 등 짧은 콘텐츠를 생성합니다. 최근엔 상당한 분량의 기사나 단편 소설, 드라마 대본 등 긴 형식의 콘텐츠도 만들어내는데요. AI는 문장을 다른 표현으로 바꾸고 글을 재작성하거나 검색 엔진을 최적화하는 데에 사용되기도 합니다.
 
이제 AI는 텍스트가 존재하는 대부분의 영역에서 활용되고 있는데요. 이렇게 넓은 영역에 활용이 가능해진 가장 큰 이유는 AI의 데이터 학습 구조와 데이터 처리 기술의 발전 때문입니다. AI가 인간의 언어를 학습하는 과정을 통해 글과 음성으로 결과물을 내놓기 시작했습니다.

구글 지메일 자동 답장(출처: 구글 지메일)

자연어 처리(NLP)와 GPT-3

글쓰기 AI 관련 시장은 2020년 GPT-2보다 진일보한 GPT-3가 등장하면서 급속도로 발전하기 시작했습니다. 특히 GPT-3가 작성한 글은 인간이 쓴 것과 유사해졌는데요. 누군가 GPT-3가 쓴 글을 여러 사이트에 올렸지만, 이것을 AI가 작성했다고 눈치챈 사람이 없을 정도로 진일보한 모습을 보였습니다.
 
AI가 글을 쓰기 위해서는 인간의 언어를 컴퓨터의 영역으로 가져와야 하는데요. 이에 따라 자연어 처리(Natural Language Processing, NLP) 등 관련 기술이 함께 주목받고 있습니다. 인간이 쓰는 언어 즉, 자연어를 컴퓨터로 처리하기 위해서는 바로 이 자연어 처리 기술이 핵심인데요. 자연어 처리 기술 영역에는 자연어를 기계 언어로 변환하는 자연어 이해(Natural Language Understanding, NLU)가 포함되어 있습니다.
 
인간이 외국어를 배울 때 외국어의 구조를 이해하고 귀가 트이면 다음 단계인 말하기의 영역으로 발전합니다. 자연어 처리 역시 마찬가지입니다. 자연어 이해가 진행되면 이후에는 자연어를 자동으로 생성하는 자연어 생성(Natural Language Generation, NLG)과 연계되는데요.

자연어 처리, 이해 및 생성(출처: 로블록스)

자연어 생성은 인간과 유사한 텍스트 또는 음성을 생성하는 기술입니다. 자연어 생성을 위해서는 주어지는 데이터의 형식이나 크기와 관계없이 언제나 구조화된 텍스트를 생성할 수 있는 규칙과 알고리즘이 필요한데요. 자연어 생성은 무언가 특정 규칙을 따를 때 가장 정확하고 효율적입니다. 예를 들어 법률 문서나 계약서, 제품 설명서처럼 특정 양식과 구조를 따르는 경우 반복적이고 예측할 수 있기 때문에 자연어 생성의 품질이 가장 좋습니다.
 
자연어 처리 기술이 점차 발전하면서 GPT(Generative Pre-trained Transformer) 같은 자연어 처리 초거대 AI가 등장했습니다. GPT는 이름 그대로 사전 학습된 모델인데요. GPT 모델은 트랜스포머를 활용해 수많은 텍스트 데이터를 학습합니다. 이를 통해 통계적으로 특정 단어 뒤에 나올 다음 단어를 예측할 수 있는데요. 대량으로 학습한 데이터를 기반으로 앞선 문장의 문맥을 파악한 후 뒤에 나올 단어를 제시해 문장을 완성합니다.
 
이를 위해서는 엄청난 양의 데이터 학습이 필요합니다. GPT-3는 수천억 바이트 쌍으로 인코딩된 토큰 데이터 세트를 사용하며, 1,750억 개 이상의 매개 변수를 가지고 있는데요. GPT-3는 글의 문맥 즉, 시퀀스를 식별해 글로 작성되는 모든 것을 자동 완성하고 예측하는 기능이 있습니다.
 
예를 들어 세탁기에 대한 간단한 설명을 작성하는 것만으로도 GPT-3는 단 몇 초 만에 세탁기의 기본 사양과 성능을 소개하는 수백 개 이상의 단어를 생성하고 문장으로 만들 수 있습니다. 만약 사용자의 기존 글쓰기 스타일을 학습한 상태라면 작문 스타일과 문체를 모방해 내기도 하죠.
 
GPT-3는 영어권 데이터를 사용하기 때문에 국내에서는 활용이 어려운 측면이 있습니다. 국내에서는 2021년 네이버가 한국어 데이터로 학습된 GPT-3 모델인 하이퍼클로바 (HyperCLOVA)를 발표했고, 카카오브레인도 한국어로 학습된 ‘KoGPT(Korean Generative Pre-trained Transformer)’를 오픈소스로 공개해 한국어 기반 텍스트 학습도 빠르게 발전하고 있죠.

수많은 AI 글쓰기 서비스

GPT-3라는 새로운 언어 모델은 글쓰기를 돕는 AI 기반 서비스를 만들고 있습니다. 누구나 소재만 있으면 AI의 도움을 받아 학교 과제를 작성하거나 보도기사, 블로그 포스팅 등을 손쉽게 작성할 수 있죠.
 
국내에는 AI 기반 글쓰기 서비스로는 라이팅젤과 뤼튼이, 해외에는 수도 라이트(sudo write)나 노블AI(NovelAI) 등이 있습니다. 이 서비스의 공통점은 누구나 글을 쓰고 수정하면서 다양한 창작물을 만들어낸다는 것이죠.
 
라이팅젤과 뤼튼은 글쓰기에 필요한 과정을 단계별로 제공하는데요. 글의 주제 선정은 물론 원하는 양식을 고르면 이용 목적에 따라 글쓰기의 모든 과정을 지원합니다. 어떤 글을 써야 하는지, 특정 주제에 관한 내용이 필요하다고 입력하면 이에 적합한 템플릿을 추천하는데요. 웹소설, 블로그, 회사 문서와 같이 형식에 따른 맞춤형 창작이 가능합니다. 글을 작성하고 나면 맞춤법, 어휘력 등을 확인해 피드백을 제공하고 개선해 나갈 수 있도록 돕습니다.
 
국내 스타트업 뤼튼테크놀로지스는 학생들이 과제를 작성하거나 자료 조사를 할 수 있는 ‘뤼튼 트레이닝’이라는 글쓰기 서비스를 제공하는데요. 이들이 서비스하는 ‘뤼튼 카피라이팅’은 AI가 소셜 미디어용 광고 문구나 회사 소개, 제품 소개 문구 등을 생성합니다. 아직 베타 테스트 전 단계라 실제 사용은 어렵지만, 몇 가지 간단한 정보 입력하면 AI가 자동으로 이메일을 생성하고 광고 문구를 작성하는 등 AI를 통한 글쓰기의 다양한 가능성을 엿볼 수 있습니다.

AI 카피라이팅 (출처: 뤼튼카피라이팅 홈페이지)

수도 라이트는 해외에서 소설 쓰는 AI 서비스로 알려져 있는데요. GPT-3를 기반으로 개발된 수도 라이트는 작가가 작성한 내용을 입력하면 AI가 줄거리를 수정하거나 단어를 교체해 새로운 소설로 탈바꿈할 수 있습니다.
 
수도 라이트의 GPT-3에는 단편 소설 등 소설 관련 데이터가 제공됐고 AI가 이를 학습했는데요. 미국의 한 작가는 수도 라이트에 자신이 작성했던 소설 원고를 입력했습니다. AI가 소설 뒷이야기를 생성해 냈고, 읽어도 어색하지 않은 충분한 결과물을 써냈는데요. 작가는 전체적인 장면의 설명을 입력하고 수도 라이트가 글을 작성하면, 이를 확인한 후 어색한 부분을 직접 수정하거나 다시 수도 라이트에 넣어 또 다른 문장으로 변환되도록 했습니다.
 
유사한 서비스로는 GPT 기반의 노블AI가 있습니다. 노블AI의 유료 서비스를 사용하면 무제한으로 AI가 생성하는 문장을 받아볼 수 있는데요. 사용자가 직접 여러 가지 설정을 할 수도 있고 새로운 기능을 사용하는 것도 가능합니다.
 
일본어 서비스로는 AI노블(AI-novel)이 있습니다. 일본어와 일본 특유의 소설 장르를 좋아하는 사람들에게는 유명한 서비스인데요. AI노블은 일본의 한 개인 개발자가 만든 서비스로 약 70억 개의 패턴과 500기가 바이트가 넘는 분량의 요약된 문장 데이터가 있습니다. AI가 소설 속 캐릭터를 인식하거나 작품의 설정을 통해 소설 내 진행 방향과 분량, 문체 등을 조절하는 특징이 있죠.
 
이러한 서비스의 특징은 기본적인 형식과 템플릿 구조를 따르면서 그럴듯한 문장을 빠르게 생성한다는 점인데요. 더 많은 소설 데이터가 쌓이고 학습될수록 AI가 쓰는 소설은 보다 다양한 방향으로 전개될 수 있습니다.

AI노블의 텍스트 입력 화면(출처: ai-novel.com)

글 쓰는 AI의 미래

현재 AI가 가진 글쓰기 방식의 가장 큰 문제는 패턴에 대한 과도한 의존과 특정 주제, 단어를 함께 나열할 확률이 높다는 점인데요. 입력되는 데이터가 비슷하다면 결국 기본 형태는 동일하고 이야기의 일부만 다른, 마치 표절에 가까운 글이 무한히 생성될 가능성도 있기 때문입니다.
 
AI가 소설과 같은 긴 글을 쓰기 시작하면 여러 변화가 예상되는데요. 일단 필력이 부족하고 매번 뻔한 전개의 글을 쓰는 작가들은 작가로의 경쟁력을 잃을 수 있습니다. AI가 비슷한 수준의 글을 어렵지 않게 만들 수 있기 때문이죠. 반대로 상상력은 풍부하지만 글솜씨가 부족한 보통의 사람들이 작가가 될 수 있도록 길을 열어준다는 관점도 있습니다. 상상력만 있다면 AI가 글을 대신 써줄 수 있기 때문이죠.
 
AI가 사람은 불가능한 속도로 글을 생성하는 것은 물론 사람의 글쓰기 능력과 다름없는 능력을 지니게 되면 ‘과연 작가가 필요한가’에 대한 담론이 생길 수도 있습니다. 물론 아무리 기술이 발전하더라도 인간이 표현할 수 있는 감정과 에너지 등을 AI가 전부 담을 수 있을지는 미지수죠.
 
따라서 AI가 글쓰기와 작가를 완전히 대체할 수는 없을 것입니다. 하지만 AI가 쓴 광고 문구가 인간의 마음을 사로잡거나, AI가 쓴 소설을 읽고 감명받고 눈물을 흘리는 시대는 생각보다 빠르게 다가오고 있을지 모릅니다.
 
 
글 ㅣ 윤준탁 ㅣ IT 저널리스트
 
 

챗봇과 대화를 할 수 있어요