본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

IT Trend

AI 창작물의 주인은 누구? 판례를 통해 본 AI 저작권 논쟁

2023.05.15

생성형 인공지능(Generative Artificiel Intelligence, Gen AI) 시대가 열리면서 수많은 예술 작품들이 쏟아지고 있습니다. 오픈 AI, 마이크로소트프(MS), 구글, 어도비와 같은 빅 테크 기업들이 만들어낸 생성형 인공지능에 문장만 입력하면 글과 이미지가 순식간에 생성됩니다. 일각에서는 인류가 만들어낸 데이터의 양보다 인공지능이 생성한 데이터의 양이 더 많아지는 순간이 올 것이라고 전망합니다. 그렇다면 인공지능이 만든 수많은 창작물의 저작권은 누구에게 있는 걸까요? 이번 글에서는 실제 판례를 통해 인공지능 창작물 저작권 논쟁에 대해 알아보겠습니다.

꿈을 이뤄주는 인공지능

[그림 1] 챗GPT를 활용해 저술한 수많은 책 (출처: Amazon)

미국의 생활 전문 웹사이트 인사이드훅(Indisehook.com)에 따르면 아마존 킨들 스토어의 전자책 중 200권 이상이 챗GPT(ChatGPT) 가 저술한 책이라고 합니다. AI를 활용한 출간이 늘어나면서 이를 둘러싼 시선도 복잡해지고 있는데요. 한편에서는 출간의 문턱을 낮춰 누구나 작가가 되는 길을 열었다고 엄지를 올립니다. 로이터 통신은 [지혜로운 작은 다람쥐 저축과 투자 이야기(The Wise Little Squirrel: A Tale of Saving and Investing)]를 저술한 영업사원 브렛 쉬클러의 사례를 다뤘습니다. 평소 작가가 꿈이었지만 소질이 없었던 쉬클러는 생성형 인공지능을 활용해 30 페이지 분량의 동화책을 뚝딱 만들어냈습니다. 그는 “약 100달러를 벌었다”며 “많은 사람이 인공지능을 활용해 꿈을 이룰 수 있다”고 강조했습니다.

인공지능 데이터 학습은 불법일까?

다른 한편에서는 저작권 침해라는 반발이 있습니다. 현재 쟁점은 인공지능 데이터 학습에 투입한 데이터의 적법성과 인공지능이 생산한 데이터의 소유권으로 구분할 수 있는데요.

10년 전만 해도 인공지능이 학습한 데이터에 대해 사회적으로 문제를 삼는 경우는 드물었습니다. 데이터를 학습하더라도, 당시 AI 모델은 흐릿한 손톱 크기의 흑백 얼굴 이미지만 생성할 수 있었기 때문입니다. 하지만 현재 미드저니(Midjourney)나 스테이블 디퓨전(Stable diffusion) 등의 인공지능이 만든 결과물은 차원이 달라 저작권 논쟁이 잇따라 발생하고 있습니다.

[그림 2]

• 저작권자 동의 없는 이미지 학습

월트디즈니컴퍼니의 일러스트레이터인 홀리 맹거트는 자신이 그린 작품들을 한 대학생이 허락 없이 인공지능 학습에 사용했다는 사실을 발견하고 깜짝 놀랐습니다. 특히 맹거트는 자신의 작품 32장이 불법 사용된 사실까지 확인했는데요. 이에 “동의하지 않았는데 인공지능을 학습시킨 것이 정당한 것인가?”라고 반문했습니다. 인공지능 회사를 향한 소송도 빗발치고 있는데요. 오픈 소스 기반 생성형 인공지능인 스테이블 디퓨전을 만들어낸 스태빌리티 AI(Stability AI)는 유럽과 미국에서 잇따라 소송을 당했습니다. 이와 별도로 게티 이미지(Getty images)는 스태빌리티 AI를 상대로 미국 델라웨어주 법원과 영국 법원에 소송을 걸었는데요. 게티이미지는 스태빌리티 AI가 20억여 장을 AI 모델 학습에 투입했고 최소 수천 장의 이미지를 라이선스 구매 없이 사용했다고 주장했습니다. 이런 사실은 인공지능이 생성한 결과물에 저작권 표기가 함께 생성되면서 밝혀졌습니다.

• 오픈소스 코드 데이터를 상업적으로 오남용

프로그래머 역시 불법 학습에 반발하고 나섰습니다. 마이크로소프트는 코드 생성 모델 코덱스(Codex)와 깃허브의 코드 데이터베이스를 접목해 ‘깃허브 코파일럿(GitHub Copilot, 소프트웨어를 제작하기 위한 코드를 생성하는 대화형 AI 코딩 모델)’을 개발했는데요. 프로그래머들은 회사가 상업적 용도로 코드 데이터를 오남용했다고 지적합니다. 자신들이 오픈 소스로 올린 코드를 상업적으로 이용하라는 뜻은 아니었다고 말입니다. 해당 프로그래머들은 관련 빅 테크 기업을 상대로 저작권 침해 소송을 제기했습니다.

• 뉴스 기사 데이터를 허가 없이 사용한 오픈 AI

챗GPT에 학습된 뉴스 기사 역시 논란의 중심에 있습니다. 월스트리트저널의 모회사인 뉴스코프의 제이슨 콘티 다우존스 법률고문은 “월스트리트저널 소속 기자들이 작성한 기사를 활용해 AI를 학습시키려고 한다면 적절한 허가를 받아야 한다”며 “오픈 AI는 우리 회사와 해당 계약을 맺지 않았다”고 지적했습니다. 오픈 AI가 뉴스 기사 데이터를 허가 없이 사용한 것은 컴퓨터 전문 저널리스트인 프랜시스코 마크로니가 챗GPT를 활용해 문답한 결과를 트위터에 공개하면서 알려졌습니다. 마크로니는 챗봇에 어떤 뉴스 미디어를 학습했는지 물었고, 미국 주요 20개 매체 이름을 확인했습니다. 해당 매체는 미국 대표 유력지인 뉴욕타임스와 워싱턴포스트, 월스트리저널, US 투데이 등인데요. 뉴욕타임스와 워싱턴포스트, 월스트리트저널 등은 유료 구독 시스템이기에 논란은 더욱 컸습니다. 그러나 오픈 AI는 해당 논란에 대해 따로 논평하지 않았습니다.

• 빅 테크 기업 간 힘겨루기

인공지능 데이터 학습과 관련해 빅 테크 기업 간 힘겨루기마저 감지됩니다. 2023년 4월, 트위터를 이끈 일론 머스크 테슬라 최고경영자(CEO)는 자신의 트위터에 “마이크로소프트가 트위터의 데이터를 불법으로 사용하며 인공지능을 훈련하고 있다”며 “소송할 시간”이라는 글을 올렸습니다. 챗GPT의 근간이 되는 초거대 인공지능(Hyperscale model, 매개변수인 파라미터가 10억개 이상인 인공지능) GPT-3.5는 웹에서 수집한 말뭉치인 토큰 4100 억 개, 추가 웹 텍스트 190억 개, 책에 있는 문장 670억 개, 위키피디아 단어 30억 개를 학습했다고 알려져 있는데요. 워낙 방대한 양을 바탕으로 하기 때문에 인공지능 학습에 투입된 데이터의 적법성 논란이 끊이지 않고 있습니다.

각종 소송이 잇따라 제기되고 있지만 실제 판례가 나오기까지는 시간이 꽤 걸릴 것으로 보입니다. 사건의 구체적인 상황, 소송이 제기된 관할 지역, 적용 가능한 법률 및 규정 등 다양한 요인에 따라 달라질 수 있습니다. 하지만 저작권 침해와 관련된 대표적인 판결 사례를 살펴본다면 추정이 전혀 불가한 것은 아닙니다.

저작권 침해 관련 판결 사례

실제로 저작권 침해 관련 판결 사례는 다음과 같습니다.

• 냅스터 VS 음반 제작사

냅스터(Napster, 온라인 음악 파일 공유 서비스를 하던 회사)는 1999년 프로그래머 숀 패닝과 숀 파커(패닝의 친구이자 투자자)가 창업한 스타트업으로 P2P(peer-to-peer, 개인 간 파일 공유를 하는 방식) 기술을 활용해 사용자가 서로 음원을 공유할 수 있는 방식을 채택했습니다. 2001년 미국의 음반 회사들은 냅스터를 상대로 사용자들 사이 불법 복제에 직접 관여했다는 소송을 걸었고, 결국 저작권 침해 논란과 불공정 경쟁 논란으로 서비스 중단 판결을 받아 파산했습니다.

• 티파니 VS e베이

보석 업체인 티파니는 전자상거래 플랫폼 e베이에서 모조품이 팔리고 있는 것을 확인했습니다. 이에 e베이에 거래되고 있는 티파니 물품에 대한 진위 여부를 확인했는데요. 결과적으로 73.1%가 위조품, 5%는 모조품으로 나타났습니다. 티파니는 e베이를 상대로 미국 법원에 소송을 걸었지만 패소했습니다. 2010년 대법원은 “e베이와 같은 회사들은 자신의 웹사이트상에서 상표권 침해행위(모조품 판매)가 일어나고 있을지 모른다는 일반적 인식(generalized knowledge)만으로는 상표권 침해에 대한 책임을 지지 않는다”고 판결했습니다.

[그림 3]

해당 판례를 통해 ‘적극적 침해성’과 ‘상표권 침해에 대한 인지 여부’가 결과에 중요하게 작용했음을 알 수 있는데요. 미국은 저작권법이 존재하며 독창적인 저작 활동으로 만들어진 유형물에 대한 고정된 표현(expression)을 보호합니다. 또한 판례에서 가장 중시하는 것 중 하나는 ‘최소한의 창작성(modicum of creativity)’인데요. 미국 저작권법은 저작물의 등록 없이는 미국 법원에서 저작권 침해 소송을 제기할 수 없도록 명시하고 있습니다. 따라서 모든 창작물이 보호받는 것은 아니며 블로그, SNS, 이메일, 인터넷 등에 올린 개인 습작물에 대한 법의 보호는 받기 어려워 보입니다.

미국 저작권법에는 ‘공정한 사용(Fair use)’에 대한 면책 조항도 있습니다. 미국은 허락 없이 저작물을 연구, 학문, 비평, 저널리즘과 같은 변형적(transformative) 목적으로 사용하더라도, ‘공정한 사용’으로 판단하면 침해에 대한 책임을 묻지 않습니다. 다만, 해당 저작권이 속한 시장에 미치는 영향은 고려합니다.

인공지능은 발명가가 될 수 있을까?

인공지능 창작물의 소유권 여부는 더욱 큰 쟁점입니다. 인공지능 회사의 소유일까요? 창작물을 만든 개인의 소유일까요?

[그림 4] 인공지능을 활용해 제작한 코믹북 ‘베스티 아리 연대기’ (출처: 스튜디오 캠프파이어 엔터테인먼트)

• 인공지능으로 만든 만화, 여명의 자리야

작가 크리스 카슈타노바는 인공지능으로 만든 만화인 ‘여명의 자리야(Zarya of the Dawn)’에 대해 미국 저작권청에 저작권을 인정해 달라고 요청했습니다. 저작권청은 전통적인 미국 만화책 스타일의 18쪽 분량 책에 대해 애매한 판결을 했는데요. 특정 결과물을 이용자가 예측할 수 없다는 근거로 이미지 자체에 대한 저작권은 인정하지 않았지만, 글과 이미지의 배치에 대한 저작권은 인정한 것이죠. 이와 같은 판결은 인공지능 창작 업계에서 환영받았으며, 카슈타노바는 “예측할 수 있도록 결과물을 만들 경우, 향후 인공지능 결과물에 대한 저작권을 인정받을 수 있는 길이 열렸다”고 주장했습니다.

영국 서식스 대의 인공지능 지식 재산권 전문가인 안드레스 과다무즈는 “미국 저작권 청의 결정은 지속적인 논란이 될 수 있다”며 “반 고흐의 고양이와 같은 생성물은 저작권을 얻을 수 없겠지만, 프롬프트를 이용해 이미지를 미세 조정하고 개선한다면 저작권으로 인정받을 수 있다는 사실을 알 수 있다”고 설명했습니다.

[그림 5] 일정부분 인공지능 창작에 대한 저작권을 인정 받은 만화 ‘여명의 자리야’ (출처: 크리스 카슈타노바 with 미드저니)

• 이미지네이션엔진의 특허 출원

인공지능 기업이 실질적인 소유권을 확보하도록 하는 움직임도 감지되고 있습니다. AI 다부스(Dabus, 발명 지식을 학습해 독자적인 창작 과정을 거쳐 발명하는 AI) 개발사인 이미지네이션 엔진(Imagination engine)은 한국, 미국, 중국, 유럽연합, 호주 등 16개국에서 AI 다부스 명의로 특허를 출원했습니다. 다부스가 개발한 발명품은 높은 열전도율에도 손으로 잡기 쉬운 식품 용기와 빛을 내는 램프인데요. 이미지네이션엔진은 해당 제품은 기업이 직접 개발한 것이 아닌 인공지능이 개발했음을 강조합니다. 인공지능을 이용한 사람이 아닌 인공지능 개발사가 발명가로 등재될 경우, 인공지능이 아무리 많은 이미지를 생성하더라도 인공지능 개발사가 이미지 자체에 대한 소유권을 주장할 수 있습니다.

저작권을 공개하자!

국가적 차원의 움직임도 있습니다. 유럽연합(EU)은 인공지능 배포 기업을 상대로 저작권을 공개하는 방안을 마련하기로 했습니다. 월스트리트저널에 따르면, 유럽연합은 해당 내용을 담은 인공지능 규제 법안 초안을 마련해 2023년 내 제정할 방침입니다. 유럽연합 집행위원회, 유럽 회의, 회원국 간 협의라는 단계가 있지만, 기존 강경 안에서 후퇴한 법안이므로 통과가 어렵지 않을 것이라는 전망입니다.

사실 유럽연합은 생성형 인공지능이 부상하기 2년 전부터 인공지능 규제 법안 마련에 나섰습니다. 일부 회원국은 저작권 사용 승인을 받지 못한 데이터로 학습된 인공지능은 배포되지 않도록 제한해야 한다고 주장했지만, 관련 정보를 투명하게 공개하는 선에서 초안이 마련됐습니다. 법안은 인공지능 모델에 대해 생체 감시, 잘못된 정보 유포, 차별적 언어 사용을 기준으로 최소(minimal) → 제한(limited) → 높음(high) → 수용불가(unacceptable) 등급을 부여하기로 했습니다. 특히 저작권이 있는 데이터를 학습했다면 이를 공개하는 것을 의무화하기로 했습니다.

스벤야 한 유럽의회 부의장은 “인공지능을 더욱 규제해야 한다는 보수적 관점과 과잉 규제가 아니냐는 지적까지 모두 아울렀다”며 “적절한 규제를 통해 권리를 보장하고 경기부양과 혁신을 장려하겠다”고 설명했습니다. 지금까지는 원작자들이 인공지능 회사가 자신의 데이터를 학습했는지 일일이 확인하기 어려웠는데요. 유럽연합은 인공지능 회사가 해당 내역을 공개하도록 만들 예정입니다. 월스트리트저널은 이에 대해 “저작권 침해 논란과 관련한 소송에 새로운 길을 열었다”고 평가했습니다.

일각에서는 법률적 논란을 없애려면 인공지능 개발사가 학습한 데이터에 대해 라이선스를 부여하고 원래 데이터 소유자에게 비용을 지불해야 한다고 주장하기도 하는데요. 그러나 초거대 인공지능에 투입되는 각각의 데이터마다 비용을 지불하는 것은 현실적으로 어려운 문제입니다.

앞으로도 인공지능이 만들어낼 창작물 소유에 대한 논쟁은 지속될 것으로 보입니다. 솔로몬의 지혜와 같은 명확한 결론이 날 수 있을지, 지켜봐야겠습니다.

글 ㅣ 이상덕 ㅣ 매일경제 실리콘밸리 특파원·<챗GPT 전쟁: 실리콘밸리는 지금 무엇을 준비하고 있는가> 저자

챗봇과 대화를 할 수 있어요