우리는 일상 생활 속에서 메시지를 보내거나, 쇼핑을 하는 등 다양한 온라인 활동으로 ‘데이터’를 꾸준히 생산하고 있습니다. 미국의 시장정보 조사업체인 비주얼 캐피털 리스트에 의하면 올해 전 세계적으로 약 44ZB(1ZB = TB)의 데이터가 생성될 것으로 전망하였습니다. 2025년에는 하루 데이터 생산량이 무려 463EB(1EB =TB)에 이를 것이라고 합니다. 이렇게 방대한 양의 데이터를 ‘빅데이터’라고 합니다.
빅데이터를 잘 분석하면 현대 사회를 더욱 정확하게 예측하고 개인에 알맞은 맞춤형 정보를 제공할 수 있습니다. 예를 들어, 의류 브랜드에서 전 매장의 구매 로그 기록을 잘 분석하면 특정 바지를 구매하는 고객에게 함께 구매할 확률이 높은 상의를 추천해줄 수 있습니다. 또한, 구매율이 높은 의류들의 공통점을 추출하여 새로운 디자인에 적용할 수 있습니다.
하지만 빅데이터는 일반적인 방법으로 분석하기에 터무니없이 방대합니다. 그래서 전 세계 기업들은 많은 데이터를 학습할 수 있는 데이터 인공지능(Data AI)에 기대를 걸고 있습니다. 이번 시간에는 마케팅, 금융, 제약•바이오 산업에서 사용되는 Data AI를 소개하겠습니다.
마케팅 AI
● 아마존
아마존은 빅데이터를 잘 활용해 성장한 세계 최대 온라인 쇼핑몰입니다. 20여 년을 인공지능에 투자하고 연구하면서 그 어떤 기업보다 뛰어난 빅데이터 분석기술을 보유하고 있습니다. 그 중 대표적인 고객 맞춤 기술인 ‘아마존 퍼스널라이즈’에 대해 알아보겠습니다.
아마존은 ‘아마존 퍼스널라이즈’라는 기계 학습 개인화 추천 기술로 고객이 원하는 상품을 찾아줍니다. 소비자의 검색 기록, 장바구니 목록, 구매 이력 등의 정보를 바탕으로 소비자의 관심분야와 구매 성향을 파악하여 맞춤형 옵션을 보여줍니다.
소비자는 본인이 원하는 상품을 쉽고 빠르게 구매할 수 있어 타 쇼핑몰을 사용할 필요가 없어집니다. 롯데마트는 아마존 퍼서널라이즈를 사용해서 자체 모바일 앱 ‘M 쿠폰’에 개인 맞춤 상품 추천 서비스를 제공하고 있습니다.
이처럼 온•오프라인 구매 데이터에 기반한 기계 학습 모델 추천 상품은 고객의 관심을 끄는데 성공하여 전보다 2배 이상 높은 반응률을 보였습니다. (반응률: 실제 상품을 클릭해보거나 구매하는 등의 반응)
● 코카콜라
코카콜라는 IT 업계가 아님에도 불구하고 빅데이터의 중요성을 인지하고 이를 인공지능과 결합해 효율적인 운영을 하고 있습니다.
코카콜라의 페이스북 팔로워는 약 1억 500만 명, 트위터 팔로워는 약 3,500만 명입니다. 코카콜라는 어떤 고객이 음료를 어디에서 샀는지에 대한 SNS 글이 2초에 한 번씩 발생한다고 합니다. (2015년 기준)
코카콜라는 이를 분석하기 위해서 AI 이미지 인식 기술로 SNS에 올라온 음료 이미지(병뚜껑 번호, 페트병 사진) 등을 자동으로 수집해서 각 지역에서 잘 팔리는 제품 정보들을 분석했습니다.이에 기반한 맞춤형 인터넷 광고를 올린 결과, 기존 광고 대비 4배 높은 클릭률을 보였습니다.
코카콜라는 인공지능으로 새로운 제품을 개발하기도 합니다. 자유로운 조합이 가능한 음료 디스펜서를 배치한 뒤, 고객들이 어떤 조합으로 음료를 만드는지에 대한 정보를 수집했습니다. 이렇게 모은 정보를 기계 학습으로 분석했고, 선호도가 높았던 조합으로 ‘체리 스프라이트’를 개발해 출시했습니다.
금융 AI
온라인 금융 서비스가 활발해지면서 거래 기록, 은행 서비스 이용 기록 등의 데이터가 기하급수적으로 증가하고 있습니다. 온라인 거래 역시 증가하면서 그에 따른 사이버 공격과 부정 거래가 빈번해지고 복잡해지고 있습니다.
세계적으로 금융 기업들은 인공지능으로 문제점을 감지하고 거래를 중지시키는 자동화 시스템을 앞다투어 도입하고 있습니다. 또한 인공지능으로 몇 십 년간의 주식 시장 데이터를 분석해 고객에게 최적의 펀드 포트폴리오를 작성해 주는 서비스도 제공되기 시작했습니다.
● 이상 금융거래 시스템(Fraud Detection System – FDS)
이상 금융거래 시스템(FDS)은 전자 금융 거래 시 발생된 정보를 모아 분석해서 의심 거래라 판단할 시 거래를 차단하는 시스템입니다.
씨티은행은 2018년에 ‘Feedzai’라는 AI 플랫폼 기업과 협업해 FDS를 구축했습니다. Feedzai가 제공하는 OpenML Engine은 저장된 머신러닝 혹은 딥러닝 샘플 모델을 바탕으로 부정 거래를 감지하는 모델을 생성합니다. 씨티은행은 생성된 모델로 과거 거래 기록들을 학습해서 이상 패턴을 파악해 정상 거래와 부정 거래를 구분해냈습니다. 국내 은행 역시 FDS를 사용하고 있습니다.
● 금융 포트폴리오 추천
신한은행은 인공지능의 가능성을 보고 2019년에 신한AI라는 국내 금융업계 최초의 인공지능 전문 계열사를 설립했습니다. 신한AI의 인공지능 플랫폼 NEO 1.0은 과거 30년 치 금융 분야 정형 데이터 약 43만 개와 심리, 정책, 변수 등의 비정형 데이터 약 1,800만 개를 딥러닝으로 학습해서 시장을 예측합니다.
현재 NEO의 예측률은 87% 이상의 성과를 보이고 있습니다. 신한금융투자는 NEO를 바탕으로 ‘신한 NEO 펀드랩’과 ‘신한 BNPPSHAI NEO 펀드’를 출시했습니다. NEO AI 펀드랩은 NEO의 글로벌 펀드 평가 모델과 강화 학습 알고리즘을 바탕으로 펀드 포트폴리오에 투자해서 최적의 수익률을 추구하는 자문형 일임 운용 서비스입니다.
신한 BNPPSHAI NEO 펀드 역시 NEO의 자문을 통해서 글로벌 4개국의 주식과 채권, 금을 기초자산으로 투자하는 펀드입니다. 신한 AI는 현재 NEO 1.0을 발전시키고자 캐나다 인공지능 전문 업체 엘리먼트 AI와 협업해 고도화된 NEO 2.0을 개발하고 있습니다.
제약•바이오 AI
많은 시간과 비용이 필요한 신약 개발 분야에서도 빅데이터와 인공지능이 활용되고 있습니다. 제약•바이오에서의 인공지능은 크게 3가지 시스템이 있습니다.
- 질병 관련 문서 및 논문 수집
- 바이러스의 구조와 DNA 분석•연구
- 각종 약물의 적합성 분석
● 코로나19
코로나19(COVID-19)는 작년 12월부터 지금까지 수많은 사람들을 감염시키고 있습니다. 많은 제약 개발사들이 인공지능을 활용해 이 상황을 이겨내고자 노력하고 있습니다. 영국 엔사이언티아는 미국 캘리포니아의 스크립스 연구소가 보유하고 있는 약 1,400종의 약물을 분석해 신약 임상 실험을 하고 있습니다.
영국 케임브리지의 힐스(Healx)는 예전 희귀병 치료제 개발에 쓰였던 자사의 인공지능 시스템을 이용해 치료제 개발을 하고 있습니다. 힐스의 제약 개발자 데이비드 브라운 박사에 의하면 코로나19는 단 한 종의 약물로 치료될 가능성이 극히 낮다고 합니다. 그렇기에 인공지능의 빠른 분석력으로 신약 개발에 힘써야 한다고 언급했습니다.
인공지능 덕분에 1년 걸릴 서류 조사가 단 몇 주 만에 완료되었고 현재 약 4,000개의 상용 약물을 조합하는 실험을 진행하고 있습니다. 한국과 미국 과학자들도 딥러닝을 이용해 시판 중인 항바이러스 약물을 분석해 에이즈 치료에 사용되는 아타자르비르가 코로나19에 효과가 있음을 찾아내었습니다.
● 국내 제약•바이오 기업
인공지능으로 개발 비용과 기간을 모두 낮출 수 있다는 것은 이미 많은 사례로 증명이 되었습니다. 이에 국내 제약•바이오 업계 역시 빅데이터와 인공지능을 적극적으로 사용하려는 움직임을 보이고 있습니다.
CJ헬스케어는 AI 기반 신약 개발 기업 스탠다임과 항암 신약을 개발하고 있습니다. 스탠다임은 ‘스탠다임 인사이트’라 하는 인공지능 기반 신약 적응 과정 및 작용기전 예측 플랫폼을 보유하고 있습니다. 스탠다임은 이 플랫폼을 활용해 새로운 화합물 구조를 찾고, CJ헬스케어는 합성과 평가를 하는 과정을 반복하면서 2021년까지 항암에 적합한 후보물질을 찾아내는 것을 목표하고 있습니다.
SK바이오팜은 2019년에 인공지능 기반 신약 개발 회사 투자아(twoXAR)와 비소세포폐암 치료 신약 개발 위한 공동 연구 계약을 체결했습니다. 비소세포폐암은 전 세계 폐암 환자 중 84%를 차지하고 5년간 생존율이 24%인 암입니다.
투자아는 방대한 약품 데이터를 바탕으로 한 AI 기반 플랫폼을 보유하고 있습니다. 투자아는 플랫폼으로 폐암 치료 가능성이 높은 신약 후보물질을 발굴할 예정입니다. 이후 SK바이오팜은 인공지능 약물 설계 플랫폼을 통해 최적화 작업, 약효 및 안정성 검증을 진행할 계획입니다.
지금까지 마케팅, 금융, 제약•바이오 분야들의 다양한 데이터에 AI를 적용한 각종 사례들을 살펴보았습니다. 아직까지도 실제로 분석에 쓰이는 데이터는 아주 적다고 하는데요, IDC에 의하면 전 세계의 37% 데이터만 분석에 유용하다고 합니다. 하지만 오늘 소개한 사례처럼 37%의 극히 일부분인 데이터만으로도 새롭고 강력한 비즈니스 가치가 있음을 알 수 있습니다.
앞으로도 데이터 생산량은 더욱 증가할 것이며, 더 많은 기업들이 인공지능에 투자할 것입니다. 우리도 이에 맞춰 AI 기술에 대한 꾸준한 연구와 이를 활용한 새로운 아이디어를 찾아야 합니다.
글 l LG CNS AI빅데이터연구소
[참고 자료]
- https://www.visualcapitalist.com/how-much-data-is-generated-each-day/
- https://techneedle.com/archives/38374
- https://aws.amazon.com/ko/blogs/korea/amazon-personalize-is-now-generally-available/
- https://aws.amazon.com/ko/blogs/korea/amazon-personalize-seoul-region/
- http://4ir.yonsei.ac.kr/?p=572
- https://bernardmarr.com/default.asp?contentID=1171
- https://www.citibank.com/tts/about/press/2018/2018-1219.html
- https://feedzai.com/press-releases/feedzai-launches-openml-an-open-machine-learning-engine-to-fight-fraud/
- https://emerj.com/ai-sector-overviews/ai-at-citi/
- http://www.fortunekorea.co.kr/news/articleView.html?idxno=12201
- https://www.kbanker.co.kr/news/articleView.html?idxno=89280
- https://www.bbc.com/korean/news-52340265
- http://www.aitimes.kr/news/articleView.html?idxno=14940
- https://www.skbp.com/kor/news/view.do?boardCode=BDCD0002&boardSeq=427¤tPage=1&search=%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5
- https://www.cancer.net/cancer-types/lung-cancer-non-small-cell/statistics
- https://techjury.net/blog/big-data-statistics/#gref