문의하기

Assets

고객 스토리
분석가 중심의 자동화된 분석 환경 제공하는  LG U+ Data Lake
# Cloud
# 통신 미디어
2023.11.24
LG CNS와 함께한 LG유플러스의 분석가 중심으로 자동화된 분석 환경
LG유플러스는 이동통신사업과 초고속 인터넷, VoIP(데이터 음성통화), IPTV 서비스로 구성된 결합 서비스와 각종 솔루션 및 데이터 서비스 사업을 꾸준히 발전시켜 왔으며 2012년에는 세계 최초로 LTE 전국망을 구축해 초고속, 고품질 서비스를 제공하고 있습니다.
LG유플러스는 사업에 필요한 데이터 분석을 효율적으로 하기 위해 LG CNS와 함께 Google Cloud를 도입하였습니다. 이를 통해 데이터부터 분석모형의 라이플사이클이 끝날때까지, 분석가의 분석환경을 이용하는 편의성이 높아지고, 분석모형 개발에서 운영배포까지 기술부서의 개입을 최소화하여 분석 리드 타임을 최소화시키는 분석가 중심의 자동화된 분석 환경이 구축 되었습니다.
 

Pain Point : 온프레미스 기반 환경의 확장성·배포 지연 문제

 

온프레미스 기반의 기존 하둡은 일반사용자와 분석가들이 사용할 분석 환경을 제공하는데 있어 확장성과 유연성이 부족하여 늘어나는 사용자들을 감당하기 어려워졌으며, 이로 인해 분석 환경을 제공받기 위해 1달 이상을 기다려야하는 일이 빈번하게 발생하였습니다.
또한, 분석가들이 개발한 분석 모형을 운영에 배포하기 위해서는 운영자에게 배포를 요청하는 형태였으나 개발을 진행한 샌드박스와 배포되는 운영환경이 서로 달라서 많은 문제가 발생하였고 이를 수정해서 다시 배포하는 과정에서 평균적으로 한달, 최대 세달까지 소요되었습니다.
 
 

Solution : GCP BigQuery로 확장·자동화 분석환경 구축

 

기존 분석환경인 하둡의 워크로드 및 분석환경을 대체할 수 있는 서비스로 GCP의 BigQuery를 선정하였습니다. 기존의 핵심적인 워크로드를 중심으로 GCP BigQuery에서 PoC를 진행하여 필요한 인프라 자원(BigQuery의 Slot)을 assessment하였습니다. 분석에 필요한 다양한 데이터에 대해 유형별로 데이터 파이프라인을 구축하여 Data Lake에 적재 후 자동으로 전처리를 하였습니다. 분석가들은 자기 주도적으로 필요한 분석환경(샌드박스) 및 필요한 데이터를 제공받아 분석에 활용하였으며, 분석이 완료된 후에도 자기 주도적으로 테스트 및 운영환경에 배포 할 수 있습니다. 또한 BigQuery WLM기능을 통해 업무에 맞는 최적의 자원 효율화를 하였습니다.
 
 

Change : 변화된 분석환경으로 리드타임 단축 및 비용절감

 

정량적으로는 분석환경 제공에 기존 한달에서 1시간으로 리드타임이 대폭 감소하였고, 분석 모델을 운영에 배포하는데 있어서도 기존 최장 3개월에서 1일로 감소하였습니다.
분석환경 제공에 한달이 줄었다는 것은 분석 프로젝트의 기간이 한달이 줄어든다는 것이고 이는 결국 분석가 투입 공수가 3~4MM 정도 감소하기 때문에 연간 진행되는 전체 분석 프로젝트 수를 감안할 때 비용 절감에 큰 도움이 될 것으로 예상됩니다. 또한 분석가가 필요로 하는 최신 라이브러리를 제공하는데 있어 기존에는 운영자에 의한 수작업 설치 및 확인하는데 최대 수개월 소요되던 것에서 1일 수준으로 빨라졌습니다.
데이터 레이크를 통한 분석환경 변화로 업무 생산성을 향상시킨 고객의 경험
관련 스토리
최상위로 이동