지난 해 대형 카드사의 1억 건이 넘는 고객 정보가 유출된 사건을 기억하시나요? 이 사건으로 많은 카드 소유자들이 결제 서비스에 대해 불안감과 불신을 갖게 되었죠. 실제로 전세계 카드 사고 통계를 보면 2013년 약 10조원이 넘는 피해액이 발생하여, 전체 카드 승인액의 약 0.05%을 차지하였습니다. 특히 카드 결제 사고는 매년 약 17%로 가파르게 증가하고 있으며, 신용결제 사용율이 높은 우리나라의 경우 카드 결제 사고의 위험성은 더 높습니다.
이런 배경 아래 금융감독원에서도 카드사는 물론 PG(Payment Gateway)업체에도 금융거래 탐지 시스템(Fraud Detection System, 이하 FDS) 구축을 권고하고 있어, FDS는 결제 시스템의 필수적인 요소가 되었습니다. 안전한 결제를 위한 결제 FDS, 이번 시간에는 결제 FDS가 무엇인지 그리고 빅데이터 기술이 FDS에 어떻게 활용되는지 설명 드리겠습니다.
카드 결제 사고 유형과 원인
결제 FDS에 대해 본격적인 설명을 드리기에 앞서, 결제 사고의 유형과 원인에 대해 알아보겠습니다. 정상적인 결제는 인증과 승인 프로세스를 거쳐 이루어집니다. 결제 사기범이 유출된 실제 카드소유자의 인증정보를 이용하여 인증 시스템을 통과할 경우, 결제 사고가 발생하게 됩니다.
인증정보가 유출되는 경로는 카드 분실이나 도난, 스키밍(Skimming), 파밍(Pharming) 등 다양합니다. 인증정보가 유출되면 분실, 사고 신고를 하지 않는 이상, 인증 시스템에서는 결제 사고를 막지 못합니다. 따라서 대부분의 카드사는 위와 같은 사고를 막기 위해 결제 FDS를 개발하여 운영하고 있습니다.
결제 FDS, 결제 사고를 막는다
그럼 결제 FDS는 어떻게 사고를 막을 수 있는 것일까요? 결제 FDS는 아래의 그림과 같이 결제정보를 이용해 해당 결제의 사고 여부를 추정합니다. 추정 결과는 승인시스템과 운영시스템에 전송됩니다. 사고로 추정되는 결제의 경우, 이중 인증을 요구하거나 모니터링 인원에 의해 본인 확인을 하는 등 적절한 조치가 취해집니다.
한편 결제 FDS의 성능은 일반적으로 변별력과 처리속도로 평가됩니다. 변별력이란 사고를 정상에서 분류해 내는 성능을 의미하며, 이를 나타내는 지표로 민감도(sensitivity)와 정밀도(precision)가 주로 사용됩니다. 민감도는 전체 사고 건 중 FDS가 적발한 사고의 비율을, 정밀도는 FDS가 추정한 사고 건 중 실제 사고의 비율을 의미하며, 두 지표가 높을수록 결제 FDS는 변별력이 좋은 것으로 평가됩니다. 처리속도는 초당 처리 가능한 결제 건수로 표현되며 이 때 시스템의 요건 이상의 처리속도가 필요합니다.
빅데이터 분석으로 FDS를 더 스마트하게
결제 FDS의 사고를 분류하는 알고리즘은 데이터 분석을 통해 룰(Rule)이나 모형(Model)의 형태로 개발됩니다. 룰은 해당 결제 건이 특정 조건에 해당될 경우 사고로 추정하고, 반대의 경우는 정상 승인건으로 간주합니다. 반면 모형은 해당 결제 건이 사고일 확률을 계산하여 연속적인 값으로 해당 결제 건의 위험도를 나타냅니다. 룰과 모형은 각각의 장단점이 분명히 있으나, 최근에는 FDS의 성능 향상을 위해서 모형 개발을 통해 FDS를 고도화 하고 있는 추세입니다.
일반적으로 전체 신용카드 결제에서 사고가 발생하는 비율은 0.001% 미만으로 아주 미미합니다. 따라서 결제 FDS가 사고 결제를 정확하게 분류해 내는 것은 해변에서 바늘을 찾는 것만큼 어려운 일입니다. 이 때문에 정상 결제를 사고 결제로 잘못 인식하는 비율이 높습니다.
하지만 사고로 잘못 인식할 경우 모니터링 비용의 비효율적인 증가는 물론, 사용자의 편의성을 저해하기 때문에 사고 오인식율을 최소화하는 것이 중요합니다. 그래서 최근에는 모형 개발에 빅데이터 분석 기술을 적용하여 FDS의 민감도와 정밀도를 최적화하고 있는데요. 일반적으로 모형 개발은 아래와 같은 프로세스로 이루어집니다.
사고시나리오정의 > 데이터수집 및 전처리 > 데이터분석 및 Factor추출 > 모형개발 > 모형검증 및 운영
사고시나리오정의
사고를 찾아내기 위해서는 사고가 발생하는 패턴이나 원인을 아는 것이 중요합니다. 따라서 사고 시나리오 단계에서는 기존에 발생한 사고의 패턴을 분석하거나 결제 프로세스 상의 취약점을 찾아내어 사고 시나리오를 정의합니다. 모형의 전체 프레임을 만드는 것으로 비유될 만큼 사고 시나리오는 모형의 성능을 좌우하는 가장 중요한 요소입니다.
데이터수집 및 전처리
사고 시나리오는 데이터를 통해 모형으로 개발이 됩니다. 따라서 사고 시나리오에 관련된 데이터를 수집하고 가공하는 과정이 필요한데요. 동일한 포맷과 단위로 변환하는 등 데이터 분석에 필요한 형태로 데이터를 가공하게 됩니다.
모형개발
모형은 앞서 추출된 Factor를 이용해 사고와 정상승인을 분류하는 알고리즘으로 기계학습(machine learning)을 통해 개발됩니다. 기계학습은 데이터의 패턴을 학습하는 알고리즘으로 결제 FDS의 경우 지도 학습 알고리즘(Supervised machine learning)이 사용됩니다. 또한 일반적으로 결제 FDS에 적용되는 기계학습 알고리즘으로는 Decision tree, Logit regression, Neural network 등이 있습니다. 때로는 앙상블 모형(ensemble-model)을 통해 다양한 알고리즘을 혼합하여 모형을 최적화하기도 합니다.
모형검증 및 운영
개발된 모형은 검증 데이터 셋을 이용해 모형의 성능을 평가•검증합니다. 모형의 변별력은 민감도, 정밀도, K-S factor 등의 지표를 이용해 평가할 수 있습니다. 모형 개발 시 성능에 비해 현저히 떨어질 경우 오버 피팅 문제가 발생한 것으로 볼 수 있어 다시 위의 과정을 되풀이하기도 합니다. 한편 모형의 안정성은 PSI(Population Stability Index)와 같은 지표를 사용하여 수시로 모형의 적절성 여부를 판단합니다.
빅데이터 기술로 FDS를 더 빠르게
결제 FDS는 대용량의 결제정보를 실시간으로 처리할 수 있는 시스템이 필요합니다. 따라서 최근에는 빅데이터 시스템을 FDS 시스템에 적용하여 실시간으로 결제정보를 처리하고 있습니다. FDS 시스템은 실시간 처리 시스템과 프로파일링 데이터 시스템으로 구성됩니다.
결제 FDS는 실시간 처리 시스템과 데이터 프로파일링 시스템으로 구성되어 있습니다. 실시간 처리 시스템은 승인 시스템으로부터 결제 정보를 받아, 해당 결제 건에 대한 사고를 추정하고 이를 운영 시스템에 송신하는 기능을 수행합니다. 반면 데이터 프로파일링 시스템은 통계 분석을 통해 실시간 처리 시스템에서 사용되는 프로파일 데이터를 제공합니다.
실시간 처리 시스템
실시간 처리 시스템은 큐잉(Queuing) 시스템과 스트림(Stream) 처리 시스템, 그리고 룰•모형 엔진으로 구성됩니다. 큐잉 시스템은 승인시스템을 비롯한 외부 시스템으로부터 데이터를 송수신하는 기능을 담당하며 Kafka, RabbitMQ 등의 기술이 사용됩니다. 스트림 처리 시스템은 데이터를 분해 및 연산을 처리하며 주로 Storm, Spark 기술이 널리 사용되고 있습니다. 마지막으로 룰•모형 엔진은 결제에 대해 사고 여부를 추정하는 알고리즘을 수행하며 Drools나 Siddhi와 같은 기술이 적용되고 있습니다.
데이터 프로파일링 시스템
데이터 프로파일링 시스템은 통계•분석 시스템을 이용해 룰•모형 엔진의 연산에 필요한 데이터베이스를 배치로 생성하는 시스템인데요. 다양한 데이터 원천으로부터 통계•분석 작업을 수행하기 때문에 대용량의 데이터를 처리할 수 있어야 합니다. R, SAS 등 기존 통계•분석 툴이나 SRA와 같은 분산처리를 지원하는 통계•분석 솔루션을 사용합니다.
LG CNS, 빅데이터로 더 편리하고 안전한 결제를 만들다
지금까지 결제 FDS에 대해 알아보았습니다. 최근 간편결제의 등장과 함께 결제 FDS는 결제 시스템의 필수적인 요소로 자리매김하며 성능 개선이 요구되고 있는데요. 이에 따라 카카오페이 간편결제 서비스를 제공 중인 LG CNS에서는 결제 FDS에 빅데이터 기술을 적용하여 보다 빠르고 스마트한 결제 FDS를 개발하고 있습니다.
특히 실시간 처리 지원이 불가능했던 기존 FDS의 문제점을 해결하고자 LG CNS Big-Data solution suite의 Event Pro와 SRA(Smart R Analytics)를 적용하여 결제 FDS의 성능 향상을 위해 노력하고 있습니다. Event Pro는 결제정보를 받아 실시간 FDS 룰•모형 연산을 통해 실시간 처리를 가능하게 하며, SRA는 대용량의 데이터를 분석할 수 있는 솔루션으로 데이터 프로파일링에 사용될 수 있습니다.
지금까지 결제 FDS의 원리와 더 편리하고 안전한 결제를 위한 빅데이터 적용 사례를 살펴보았습니다. 카카오페이를 통해 편리한 간편결제 서비스를 제공하는 LG CNS는 결제 FDS를 통해 앞으로도 안전한 간편결제를 지속적으로 제공해 나가겠습니다.
글 ㅣ LG CNS 빅데이터 분석컨설팅팀