최근 제조업과 정보통신기술(ICT)을 융합해 작업 경쟁력을 제고하는 4차 산업혁명이 주목받고 있습니다. 글로벌 경제의 저성장 기조와 생산성 하락으로 신성장 동력이 필요한 가운데 주요 국가들이 이러한 4차 산업혁명의 콘셉트를 기반으로 산업 경쟁력 강화 전략을 추진하고 있기 때문인데요.
이러한 4차 산업혁명의 핵심은 역시 빅데이터의 활용입니다. 따라서 국가와 공공기관에서 보유하고 있는 공공데이터의 개방은 선택이 아닌 필수이며, 각 부처•기관으로 모여드는 공공데이터를 기업과 개인에 제공해 공공데이터를 자유롭게 활용할 수 있도록 해야 혁신적인 비즈니스 모델이 나올 수 있다고 전문가들은 이야기하고 있습니다.
우리나라의 공공데이터 개방 현황
이러한 시대적 흐름에 따라 정부는 2013년부터 ‘정부 3.0’이라는 슬로건을 내세워 국민 생명•사생활 정보 등 일부를 제외한 공공데이터 개방을 본격화했습니다. 정부 발표에 의하면 올해 6월 기준 개방된 데이터 규모는 1만 6,550개로 2013년보다 3배 이상 늘어났으며 공공데이터 이용 건수도 2013년 대비 86배나 껑충 뛰었고, 공공데이터를 활용하는 기업체도 약 42만 개로 추정되는 등 공공데이터의 활용이 늘어나고 있다고 합니다.
실제로 대한민국의 공공데이터 개방은 세계적으로 우수한 수준으로 2015년 7월에 발표한 정부백서에 따르면 공공데이터 개방 점수 0.98점(1점 만점)을 받아 OECD 30개국 중 1위를 차지했다고 합니다.
국내에서 공공데이터 개방은 주요 도시를 중심으로 활발히 이루어지고 있는데요. 그 중 서울시가 가장 앞서나가고 있으며 활용도와 개방 규모 측면에서 가장 크다고 할 수 있습니다. 현재 서울시는 서울 열린 데이터 광장 웹사이트(http://data.seoul.go.kr)를 통해 일반행정, 문화 관광, 환경, 보건, 교통 등 10개의 유형으로 공공데이터를 분류하여 제공하고 있습니다.
필자가 조사한 바에 따르면 이러한 10개의 유형 중 2개의 분야(교통과 환경 분야)가 전체 공공데이터 이용량 중 약 80% 이상을 차지하고 있어, 공공데이터의 사용에도 파레토법칙(8:2 법칙)이 적용된다는 것을 알 수 있습니다.
국내에서 공공데이터의 가치를 측정하는 방법
그렇다면 이렇게 개방된 공공데이터의 가치를 돈으로 환산하면 얼마나 될까요?
공공데이터의 가치를 산출하는 것은 사실 매우 어려운 문제입니다. 기업처럼 매출액이 있다거나 개인의 노동력에 대한 소득처럼 어떠한 기준이 있다면 가치를 환산할 수 있겠지만, 공공데이터란 무료로 개방되는 형태가 일반적이기 때문에 경제적 가치를 환산할 금액적 기준이 없어 가치 평가가 상당히 어렵습니다. 현재까지 국내에서 진행된 연구를 토대로 정리해보면 크게 두 가지 방법으로 공공데이터의 경제적 가치를 측정하고 있습니다.
① 조건부가치평가법
첫번째는 조건부가치평가법(CV, Contingent Valuation)을 이용한 가치 측정 방법입니다. 이 방법은 설문조사의 결과를 토대로 공공데이터의 경제적 가치를 측정하는 방식을 택하고 있습니다. 설문조사 대상을 정하고 전체 대상을 대표할 수 있는 표본을 추출한 후에 표본에 포함된 각 개인이 느끼는 공공정보의 가치를 설문조사를 통하여 추정하는 방식입니다.
예를 들면 ‘당신이 교통정보를 제공받아 사용한다면 한 달에 얼마를 지불할 용의가 있습니까?’와 같은 질문을 통해 지불의사 추정액을 도출하는 것입니다.
실제로 버스나 지하철 도착시간과 같은 대중교통정보와 도로의 정체구간을 알 수 있는 교통정보는 현재 가장 널리 이용되는 공공데이터이며, 이용자들에게 매우 가치 있는 정보라고 할 수 있을 것입니다. 실제 CV 기법을 사용한 기존 연구 결과에 따르면 서울시를 분석 대상으로 하였을 경우 공공데이터의 경제적 효과는 약 1조~2조 원 정도로 추정되었습니다(양오석 외, 2012).
이 분석 방법은 경제적 가치를 도출하기 위해 마땅한 금액적 기준이 없는 공공데이터의 특성을 고려하였을 때 매우 유용한 방법이라 할 수 있습니다. 하지만 CV 분석 방법의 가장 큰 문제점은 응답자의 가상적 편의를 기반으로 가치를 도출하기 때문에 과대 추정의 문제가 발생할 수 있다는 것입니다.
다시 말해, 응답자가 제시하는 공공데이터의 지불의사 금액은 실제 자신이 지불하지 않는 가상적 금액이기 때문에 실제 상황에서 자신이 지불하게 될 의사 금액보다 과대평가하는 경향이 발생할 수 있다는 것입니다.
② 산업연관분석을 이용한 가치 측정 방법
두번째는 산업연관분석(input-output analysis 또는 inter-industry analysis)을 이용한 가치 측정 방법입니다. 이 방법에서는 공공정보가 민간에서 활용되어 1차적으로 DB 서비스 시장을 형성하고, DB 서비스 기업들에 의해 지식정보 서비스와 광고 서비스의 형태로 이용자들에게 제공되어 매출을 발생한다고 가정하는데요. 여기서 발생하는 매출이 산업 전반에 어느 정도의 영향을 미치고 있는지 분석하는 방식으로 공공데이터의 경제적 가치를 추정하고 있습니다.
예를 들어, 자동차를 생산하기 위해서는 엔진, 타이어 등 수많은 부품이 필요하고 그 엔진이나 타이어 등의 생산에는 다시 철강, 고무 등의 원재료가 투입되어야 합니다. 이와 같이 한 산업에서 생산된 상품이 다른 산업의 상품생산을 위한 원재료로 투입됨으로써 각 산업은 직•간접적으로 서로 밀접한 연관관계를 맺고 있는데요. 이러한 산업과 산업 간의 연관관계를 수량적으로 파악하고자 하는 분석 기법이 산업연관분석입니다.
이 때, 산업 부문이 해당 부문의 재화나 서비스 생산에 사용하기 위하여 다른 부문으로부터 구입한 원재료 및 연료 등의 중간 투입액을 총 투입액으로 나누어 산출하는 것을 투입계수라 하는데요. 일반적으로 이 투입계수는 금액 단위로 작성된 산업연관표에서 도출하여 사용합니다.
이 분석방법은 산업 전체를 포괄하면서 전체와 부분을 유기적으로 결합할 수 있으며, 재화나 서비스의 산업 간 순환을 포함하고 있기 때문에 구체적인 산업 경제구조를 분석하는데 유리하다는 장점이 있습니다.
하지만 공공데이터 가치를 추정하는데 사용될 경우 공공데이터 개방으로 인한 1차적 매출(투입 값)이 다르게 추정될 때마다 도출된 결과 값의 변화가 심해진다는 문제점이 있습니다.
실제로 기존 연구를 분석해보면 대한민국을 분석 대상으로 산업연관분석 방법을 통해 공공데이터의 경제적 파급효과를 추정한 서로 다른 두 연구의 결과 차이가 약 10배 이상 발생한 경우도 있었습니다.
해외에서 공공데이터의 가치를 측정하는 방법
그렇다면 이러한 문제점들을 보완할 수 있는 가치 측정 방법은 없을까요? 공공데이터 개방과 관련하여 선진국으로 평가받는 유럽에서는 개방된 공공데이터를 사용하여 매출을 발생시키는 기업들을 대상으로 기업가치들을 산출한 뒤 그 기업가치들의 합과 해당 산업에서 조사된 기업의 시장점유율을 고려하여 해당 공공데이터의 경제적 가치를 도출하고 있습니다.
이 방법은 실제 공공데이터를 이용하고 있는 사용자 중심의 가치 평가가 가능하다는 측면에서 매우 효과적인 방법이며 기업가치를 기준으로 공공데이터의 가치를 측정할 수 있기 때문에 금액 산출 과정에서 과대평가나 과소평가의 문제점을 어느 정도 해소할 수 있는 방법이라 할 수 있습니다.
하지만 이러한 분석 방법을 우리나라에 적용할 경우 주의해야 할 점은 국내에서 공공데이터를 이용하는 기업들의 대부분이 공식적인 매출이 없거나 기업가치를 산출할 있는 근거자료가 부족한 신생 스타트업 기업이라는 점입니다.
T맵을 통해 대중교통 정보 서비스를 제공하는 SK텔레콤이나, 얼마 전 카카오에 인수된 주차장 정보를 제공하는 파킹스퀘어 같은 몇몇 공공데이터 활용 기업을 제외하고는 명확한 기업가치를 산출할 수 없는 경우가 대부분입니다. 따라서 이러한 기업들의 가치를 평가할 수 있는 효과적인 방법을 찾을 수 있다면 지금까지의 공공데이터 가치 평가 방법보다 더욱 정확한 측정 결과를 도출할 수 있을 것이라 생각됩니다.
현재까지 연구된 바에 의하면 우리나라 공공데이터 개방으로 인한 경제적 가치는 약 1조에서 2조 원 사이로 추정되고 있습니다. 앞으로 공공데이터 개방이 더 활발해짐에 따라 이를 이용하여 경제적 이익을 발생시킬 수 있는 시장은 점점 더 증가할 것입니다.
이에 따라 자연스럽게 공공데이터의 경제적 가치 또한 커질 것입니다. 미래의 공공데이터의 경제적 가치가 얼마나 증가할지, 파킹스퀘어처럼 공공데이터를 활용해 수익을 창출하는 새로운 기업들이 또 얼마나 나타날지 기대가 됩니다.
글 | 안재준 교수 | 연세대학교 정보통계학과