본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

데이터를 위한 데이터 – 메타데이터(Metadata)의 현재와 미래 –

2015.02.11

안녕하세요? LG CNS 대학생 기자단 최종호입니다.

최근, 생산되는 정보의 양이 급격하게 증가하면서, 필요한 정보를 알맞은 때에 정확하게 찾아내는 것이 중요해지고 있습니다. 정보 관리 시스템이 중요한 시대가 된 것이죠. 이렇듯 대용량 데이터 시대에 접어들면서 자주 접하게 되는 단어가 있는데요. 바로 ‘메타데이터(Metadata)’입니다.

메타데이터는 정보를 효과적으로 입수/조직/관리하기 위해 등장한 것으로, 인류의 역사와 함께 생성된 개념인데요. 요즘 디지털화된 정보가 폭발적으로 늘어나면서 새롭게 떠오르고 있습니다. 오늘은 이러한 메타데이터의 기능과 활용 사례 등을 함께 살펴보겠습니다.

메타데이터(Metadata)의 의미와 활용 사례

● 데이터에 대한 데이터(Data about data)

IT 시장 분석 기업인 가트너(Gartner)는 메타데이터(Metadata)를 ‘특정 정보 자산의 여러 측면을 기술하여 정보의 수명 주기 전반에 걸쳐 그 유용성을 개선하기 위한 정보’로 정의하고 있습니다. 조금 어렵게 느껴지시나요? 다른 말로 표현하면, 속성정보라고도 하는데요. 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터입니다. 즉, 메타데이터는 ‘데이터를 위한 데이터’로, 구조화된 정보를 분석/분류하고, 부가 정보를 추가하기 위해 데이터에 따라가는 정보를 말합니다. 결과적으로 정보를 자산으로 만들어 준다는 것이죠.

<데이터에 대한 데이터를 가지고 있는 디지털 콘텐츠>

예를 들어, 데이터에 대한 정보(메타데이터)는 다음과 같은 것이 있습니다. 파일 생성 날짜, 시간, 파일 생성의 지리적 위치, 작성자, 파일 수정 일자, 파일 크기 등이 바로 그것인데요. 이러한 메타데이터는 데이터 그 자체를 의미하지는 않습니다. 그리고 메타데이터 관리 시스템을 구축할 경우, 각 데이터베이스에 대한 상세 설명은 물론 데이터 유형, 보관 주기, 데이터 간의 연계성, 작업 흐름도 등을 효과적으로 관리할 수 있게 됩니다.

● 메타데이터(Metadata)의 다양한 활용 사례

효율적인 데이터 검색과 해석을 위해서는 메타데이터의 관리가 필수입니다. 예를 들어 구글(Google)은 전 세계에 있는 웹 페이지 정보(메타데이터)를 데이터베이스에 저장합니다. 이후, 일반 사용자들이 검색창에 어떤 단어를 검색하면, 구글 검색 엔진은 데이터베이스에서 단어와 연관된 메타 태그를 검색하는 것이죠. 이처럼 메타데이터는 웹 페이지뿐만 아니라 다양한 분야에서 활용되고 있는데요. 지금부터 함께 알아보겠습니다.

1) 디지털 음원 시장

<메타데이터 분석 기법을 활용한 음악 추천 방식, ‘아이튠즈(iTunes)’>

디지털 음원이 대중화되면서 메타데이터의 중요성 또한 가속화되고 있습니다. 메타데이터는 음원 시장의 기본 요소인데요. 단적으로 말해, 음원 공급자는 메타데이터가 없다면 매출을 만들어 낼 수 없습니다. 곡 제목, 음악가를 비롯해 음원에 담겨 있는 모든 정보를 품고 있는 것이 메타데이터이기 때문이죠. 그리고 음원 검색뿐만 아니라 이용자에게 새로운 음원을 추천할 때도 시스템은 메타데이터를 토대로 합니다. 최근에는 음원의 인기 여부 또한 메타데이터를 기반으로 판단하는데요. 차트와 이용자의 검색 패턴 등을 분석하면 예측이 가능합니다.

2) 차세대 스마트 방송

<메타데이터를 기반으로 한 ‘차세대 스마트 방송’>

차세대 스마트 방송의 핵심은 영상 콘텐츠에 포함된 메타데이터를 활용하는 것입니다. 시청자가 단순히 영상을 보고 끝내는 것이 아니라, 영상에 포함된 작품 정보, 상품 정보 등의 다양한 메타데이터를 통해 새로운 부가 가치를 만들어 내는 것이죠. 포털 사이트에서 소비되는 콘텐츠 대다수는 방송과 관련되어 있는데요. 방송에 출연한 배우가 입었던 옷, 상점, 여행지 등의 메타데이터를 추출하여, 애플리케이션 등 새로운 사업 모델을 만들어 내는 생태계로 진입하고 있습니다.

3) 소셜 네트워크

<메타데이터의 분화구, 소셜 네트워크>

사용자가 자발적으로 구축한 수많은 메타데이터를 통해, 효율적인 서비스를 제공하는 것이 소셜 플랫폼입니다. 사용자는 메시지를 주고받을 사진 또는 영상 등의 텍스트 만을 생성하는 것 같지만, 실제로는 사용자/내용/네트워크 구성에 대한 메타데이터 등 약 40여 개 이상의 데이터가 함께 기록됩니다. 그리고 이렇게 누적된 메타데이터의 활용도는 무궁무진하죠. 얼마 전, 사진 공유 사이트인 ‘플리커(Flickr)’는 약 1억 건의 이미지 메타데이터를 공개하면서, 인공 지능 연구에 청신호를 밝히기도 했습니다.

메타데이터(Metadata) 표준화의 필요성

지금까지 메타데이터의 의미와 활용 사례를 살펴보았습니다. 점점 더 중요해지고, 다양한 분야에서 활용되고 있는 메타데이터는 현재 다양한 분야의 표준화 위원회(ANSI, X3L8, ISO/IEC SC32)에서 개별적인 표준화를 위해 노력하고 있는데요. 이들은 표준의 대상/성격/목적에 따라 ‘데이터 요소 관련 표준’, ‘영역 중심 표준’, ‘네트워크 자원 기술’ 메타데이터로 분류할 수 있습니다.

앞서 설명했던 메타데이터의 활용 분야들의 지속적인 활성화를 위해서는 이처럼 메타데이터 관리 체계의 표준화가 선행되어야 하는데요. 표준화 작업은 외부 조직 간의 정보 호환성과 공유를 용이하게 하는 촉매제 역할도 해 줍니다. 따라서 국가/기업/과학 단체 간의 국제 교류가 향상되어야 하는 현실에서 이러한 활동은 매우 중요합니다.

<표준화를 선도하는 한국정보통신기술협회(TTA)>

지난해 6월, 한국정보통신기술협회 표준총회에서는 방송프로그램 유통 표준화를 추진하기 위한 방안을 내놓았습니다. 지금까지는 방송사마다 메타데이터 요소를 정의하는 방식과 분류 체계가 달랐는데요. 방송사와의 조율, 유통 메타데이터의 표준으로 프로그램, 회별 프로그램, 세그먼트, 유통 콘텐츠, 에센스 등 전체 47개 요소로 나뉘게 되었습니다. 그 결과 더욱 세분화된 검색이 가능하게 됐는데요. 즉, 사용자의 콘텐츠 장면 단위, 클립 단위, 세그먼트 소비가 수월해졌습니다.

콘텐츠 소비가 급증한 방송뿐만 아니라 모바일 헬스에 대한 관심 고조로 의료 분야 역시 표준화가 활발하게 진행되고 있는데요. 지난해 10월, 국내 의료 정보 모델 평가 표준 등 3종이 국제표준으로 채택되기도 하였습니다. 이는 의료 정보의 상호 연결을 강화하고, 호환성을 보장하는 척도가 될 것으로 기대하고 있습니다. 특히 ‘모바일 스마트 정보/의료 기기 발전 표준안’은 모바일 환경에서 의사와 환자 모두의 요구 사항을 손쉽게 교환할 수 있는 표준입니다. 이는 앞으로 의료 전달 체계의 효율성을 높여 줄 것으로 예상됩니다.

지금까지 메타데이터(Metadata)의 개념, 활용 분야, 표준화의 필요성에 대해 함께 알아보았습니다. 빅데이터 환경에서 수많은 데이터 간의 관계를 정의하는 것이 쉽지만은 않습니다. 그러므로, 단순한 정보 관리 시스템 마련에 그치지 말고, 메타데이터 체계 기반의 정보 시스템을 도입하여 우리가 관리해야 할 데이터나 비즈니스에 꼭 필요한 데이터를 정의하는 것에서부터 시작해야겠습니다.앞으로 메타데이터가 가치 있는 데이터 분석의 근간이 되고, 정보 시스템 기업 또는 단체의 핵심 경쟁력으로 자리 잡기를 기대해 봅니다.

챗봇과 대화를 할 수 있어요