본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

‘음성인식’ 개인 비서 서비스 삼국지 ! – MS ‘코타나(Cortana)’는 애플 ‘시리(Siri)’와 구글 나우'(Now)’를 뛰어 넘을 수 있을까 –

2015.03.11

최근, 마이크로 소프트(MS)가 윈도우(Windows) 10 이벤트를 통해 많은 것들을 선보였습니다. 차세대 OS라 불리는 윈도우 10의 기능들, 플랫폼과의 통합, 홀로렌즈(Holo Lens)와 같은 윈도우 10 기반 디바이스들이 바로 그것입니다. 또한 마이크로 소프트는 데스크톱, 태블릿 PC, 스마트폰, 사물인터넷(IoT) 등에서 사용하는 OS를 모두 윈도우 10으로 통합시키겠다고 밝혔습니다.

뿐만 아니라 함께 제공되는 서비스들도 서로 연계하고, 머신런닝(Machine Learning) 등의 기능을 포함시켜 보완해 나가는 모습을 보여 주겠다고 말했습니다. 그리고 그 중에서 눈에 띄는 것이 있으니, 바로 개인 비서 서비스 ‘코타나(Cortana)’입니다.

오늘은 코타나의 발표와 함께 다시 주목 받기 시작한 음성 인식 기반 개인 비서 서비스에 대해 함께 살펴보겠습니다.

● 이제는 ‘터치’가 아닌 ‘음성’으로!: http://blog.lgcns.com/711

스마트폰 개인 비서 서비스의 본격적인 시작, 애플의 ‘시리(Siri)’

<애플의 ‘시리(Siri)’ (출처: www.apple.com/kr)>

스마트폰 개인 비서 서비스라고 하면 가장 먼저 떠오르는 단어는 바로, 애플의 ‘시리(Siri)’입니다. 시리는 아이폰(iPhone)과 아이패드(iPad) 등 iOS를 사용하는 애플의 스마트 디바이스에 탑재되어 있는 음성인식 기반 개인 비서 서비스인데요. 사용자가 음성으로 명령을 내리면, 그 명령을 해석하고 스마트 기기에 설치된 앱을 이용해 검색을 합니다. 그리고 그 결과를 보여 주거나 앱을 실행시켜 주는 것이죠. 앞으로 소개할 구글의 ‘나우(Now)’나 마이크로 소프트의 ‘코타나(Cortana)’ 역시 ‘시리’로부터 파생된 서비스라고 보시면 됩니다.

과거 검색 솔루션의 화두는 자연어 검색이었는데요. 글로 이루어진 자연어 검색을 음성으로 옮기고, 검색할 뿐만 아니라 앱의 실행까지 가능하게 한 것이 바로, ‘시리’이죠. 따라서, 시리를 통해 전화번호를 찾고, 찾은 번호로 전화를 걸고, 문자까지 보낼 수 있는 것입니다.

그리고, 미리 알림 등을 등록해 두면, 시리가 시간에 맞춰 그 내용을 알려 주기도 하는데요. 이 부분은 음성인식 기반의 검색이라기 보다는 알림 서비스에 가깝지만, 개인 비서 서비스에는 꼭 필요한 기능입니다. 운전 중 네비게이션 음성 조작도 매우 유용한 기능 중 하나이죠. 즉 시리는 음성 인식을 기반으로 그 명령을 실행하는 개인 비서의 역할을 아이폰이나 아이패드와 같은 스마트 디바이스에서 충실히 구현하고 있는 서비스라고 할 수 있습니다.

사용자의 사용 패턴을 인지하고 정보를 제공한다, 구글의 ‘나우(Now)’

<구글의 ‘나우(NoW)’ (출처: https://www.google.com/landing/now)>

애플의 시리에 자극을 받아 구글이 내놓은 서비스는 바로 ‘나우(NoW)’입니다. 구글은 나우를 발표하면서 2가지 방식의 개인 비서 서비스 형태를 제시했습니다. ‘나우 자체의 서비스 방식’과 구글의 음성 인식 기능과 결합한 ‘음성 명령 개인 비서 서비스’ 방식입니다.

첫째, ‘나우 자체 서비스 방식’은 명령을 내리기도 전에 사용자의 행동을 미리 파악한 다음, 예상되는 결과를 카드 형식으로 보여줍니다. 명령에 대한 결과를 보여 주는 애플의 ‘시리’와 차이점이죠.

안드로이드나 iOS에 구글 나우를 설치해서 사용해 보면, 회사나 자신이 자주 가는 음식점에서 집까지 가는 방법(버스 노선도, 시간 등)을 미리 알려 줍니다. 뿐만 아니라 해외 여행을 가는 경우, 여행지의 환율 정보가 자동으로 나타나는 것을 볼 수 있습니다. 이는 구글이 검색 패턴 및 위치 정보, 구글 서비스 사용 패턴과 함께 안드로이드 앱 사용 패턴 등을 분석하여 미리 보여 주는 방식을 사용하기 때문입니다.

둘째, ‘음성 명령 기반 개인 비서 서비스’는 구글 음성 인식 기능을 통해 명령을 받으면, 그 결과를 구글 나우의 형태로 보여 주는 것입니다. 검색뿐만 아니라 앱 실행, 전화번호 찾기, 전화 걸기 등 애플의 시리가 제공하는 대부분의 기능들을 다 구현한 것이죠. 차이점이 있다면, 시리는 농담에 유연하게 대처하는 능력까지 있지만, 나우는 농담조차도 검색하려고 하는 경향이 있다는 것입니다. 그래서 ‘인간미 없는 구글 나우’라는 이야기를 종종 듣기도 합니다.

정리해 보면, 시리가 개인 비서 역할에 충실하다면, 나우는 ‘개인 컨설턴트 역할’까지 함께 겸하고 있다고 볼 수 있습니다. 물론 시리도 미리 등록된 알림 내용을 알려 주기는 하지만, 나우가 보여 주는 위치 정보 기반 검색 및 사용 패턴 정보 기반의 정보 제공과는 조금 방향이 다르기 때문입니다.

또한 개인 비서 서비스의 질은 애플의 시리가 상대적으로 앞선다는 평가를 받고 있는 것도 사실인데요. 최근 구글은 구글 나우에 구글 서비스 이외의 서드파티(Third Party) 서비스까지 참여할 수 있도록 개방하겠다고 발표했습니다. 따라서, 앞으로 구글 나우가 제공하는 서비스의 폭이 훨씬 더 넓어질 것으로 예상됩니다만, 시리와 나우 중 어느 쪽이 더 유용한 개인 비서 서비스가 될 것인지는 조금 더 지켜봐야 할 것 같습니다.

‘시리(Siri)’와 닮은꼴에 ‘나우(Now)’의 장점을 더하다, 마이크로 소프트의 ‘코타나(Cortana)’

앞서, 애플의 ‘시리(Siri)’, 구글의 ‘나우(Now)’를 살펴보았는데요. 시리와 닮은꼴에 나우의 장점을 더했다고 알려진 마이크로 소프트의 ‘코타나(Cortana)’는 어떤 기능이 있을까요?

<마이크로 소프트의 ‘코타나(Cortana)’
(출처: http://www.microsoft.com/en-us/mobile/campaign-cortana)>

코타나는 Windows Phone 8.1부터 탑재를 시작한 마이크로 소프트의 개인 비서 서비스입니다. 처음 코타나가 발표되었을 때는 사람들의 눈길을 끌지 못했습니다. 마이크로 소프트의 모바일 시장에서의 위치, Windows Phone의 위상 등 여러 가지 이유 때문이었죠.

그런데, 이번에 윈도우 10이 발표되면서 코타나가 주목을 받고 있습니다. 기존에는 모바일에만 적용되었던 것이 데스크톱까지 그 영역을 확장했기 때문인데요. 이는 구글이 구글 나우를 데스크톱용 크롬 웹 브라우저까지 확대시킨 것에 대한 대응 방안이라고 보여집니다. 반면 애플은 아직 시리를 Mac OS X까지 확장시키지는 못했습니다. 그러나, 곧 시리 역시 확장될 것으로 예상되고 있습니다.

코타나에 대해 더 자세히 살펴보면, 기본적으로는 애플의 시리와 같은 콘셉트입니다. 음성 명령을 받으면 그 명령을 해석하고, 실행하는 방식으로 되어 있죠. 시리처럼 농담을 건네도 능숙하게 잘 받아서 대응도 해 줍니다. 그러나 검색할 때 애플의 시리가 ‘사파리’에서 제공하는 기본 검색 엔진을 이용한다면, 코타나는 마이크로 소프트 검색 엔진인 ‘빙(Bing)’을 이용합니다.

그리고 조금씩 다른 의견이 있지만, 음성의 인식과 해석 능력은 전체적으로 코타나가 상대적으로 앞서 있다는 평가입니다. 같은 명령을 내렸을 때, 코타나가 조금 더 자연스럽게 반응한다고 많은 언론들이 리뷰를 통해서 공개하고 있기 때문이죠.

이는 물론 해석 엔진의 차이일 수도 있는데요. 마이크로 소프트는 자사의 클라우드 엔진인 ‘애저(Azure)’를 통해 수많은 음성 인식 데이터들을 보유하고, 그것들을 분석하면서 조금 더 자연스럽게 해석하는 머신런닝(Machine Learning) 기능을 실행하고 있습니다. 그 결과가 코타나에 적용되어 차이를 나타낸다고 보면 될 것 같습니다.

또한, 애플 역시 자사의 방대한 음성인식 데이터베이스를 이용하지만, 대용량 데이터 처리 기술에 있어서는 마이크로 소프트가 애플보다 상대적으로 앞서 있기 때문에 차이가 나타나는 것 같습니다. 구글도 이 분야에 있어서는 막강한 능력을 보유하고 있지만, 콘셉트가 다르기 때문에 서로 비교하기는 좀 애매합니다.

코타나는 윈도우 10의 데스크톱 버전으로 들어가면서 검색 범위가 확장되었습니다. 데스크톱 버전으로 확장한 이유는 간단한데요. 윈도 태블릿 PC에 들어가는 윈도우 버전이 윈도우 10 데스크톱 버전이기 때문입니다. 윈도우 8부터 태블릿 PC 시장에서 윈도 태블릿 PC가 강세를 보이고 있는데요. 그 시장의 확장으로 윈도우 10까지 생각한다면 당연한 수순이라는 생각이 듭니다.

앞서 구글이 구글 나우를 크롬 데스크톱 버전에 적용시킴으로 구글 나우의 영역을 모바일에서 데스크톱 영역까지 확장시킨 것에 대한 MS의 대응책이라고 생각할 수 있습니다.

애플의 시리와 같은 콘셉트이지만, 구글의 나우가 가고자 하는 길까지 함께 아우르려는 코타나의 행보는, 앞으로 애플과 구글을 자극할 요소가 될 것으로 보입니다.

지금까지 음성 인식을 기반으로 한 개인 비서 서비스인 애플의 ‘시리(Siri)’, 구글의 ‘나우(Now)’, 마이크로 소프트의 ‘코타나(Cortana)’에 대해 알아보았습니다.

사실 이러한 음성 인식 기반 개인 비서 서비스는 국내에서도 아주 오래 전에 이미 출시되었습니다. SK 하이닉스의 전신인 현대전자에서 만든 ‘걸리버’가 바로 그것인데요. 한 유명 연예인이 광고 모델로 나와, 자동차 안에서 ‘우리집’이라고 이야기하면, 집으로 전화를 걸어 주는 기능을 보여 주었습니다.

지금 생각해 보면, 초보적인 기술이고, 조금 우습기도 하지만 그 당시에는 매우 획기적인 기술이었죠. 그 기술을 잘 발전시켰다면, 우리나라에도 위에서 소개한 서비스들 못지 않은 음성 인식 기반 개인 비서 서비스가 나올 수 있지 않았을까요?

글 l 이학준 (http://poem23.com/ 필명: ‘학주니’)

챗봇과 대화를 할 수 있어요