운영자 관점에서 바라본 챗봇의 현재 모습

앞선 연재에서는 지능형 챗봇에 대한 역할과 미래, 적용 분야와 도입 절차에 대해 살펴보았습니다. 이번 연재에서는 실제 기업 챗봇을 관리하는 운영자 관점에서 바라본 챗봇의 현재 모습을 이야기해 보도록 하겠습니다.

잘 대답하고 있는가?

잘 대답하고 있는지에 대한 답을 하려면 챗봇에 기대하는 목표 설정에 대한 이해가 선행되어야 합니다. 감정 교류는 물론이고 지능까지 인간 수준을 뛰어넘는 SF영화 속 인간형상의 로봇이나 ‘바둑의 신’ 커제에게 승리한 인공지능 ‘알파고’(AlphaGo)를 연상하며 챗봇에 접근한다면 분명 큰 실망을 안고 돌아설지도 모르겠습니다.

전편에 언급된 기술 성장주기를 표현한 가트너의 하이프(hype)개론에 의하면 하이프 사이클에서도 챗봇의 중심 기술인 자연어 응답 기술은 부풀려진 기대의 정점을 지나 환멸 단계(Trough of Disillusionment) 즉, 소비자를 만족시킬 만한 제품•서비스 향상에 성공하지 않으면 투자가 지속할 수 없는 상태에 놓여있습니다. 그만큼 챗봇 기술에 대한 대중의 기대는 높은 상태라고 볼 수 있습니다. 그런데도 많은 유수의 기업들이 챗봇을 도입하고 있습니다.

가트너, 하이프 사이클
(출처: https://www.gartner.com/technology/research/methodologies/hype-cycle.jsp)

반면 많은 인공지능(AI) 엔지니어들은 ‘인공지능을 수식어로 달고 있는 챗봇의 역량이 무엇이든 해결해주는 만능박사처럼 과대 포장되어 있다’라고 지적합니다. 또 영국의 더 레지스터(The Register)에서는 2017년 2월, 페이스북 챗봇의 명령 이해 실패율이 70%라는 진단을 내린 바 있습니다. 포레스터(Forrester)에서는 미국의 포춘 500대 기업의 챗봇 이용률은 4%로 챗봇은 아직 연구해야 할 영역이 많다고 전했습니다. 그렇다면 현시점의 실제 챗봇 사용자들은 챗봇과의 대화에 만족할까요?

결론부터 말씀드리면 챗봇과의 대화에서 챗봇은 대답을 잘 할 때도 있고 못 할 때도 있습니다. 챗봇이 대답을 어떻게 했는지에 대한 대화 이력(Log)을 살펴보면 사용자의 의도에 맞게 대답을 잘 한 경우는 세 가지 조건을 충족시킨 경우라고 볼 수 있습니다.

첫째는 챗봇이 제공하고자 하는 서비스의 주제를 좁고 정확하게 가져가고 이것이 사용자가 해결하고자 하는 니즈의 핵심 의도와 맞아떨어진 경우입니다.
이를 위해서는 챗봇 설계 시, 챗봇이 처리해야 할 작업의 목표가 단일해지도록 업무를 세분화시켜야 하며, 대답할 수 있는 답변의 영역에 명확한 선을 그어주어야 합니다. 예를 들어 새로운 부가 서비스를 신청하고 싶은 챗봇 사용자가 ‘부가 서비스’라고 입력했다면 챗봇은 사용자의 의도가 부가 서비스 ‘안내’인지, ‘신청’인지, ‘해지’인지를 명확하게 확인을 받아야 하므로 재질의를 통해 ‘부가 서비스 신청’ 대한 답변을 할 수 있게 만드는 것입니다.

둘째는 챗봇과 사용자 간의 자유로울 수 있는 대화 흐름이 사전에 정의된 시나리오대로 자연스럽게 흘러갈 수 있도록 대화 설계의 구조화가 잘 된 경우입니다.
그리고 이것은 사용자의 뚜렷한 의도(Intent), 목적이 전제되어 있어야 합니다. 사람 간 대화처럼 일상적 대화를 기대하고 챗봇에 말을 건 사용자는 대화의 목적지에 다다르기 어려울 것입니다. 어려운 내용도 아닌데 지능형이라면서 적절한 답도 못 하는 챗봇이 문제일까요?

챗봇의 입장에서는 마무리 짓지 못한 화제의 갑작스러운 전환, 또는 비슷한 주제지만 관련 내용이 포함된 더 확장된 주제의 다른 대화 등은 예외상황이 되어 버립니다. 인간에게는 명시적으로 콕 집어주지 않아도 상황과 분위기를 파악하고 문맥을 이해하는 직관력이 있습니다. 프로그램으로 짜인 챗봇에 자연어를 인간과 같은 수준으로 처리하는 것을 기대하기엔 시기상조이지요.

그러나 챗봇 활용이 유용할 수 있도록 하는 방법은 있습니다. ‘사용자의 명확한 의도’와 함께 사용자 입력만으로는 부족한 필수정보를 되물어 보고 채우는 ‘Slot-filling’ 그리고 사용자가 기대하는 정확한 의도파악을 위해 사용자가 직접 선택할 수 있는 ‘선택지 제공’ 기능 등을 활용하여 양자 간 상호작용을 주제에서 이탈 없이 유지하고 끝맺음하는 것입니다.

LG CNS의 단비 플랫폼에서는 대화의 흐름을 구성하는 기본 요소들을 노드(Node)라는 속성 장치를 통해 효율적인 대화 시나리오를 설계할 수 있습니다. 이런 것들이 바로 인간의 고유의 능력인 ‘직감’을 보완할 수 있는 도구가 되는 셈이지요.

셋째는 유기체와 같이 끊임없이 변화하고 또 사람마다 다르게 가지고 있는 가지각색 구어체 표현들에 대한 수많은 데이터가 성공적인 대답을 할 수 있는 의도(Intent)에 적절하게 맵핑되어 있어야 합니다.
예를 들어 같은 ‘통신비 청구요금 조회’라는 목적을 가지고 챗봇에 요청한 이력들을 살펴보면 ‘통신비 청구요금’을 ‘핸드폰요금’, ’결제요금’, ’통신요금’, ’청구금액’, ‘통화료’, ‘전화비’, ‘납부금’과 같이 다른 단어로 표현하기도 하고 ‘조회해주세요’ 역시 ‘조회 가능?’, ‘조회 부탁해요’, ‘조회 원합니다’, ‘조회 좀’, ‘확인해줘’, ‘어디서 볼 수 있어요’, ‘알려주세요’, ‘목록 보여줘’, ‘어떻게 조회해?’, ‘열람하고 싶어’ 등 다른 어휘를 사용하기도 하고 또 구문의 패턴이나 품사의 순서 역시 천차만별입니다.

유행어나 은어, 줄임말 등도 있습니다. 하지만 이 다양한 표현들이 목표하는 바는 한 가지, 챗봇이 ‘통신비 청구요금 조회’라는 나의 의도를 파악하고 처리해 주길 바라는 것이지요. 목표하는 의도에 자연어 데이터가 많이 쌓일수록 챗봇은 이를 바탕으로 더욱 똑 부러진 기계학습, 즉 머신러닝을 할 수 있을 것입니다.

물론 머신러닝이 다 좋은 것은 아닙니다. 금기를 학습할 수도 있고, VOC에 예민한 고객센터에서 하지 말아야 할 말을 뱉어 역효과를 불러일으킬 수도 있으며, 돌발상황에 대해 적절한 응대 성공이 보장되지도 않으니까요. 이를 보완할 방법으로 단비 플랫폼에는 관리자에게 ‘학습 추천’ 데이터를 제공하고 챗봇 운영자의 데이터 학습 여부에 대한 검토를 통해 한 번에 많은 양의 데이터를 정확한 의도에 맵핑시켜 데이터 품질을 향상할 수 있도록 도움을 줍니다.

서두에서 챗봇에 기대하는 목표 설정에 대한 이해를 언급했습니다. 챗봇에 동료나 친구에게 기대하는 살아 숨 쉬는 유기적 대화를 바라기보다는 챗봇을 통해 해결하고자 하는 사용자의 뚜렷한 비즈니스 목적과 챗봇을 만드는 사람의 예측 대화 구조의 빈틈없는 설계, 그리고 챗봇 성장의 자양분이 되어 줄 충분한 양의 데이터가 보장된다면 챗봇은 충분히 잘 대답할 수 있을 것입니다.

어느 부분을 더 학습시켜야 하는가?

챗봇을 통해 해결하고자 하는 니즈에는 제한이 없지만, 챗봇이 처리하는 중복되는 니즈들은 한정되어 있습니다. 예를 들어 고객센터 챗봇의 경우는 서비스나 금액 등의 정보조회성 업무나 ‘서비스 신청•변경•해지’ 등의 단순 업무처리가 대다수입니다. 그리고 챗봇은 이 업무들에 대해서 상담원 전화연결, 메뉴를 찾아 여러 단계 화면을 이동해야 하는 번거로움 없이 해당 업무를 간단히 처리할 수 있는 화면의 링크를 띄워줍니다.

그런데 문제는 같은 일을 반복하니 챗봇도 ‘응대의 달인’이 될 법한데 현실은 그러지 않다는 것입니다. 요금이 궁금한 사람이 모두 일률적으로 ‘요금이 궁금해요’라고 말하지 않는 것이 현실이지요. 의도와 맥락을 놓치지 않고 정답을 내주기 위해서는 사용자가 입력한 자연어를 챗봇이 알아들어야 합니다.

챗봇을 비유하기에 좋은 대상을 하나 예로 들어보겠습니다. 아기는 신생아 시절부터 엄마가 들려주는 언어 자극을 통해 학습을 시작합니다. 단어 하나로 출발해 엄마가 자주 사용하는 문장을 모방하면서 인지발달과 함께 언어 구사를 시작하며 언어 폭발기가 오지요.

아기가 말을 배울 수 있도록 뇌라는 중추신경계 기관을 타고나는 것과 같이 생성기의 챗봇도 스스로 자동학습을 할 수 있는 모델이 탑재된 프로그램일 뿐입니다. 다수가 기대하는 인공지능 역할을 언젠가는 할 수 있도록 충분한 양의 학습을 지속해서 시켜주면서 단계적으로 접근해야 합니다.

챗봇이 가져가는 사전(Dictionary)에 사업군 별로 다르게 사용할 수 있는 여러 비즈니스 용어에 대한 정의는 필수이며, 사용자 집단의 특성이나 유행이 반영된 어휘나 구문표현, 심지어 오타까지도 학습해야 합니다. 그리고 그러한 학습은 챗봇 서비스의 주사용 의도(사용자로서는 ‘니즈’) 일수록 많이 이뤄져야 합니다. 학습량이 쌓여갈수록 챗봇의 인공지능 성장에도 가속이 붙을 것입니다.

챗봇이 인간을 대체해 모든 업무 영역을 점령할 수 있다는 일부 우려의 시각도 있지만 사실 현시점에서는 이런 기우보다, 사용자의 입력 값을 정답 여부를 판단하여 최대한 많이 학습시키는 일과 챗봇과 사용자 간의 대화를 분석하여 대화 시나리오를 정교하게 다듬는 것, 빈도가 높은 고객의 새로운 니즈(의도)를 분류하고 생성하여 새로운 질의에도 답변할 수 있도록 대화 이력을 모니터링을 하는 일 등 똑똑한 챗봇을 만들어가는 일이 우선시 되어야 할 것입니다.

이벤트성 업무 대응은 어떻게 하지?

이벤트성 업무를 챗봇에 전면 위임하는 일은 대단히 위험할 수 있습니다. 천재지변으로 인한 통신장애, 동시다발적으로 생기는 같은 내용의 VOC, 시스템 점검으로 인한 서비스 중단 등을 ‘장애 이벤트’라고 볼 수 있는데요. 이처럼 예측 불가하거나 비간헐적, 비정상적으로 발생하는 것이 장애 이벤트의 특징입니다. 이렇게 흔치 않게 발생하는 이벤트에 대한 학습경험이 전혀 없는 챗봇은 어떻게 대응할 수 있을까요? 또 신속하고 정확하게 대응할 수 있을까요?

이제 챗봇이 만능이 아니라는 사실은 여러분도 잘 아실 겁니다. 그리고 챗봇이 대답을 잘하려면 서비스의 주제, 즉 처리해야 하는 업무목표가 간단명료해야 하며 충분한 학습데이터가 기반이 되어야 한다는 이야기도 했습니다.

하지만 세상의 모든 상황 변수를 예측할 수 없어도 문제의 유형은 분류할 수 있으므로 상담사에게 지침 매뉴얼을 주고 사전 교육하는 것과 같이 챗봇도 장애 유형 별 응대 시나리오를 만들거나 이벤트 대응 챗봇을 별도로 두는 방법도 있습니다.

다만 이벤트 발생 전에 사용자들의 입력 값이 어떻게 들어올지는 예측할 수 없으므로 사전에 관련 키워드나 사용자가 질문할 만한 데이터를 최대한 준비해 둔다면 챗봇이 좀 더 신속하게 장애 이벤트에 대응하는 데 도움이 될 것입니다.

장애 이벤트와는 다르게 이벤트 중에서도 콘텐츠의 특성상 챗봇을 도입하면 큰 효과를 볼 수 있는 이벤트도 있습니다. 특정 기간 홍보가 필요한 상품 소개나 최근 출시된 스마트폰의 예약접수 혹은 스포츠 안내 등 홍보•판촉 업무를 도와주는 이벤트 대응 챗봇이라면 고객에게 더 친근하게 다가갈 수 있음은 물론이고 이용 편의성도 높아 재사용률도 높은 것으로 나타나고 있습니다.

잠시 언급했던 스포츠(평창 동계스포츠) 챗봇의 사례를 보면 챗봇의 특장점 중 하나인 채팅창 안에서 맞춤형 정보를 제공한다는 이점을 적극적으로 활용해 고객이 필요로 하는 정보를 명료하게 제시해주고 있음을 알 수 있습니다. 이는 사용자 편의를 도모하기 위한 이벤트 대응 방법의 하나로 활용성 좋은 챗봇을 도입한 경우라고 볼 수 있겠지요. 다음 연재에서는 이러한 지능형 챗봇의 빌더, LG CNS의 ‘단비(Danbee) Ai’에 대한 상세한 이야기가 이어지겠습니다.

글 | LG CNS 미래신사업담당

[‘부상하는 비즈니스 마케팅 채널! 챗봇(Chatbot)’ 연재 현황]

[1편] 모바일 메신저 ‘챗봇(Chatbot)’이란 무엇일까?
[2편] 챗봇을 활용한 서비스 사례
[3편] 챗봇으로 만든 대화형 커머스 ‘톡 주문’
[4편] 서비스 운영 경험으로 본 챗봇
[5편] 문답으로 알아보는 챗봇
[6편] 챗봇. 어떤 로직을 구현할 것인가?
[7편] 지능형 챗봇, 기업 현장에 어떻게 도입할 것인가?
[8편] 4차 산업혁명에서 지능형 챗봇의 역할
[9편] 왜 지능형 챗봇인가? 왜 지금인가?
[10편] 운영자 관점에서 바라본 챗봇의 현재 모습

블로그

운영자 관점에서 바라본 챗봇의 현재 모습

잘 대답하고 있는가?

어느 부분을 더 학습시켜야 하는가?

이벤트성 업무 대응은 어떻게 하지?

관련 아티클