본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

게임 리뷰데이터 분석으로 살펴본 게이머의 생각

2017.02.07

최근 인터넷 환경의 발달과 뉴미디어의 등장으로 다양한 형식의 리뷰들이 등장하고 있습니다. 아마존(amazon.com)에서 출발한 구매 후기 게시기능이 전자상거래 전반으로 퍼지게 되었는데요. 대부분 소비자는 기업의 일방적인 제품 정보에 의존하지 않고, 다른 사용자들의 구매 후기나 전문가들의 추천을 보고 구매를 결정하는 경향이 두드러지고 있습니다.

온라인 리뷰가 구매에 미치는 영향

이러한 경향은 소비자가 제품을 구매하는 데 있어, 다양한 사전 정보 탐색을 통해 위험을 줄이려는 심리에서 그 원인을 찾을 수 있습니다. 특히 직접 사용해보지 않으면 해당 상품 및 서비스의 품질 및 만족도를 알 수 없는 경험재의 경우, 다른 구매자의 리뷰가 더 큰 영향력을 갖게 됩니다.

한국인터넷진흥원이 실시한 ‘구매 결정 시 다른 사용자의 구매 후기에 영향을 받느냐’는 설문조사에서 74%의 응답자들이 영향을 받는다고 응답한 바 있습니다. 이처럼 온라인 리뷰는 소비자들의 구매 의사결정에 매우 중요한 역할을 담당하고 있다는 것을 알 수 있습니다.

게이머는 어떻게 게임을 선택할까?

‘2016년 대한민국 게임백서’에 따르면, 2015년 세계 게임 시장 규모는 1,300억 달러를 돌파했습니다. 또한, 국내 게임 시장도 80억 900만 달러로 세계 게임 시장에서 6.1%의 점유율을 차지할 정도로 지속적인 성장세를 보이고 있습니다.

특히, 온라인 게임 시장은 국내 게임 산업에서 가장 비중이 큰 플랫폼으로 성장했는데요. 세계적으로 유명한 프로게이머가 한국에서 탄생할 정도로, 일반 대중에게도 온라인 게임은 일상적인 문화이자 상품이 되었습니다. 게임을 즐기는 게이머의 수도 상당히 늘어난 것 이죠. 그렇다면, 게이머는 어떠한 경로를 통해 게임에 대한 정보를 접할까요?

게이머도 마찬가지로 주변 사람이나 매체 등을 통한 정보 수집을 할 것입니다. 이 글에서는 게임을 경험재로 판단하고, 대다수 전자상거래 이용자가 구매 전 살펴보는 구매 후기처럼, 게임 리뷰가 가진 영향력에 대하여 살펴보려고 합니다. 여러 게임의 리뷰 데이터를 이용하여, 어떤 요인이 다른 게이머의 ‘좋아요’라는 평가를 받게 되는지 알아보겠습니다.

게임 리뷰의 유용성 영향 요인 분석

경영학에서는 온라인 매체, SNS와 같은 1인 미디어를 통한 입소문의 확산을 온라인 구전(Online Word-of-Mouth)이라는 이름으로 활발히 연구 중입니다. 온라인 리뷰는 온라인 구전의 가장 대표적인 형태로, 기업에서 일방적으로 제공하는 정보보다 신뢰성이 높은 정보로 인식되는 경향이 있습니다. 이로 인해 많은 연구가 리뷰 데이터를 기반으로 온라인 리뷰의 유용성(Helpfulness 또는 Usefulness)에 영향을 미치는 요인을 분석해 왔습니다.

그렇다면, 이를 게임 분야에 적용하면 어떨까요? 그래서 온라인 스팀(STEAM) 게임을 선정하여 실험해보기로 하였습니다. 스팀은 Valve software에서 제공하는 게임 플랫폼입니다. 스팀 게임을 택한 이유는 스팀 플랫폼에서는 다양한 장르의 게임을 제공하며 연구에 적절한 리뷰 데이터를 제공하기 때문입니다.

l 스팀 커뮤니티의 게임 리뷰 (출처: store.steampowered.com)

게이머가 게임리뷰를 올리면, 다른 사용자들이 ‘유용하다•유용하지 않다’로 투표할 수 있는 기능을 제공하고 있습니다. 따라서 스팀 게임에서 제공하는 리뷰 데이터를 기반으로 다음과 같은 순서로 리뷰 유용성에 영향을 미치는 요인들을 분석하기로 하였습니다.

l 데이터 분석 순서

스팀 게임 플랫폼 내의 다양한 게임 중 카운터 스트라이커(Counter Strike), 도타(Dota), 풋볼매니저(Football Manager), 팀 포트리스(Team Fortress) 등 총 11개 게임의 리뷰 데이터 79,432개를 수집하였습니다. 수집된 데이터들은 분석이 쉽도록 약 3주에 걸쳐 데이터 전처리 과정을 진행하였고, 이를 통해 이상치(Outlier)와 결측치(Missing Value)를 모두 제거한 후 41,164개의 데이터와 15개의 변수를 분석에 사용하게 되었습니다.

본 연구에서는 리뷰 내용을 분석하여 긍정적인 표현이 많은지 부정적인 표현이 많은지를 계량화한 변수로 포함하고 싶었는데요. 왜냐하면, 게이머들이 긍정적인 리뷰에 유용함을 더 느끼는지 아니면 부정적인 리뷰에 유용함을 더 느끼는지 알고 싶었기 때문입니다. 이를 위해서 추가적인 분석이 필요하였습니다.

그리하여 데이터 마이닝 기법의 하나인 텍스트 마이닝을 이용하여 감성 분석을 해 보았습니다. 감성 분석은 텍스트와 미리 만들어진 감성어 사전 내 단어와 비교하여 텍스트의 감성적 경향(Sentiment polarity)을 분석하는 방법입니다. 여기서 감성적 경향은 긍정적 감성•중립적 감성•부정적 감성으로 나뉩니다.

l [표1] 스팀 데이터 셋(Set)

분석기법의 선정

데이터가 준비되면 이를 분석해야 하는데, 이번 분석에는 데이터 마이닝 기법 중 가장 일반적으로 사용되는 의사결정 나무(Decision Tree)와 인공신경망(Artificial Neural Network)을 사용했습니다.

의사결정 나무는 의사결정 규칙(decision rule)을 나무구조로 세분화하여 분류(classification)와 예측(prediction)을 수행하는 분석방법입니다. 이론이 비교적 단순하고 그 결과의 해석이 쉬워 널리 사용되며, 인공신경망은 인간이 외부 자극을 연결된 신경망을 통해 처리하는 방식을 흉내 낸 분석모형입니다.

신경망은 복잡한 논리적 프로그램을 통해 해결책에 도달하는 것이 아니라, 다수 뉴런의 선형결합과 선형결합의 가중치를 조정하여 해(Solution)에 도달하는 방식을 택하고 있는데요. 최근 모형의 계량을 통해 알파고(AlphaGo) 등에 사용된 딥러닝(Deep Learning)의 원형이 되는 분석 방법입니다.

두 분석기법 모두 [표1]에 있는 입력변수를 이용하여 목표 변수인 ‘num_found_helpful_percentage’ 를 예측하도록 했습니다. 의사결정 나무를 사용하여 분석한 결과는 아래 그림처럼 제시했습니다.

l 의사결정 나무 분석 결과

두 번째로 사용된 인공신경망은 학습에 많은 시간이 걸리므로, 최대 학습시간을 15분으로 제한했습니다.

l 인공신경망 모형

위의 두 가지 데이터 마이닝 기법 중 종속변수를 더 정확히 예측하는 기법이 무엇인지를 검증하기 위해, 두 기법의 예측정확도를 MAE(Mean Absolute Error, 절대 편차 평균)와 SSE(Sum of Square Error, 오차 제곱 합) 값으로 비교해 보았습니다. MAE는 평균적인 예측오류를 나타내는 값이고, SSE는 극단적인 예측오류에 민감하게 반응하는 지표입니다.

l 의사결정나무와 인공신경망의 예측 오류 값

위 그래프를 보면 MAE, SSE 모두 의사결정 나무의 예측오류 정도가 인공신경망보다 작다는 것을 알 수 있습니다. 따라서 의사결정 나무가 목표변수를 더 잘 예측하는 것으로 보고 리뷰 유용성에 영향을 미치는 요인들을 분석해 보니 아래 그래프와 같이 나타났습니다.

l 의사결정나무의 변수 중요도

리뷰 유용성에 가장 큰 영향을 미치는 변수는 ‘num_voted_helpfulness’로 나타났습니다. 이는 게이머가 리뷰를 통해 평가를 많이 할수록 유용하다고 판단한다는 의미며, 평가결과를 신뢰한다는 의미이기도 합니다.

그 다음으로는 ‘Rating’과 커뮤니티 상에서 관계를 맺고 있는 친구 수인 ‘num_friends’, 리뷰어가 게임을 한 시간인 ‘total_game_hours_last_two_weeks’ 등이 리뷰 유용성에 양의 영향을 미치는 것으로 나타났습니다.

여기서 ‘Rating’은 사용자가 해당 게임을 추천하는지 안 하는지를 나타내는 변수인데, 사용자가 추천하는 경우에 리뷰 유용성에 영향을 미치는 것으로 분석되었습니다. 또한, 리뷰어의 친구가 많을수록 유용하다고 판단하는 경향이 있었고, 게임 시간이 많은 게이머의 리뷰를 신뢰하는 경향이 보였습니다.

그 외에도 사용자가 올린 스크린샷의 수(num_screenshots), 리뷰 수(num_reviews)가 많을수록 리뷰 유용성도 함께 증가하는 것으로 나타났습니다. 종합적으로 볼 때 게이머들은 다른 게이머의 평가결과를 신뢰하며 리뷰어의 신뢰성을 동시에 고려하는 것으로 판단할 수 있었습니다.

커져가는 리뷰의 영향력

게임 리뷰 데이터 분석을 통해, 우리는 게이머가 리뷰 평가를 많이 할수록 평가 결과를 신뢰한다는 점을 알 수 있었습니다. 더 나아가 게이머의 친구 수, 게임 시간, 리뷰 수 등도 리뷰 유용성에 영향을 미치는 요인이라는 것을 알 수 있었습니다. 이제 소비자는 기업의 정보보다는 다른 구매자의 리뷰에 더 관심을 가지고 신뢰성 있는 정보를 얻으려고 하고 있는 것이죠.

고객의 생각을 파악하는 것은 항상 기업의 관심 분야 중 하나였습니다. 빅데이터 시대에는 고객이 온라인 남긴 흔적에서 고객의 의도를 파악할 수 있습니다. 고객이 특정 상품이나 서비스에 대한 남긴 리뷰 글도 이러한 분석에 포함해야 할 좋은 데이터임이 틀림없습니다. 이와 같은 고객의 리뷰 데이터 분석을 통해 기업의 이익과 연결하려는 시도가 이루어질 것으로 보입니다.

다음 연구에서는 트위터와 같이 정보가 재확산되는 SNS상의 리뷰를 대상으로 진행해 보고자 합니다. 트윗 수, 리트윗 수 등을 고려하여 리뷰의 영향도에 대해 알아보는 것이죠. 일반 판매 사이트에서 볼 수 있는 제품 리뷰보다는 더욱 솔직한 고객의 반응을 알 수 있을 것이라 기대됩니다.

이는 곧 고객의 생각을 좀 더 정확하게 파악할 수 있는 정보를 모아 데이터화 시킬 수 있다는 것을 의미하겠죠. 데이터의 양적인 면뿐만 아니라, 질적인 면도 고려하여 더욱 의미 있는 정보를 얻을 수 있을 것으로 기대됩니다. 다음 연구도 많은 관심 부탁 드립니다.

글 ㅣ 황현석 교수 ㅣ 한림대학교 경영학과
POSTECH 산업경영공학을 전공하여 학사를 마쳤으며, 동 대학원 산업경영공학과에서 경영정보시스템 전공으로 석박사학위를 취득하였다. 현재 한림대학교 경영학과에 교수로 재직 중이다. 주요 관심분야는 Expert System, 데이터 마이닝, 인터랙션 디자인, IoT를 활용한 융복합 연구 등이다. 인터랙션 디자인 관련 연구프로젝트를 수행하고 있다.

[ 관련 글 보기 ]

● 소셜 빅데이터 분석을 통해 신(新)소비 트렌드를 읽다
● 고객의 감춰진 마음을 읽는 SNS 분석

챗봇과 대화를 할 수 있어요