본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

메이저리그와 함께 발전하는 데이터 분석

2016.04.25

메이저리그(Major League) 관중들은 뉴욕 양키스의 투수 아롤디스 채프먼(Aroldis Chapman)이 마운드에서 던진 후, 전광판에 보이는 세 자리 숫자, 100MPH의 구속에 열광합니다. TV로 중계를 보는 팬들 또한 마찬가지인데요. 흔히 볼 수 없는 이 세 자리 숫자는 사람들을 메이저리그의 매력에 빠지게 만들고 있습니다.

100년이 넘는 메이저 리그의 역사 속에서 투수들은 더 빠른 공을 던지기 위해 노력을 해왔고, 팬들은 조금씩 빨라지다 이제 100MPH까지 온 투수들의 구속에 경외감마저 느끼고 있는데요. 그렇다면, 언제부터 야구 팬들이 투수들의 구속을 수치로 정확하게 알게 된 것일까요? 메이저 리그의 모든 구장 전광판에서 투수들의 구속을 보여주기 시작한 건, 불과 17년 전인 1999년입니다.

스피드건의 등장(Rader Gun)

타자에게 홈런이라는 매력적인 무기가 있다면, 투수의 매력은 타자들의 방망이를 순식간에 스쳐 지나가는 빠른 공일 텐데요. 이런 빠른 공의 속도를 과거에는 알 길이 없었습니다. 공에서 기차 소리가 난다고 해서 ‘빅 트레인’이라는 별명이 붙은 월터 존슨, 빠른 공을 던지기 때문에 ‘rapid’ 라는 별명이 붙은 밥 펠러, 이 두 선수는 별명에서 보여주는 것처럼 엄청나게 빠른 공을 던졌습니다. 스피드 건이 없었던 당시에 이들의 구속을 알아내기 위해 사람들은 그들이 던지는 공과 오토바이의 속도를 비교했으며 군사 시설을 이용해 구속을 측정하기도 했습니다.

l 스피드 건

스피드 건이 최초로 만들어진 때는 1954년입니다. 하지만 당시 스피드 건의 용도는 과속 차량을 단속하기 위해 만들어졌는데요. 본격적으로 스피드 건이 야구계에 쓰이기 시작한 때는 1973년으로, 미시건 주립대의 코치인 대니 리트윌러(Danny Litwhiler)가 캠퍼스에서 경찰이 사용하는 것을 보고 이를 선수들의 구속 측정에 활용한 것이 최초의 기록입니다.

리트윌러는 스피드 건을 활용해서 패스트볼(Fastball)1과 체인지업(Changeup)2의 구속 차이를 확인했고, 스피드 건을 구속 측정용으로 개량 할 것을 메이저 리그 커미셔너에게 제안했습니다. 1975년에 메이저 리그의 감독들 및 코치들에게 구속 측정용 스피드 건이 소개됐으며, 본격적으로 실전에 사용하기 시작한 구단은 볼티모어 오리올스와 LA 다저스였습니다.

l 다저스 스타디움

각 구단에서 스피드건 도입은 투수들의 피로도를 측정하는 도구로 쓰였습니다. 구속의 변화를 통해 투수들의 피로도를 가늠했는데요. 이후에는 선수들의 스카우트를 목적으로도 스피드 건이 널리 쓰이게 되었습니다.

메이저 리그 전 구장 전광판에 스피드 건이 도입된 것이 1999년입니다. 놀랍게도 그렇게 오래된 기술은 아닙니다. 이전까지 스피드 건은 코치나 스카우터처럼 선수와 밀접한 관계를 맺고 있는 야구 팀의 스탭들만 사용 하다가, 21세기를 눈앞에 두고서야 일반 관중들을 위해서 쓰여지기 시작한 것입니다. 팬들은 야구장 내에서 투수들이 방금 던진 공의 속도를 실시간으로 확인이 가능해졌고, TV를 통해 경기를 지켜보는 팬들 또한 투수들의 빠른 공을 정확한 수치로 체험할 수 있게 된 것입니다.

PICHT f/x 시대의 개막

스피드 건이 야구에 도입되고나서 야구장 전광판에 도입되기까지 25년 이상의 시간이 흘렀는데요. 이로부터 7년 뒤에 야구계에서의 혁명이 일어나게 됩니다. PITCH f/x가 등장한 것인데요. PITCH f/x는 스포츠비젼社에서 제작한 투구 추적 시스템으로 기본적인 구속은 물론, 공의 무브먼트, 릴리스 포인트, 피치 로케이션 등 다양한 데이터를 제공합니다.

스카우트의 눈과 스피드 건에 찍히는 구속으로만 투수들을 평가했던, ‘아날로그 시대’를 뛰어 넘은 PITCH f/x 시스템은 투수들의 작은 움직임이나 공의 궤적 등 눈으로는 정확하게 측정하기 힘든 요소들을 수치화해서 보여주는데요.

PITCH f/x를 통해서 클레이튼 커쇼(Clayton Kershaw)가 던지는 패스트볼은 어느 정도의 상하 무브먼트(Vertical Movement)를 가지고 있는지, 혹은, 펠릭스 에르난데스(Felix Hernandez)가 던지는 체인지업은 어느 정도의 브레이킹이 걸리는지를 알 수 있게 되었습니다.

l 클레이튼 커쇼(Clayton Kershaw)

현재의 PITCH f/x는 미디어 기기의 발달과 함께 팬들에게 더욱 쉽게 다가와 있는데요. MLB at bat 어플이나 MLB.com 홈페이지에서 찾아 볼 수 있는 gameday에서는 투수가 방금 던진 공의 구종, 구속, 로케이션 등이 실시간으로 확인할 수 있습니다.

PITCH f/x의 등장에 따른 가장 큰 성과는 바로 포수의 프레이밍(Pitch Framing)이라 할 수 있는데요. 프레이밍은 스트라이크 존 바깥에 들어온 공을 스트라이크로 보이게 만들어 심판의 스트라이크 콜을 이끌어내는 포수의 능력을 말합니다. 이제는 PITCH f/x를 통해 투구가 존(Zone)을 벗어났는지, 존 안에 들어왔는지 식별이 가능해졌고, 포수가 존 밖에 들어온 공을 스트라이크로 만든 횟수, 반대로 존 안에 들어온 공을 볼로 만든 횟수의 측정 및 통계가 가능해졌습니다.

하지만 이런 PITCH f/x에도 한계점이 존재했습니다. 메이저 리그에서 가장 빠른 공을 던지는 투수는 아롤디스 채프먼(Aroldis Chapman)입니다. 하지만 실제로 타자들이 느끼는 체감 구속이 가장 높았던 공은 카터 캡스(Carter Capps)의 패스트 볼이었는데요. 채프먼의 패스트 볼의 평균 구속은 거의 100mph에 육박합니다. 캡스의 패스트 볼 평균 구속은 98.1mph로 채프먼보다 약 2mph 가량 느리지만, 타자들이 느낀 체감 구속은 캡스가 101.7mph로 채프먼의 100.8mph보다 약 1mph 정도 빠르다고 합니다.

이런 데이터는 스피드 건이나 PITCH f/x에서는 측정하기 힘든 자료라 할 수 있는데요. PITCH f/x에 나오는 수치들은 정확하게 측정된 부분이 아니라서 큰 수치의 오차가 한계점이라고 할 수 있습니다.

l 아롤디스 채프먼(좌), 카터 캡스(우)(출처: https://commons.wikimedia.org/wiki/File:AChapman.jpg / This file is licensed under the Creative Commons Attribution-Share Alike 3.0 Unported license. & https://commons.wikimedia.org/wiki/File:Carter_Capps_pitching.JPG / This file is licensed under the Creative Commons Attribution-Share Alike 2.0 Generic license.)

PITCH f/x는 타자보다는 투수 쪽의 데이터에 치중 되어있는데요. 타자들은 아직도 스탯을 가공해서 새로운 스탯을 만들어내는 세이버메트릭스(Sabermetrics) 수준을 크게 벗어나지 못하고 있습니다. 세이버메트릭스는 영화 ‘머니볼’로 유명한, 오클랜드 어슬레틱스의 현 부사장 빌리 빈이 적극적으로 수용한 것으로 유명한데요.

타자들의 스탯을 가공하여 숨겨진 장점, 혹은 숨겨진 단점을 보여주었습니다. PITCH f/x보다 도입 시기도 빨랐고, 활발한 연구로 세이버메트릭스 나름대로의 성취도 이루어 냈지만, 타자들의 능력을 정확히 측정을 하기란 거의 불가능에 가까웠습니다. 타구가 얼마나 세게 정확히 맞았는지, 주자가 도루를 할 때 마나 빠르게 달리는지, 수비수가 타구를 보고 얼마나 빠르게 반응을 해서 어떤 경로로 타구를 쫓아 가는지에 대한 정확한 측정을 실현하기는 매우 힘들어 보였습니다.

스탯캐스트의 도입

지난 시즌 처음으로 메이저리그에 도입된 스탯캐스트(Statcast)는 타자들의 수치들을 정확하게 측정하고 제공하는데요. 스탯캐스트는 메이저리그의 새로운 추적 시스템 기술(Tracking System Technology)로, 이전에 제공되던 데이터들이 주로 투수 중심의 데이터에 치중했다면, 이 스탯캐스트는 야구장에서 벌어지는 모든 일을 측정합니다.

스탯캐스트는 트랙맨(TrackMan)의 레이더 장비와 그래픽 회사인 카이론히고(Chyronhego)가 개발한 트래캡(TRACAB) 옵티컬 카메라를 통해 야구장 안에서 플레이 하는 모든 선수들의 모든 데이터를 수집합니다. 트랙맨은 군사 목적으로 만들어진 레이더 기술을 야구에 접목한 것으로 투수가 공을 던지는 순간부터 타자가 친 공이 떨어질 때까지, 27가지나 되는 각기 다른 종류의 데이터를 수집합니다.

카이론히고의 카메라는 수비수와 주자의 움직임을 추적하는데 사용됩니다. 초당 25장의 사진을 찍어 분석하는 시스템으로, 촬영한 사진을 통해서 수비수가 얼마나 빠르게 움직이고 정확한 판단을 했는지, 주자가 얼마나 빨리 베이스를 밟았는지를 측정합니다.

스탯캐스트의 등장은 TV 방송화면을 마치 비디오 게임과 같이 표현할 수 있게 만들었는데요. 트랙맨에서 제공하는 피칭과 타격 데이터, 그리고 카이론히고의 카메라 기술과 그래픽 능력을 통해 중계 화면에 다양한 그래픽을 입혀 마치 게임 영상을 보는 듯한 착각을 일으키게 만듭니다. 트랙맨의 데이터는 극히 일부 방송을 통해서 공개가 되고 있고, 대부분의 데이터는 비공개로 구단에 판매되고 있습니다.

휴스턴 애스트로스는 2013년 콜로라도 로키스에서 그저 그런 성적을 낸 콜린 맥휴(Collin McHugh)를 영입했습니다. 이 때 큰 역할을 한 것이 바로 트랙맨에서 제공한 공의 회전수인데요. 아스트로스는 맥휴의 커브가 다른 투수들에 비해 회전수가 높은 것에 주목했습니다. 결과적으로 콜린 맥휴는 휴스턴에서 반등에 성공하며 팀의 주축 선발 투수가 됐습니다.

스탯캐스트의 도입으로 인해, 주목 받게 될 부분은 바로 타자들이 만들어 내는 타구의 질과 수비 상황 때 수비수들이 보여주는 움직임에 대한 재평가가 될 것입니다. 스탯캐스트 도입 전에는 타자들의 타구의 질은 BIS(Baseball Info Solutions)에서 분석해 Fangraphs.com에 제공하고 있으며, 수비수들의 수비 범위를 평가하여 수치를 제공하는 곳은 UZR에서 진행하고 있는데요.

주목할 점은 두 스탯은 모두 BIS 직원들이 직접 눈으로 경기를 보면서 작업을 하고 있다는 점입니다. 마치 이전의 스카우터들이 투수의 구속을 스피드건 없이 가늠했던 것과 같이 실제로 비디오 장면을 보면서 눈으로 추적하여 표기했습니다.

스탯캐스트의 등장은 이러한 아날로그 측정 방식을 벗어나, 정확한 데이터들을 수치화 해서 보여줄 것이며, 선수들의 능력이나 경기 내용을 분석 및 평가하는 방법을 송두리째 바꿔 놓을 것으로 예상하고 있는데요. 트랙맨에서 제공하는 타구 속도와 타구 각도는 타자들의 타격 능력을 수치화 해서 보여줄 것이고, 각 구단은 이러한 데이터를 통해 유의미한 결과물을 만들어내고자 노력할 것으로 예상됩니다.

카이론히고의 비디오 자료는 수비수들의 움직임을 사각 없이 추적해 측정을 하고 분석할 것입니다. 아직까지는 TV 방송에서의 보여주기 식에 불과한 것 같지만, 이미 구단들은 이런 데이터를 활용하는 방법을 찾고 있습니다.

스탯캐스트의 도입으로 구단들은 1경기 당 7TB가 넘는 데이터를 접하게 되었는데요. 이렇게 큰 데이터를 분석해내는 능력을 최대한 빨리 갖추는 구단이 시장을 선도해 나갈 가능성이 높아지게 되어버렸습니다.

가공되지 않은 데이터는 그저 숫자에 불과하다고 할 수 있는데요. 중요한 것은 이를 분석할 수 있는 능력에 달려있습니다. 이 변화에 가장 먼저 발 맞춰 나간 구단은 휴스턴 아스트로스입니다. 휴스턴은 데이터를 분석하기 위해 NASA의 엔지니어를 영입했고, 물리학자, 통계학자 등 각 분야의 전문가들로 분석팀을 만들었습니다.

뿐만 아니라 2015년에 메이저리그의 알려지지 않은 한 구단이 Cray(최초의 슈퍼컴퓨터를 만든 회사)로부터 스탯캐스트의 도입과 함께 슈퍼컴퓨터를 구입했다고 하는데요. 이는 스탯캐스트의 데이터를 분석하기 위해 슈퍼컴퓨터가 야구에 활용되기 시작했다는 의미입니다.

야구에서 최초로 스피드 건이 쓰이기 시작한 1973년 이후, 야구에 사용되는 기술들은 빠른 속도로 발전을 거듭해 왔는데요. 40년이 조금 지난 지금, 야구 데이터 분석을 위해서 슈퍼컴퓨터까지 사용하는 시대를 맞이하게 되었습니다. 이미 메이저리그 구단들은 데이터를 분석해 줄 인재를 얻기 위해 구글이나 애플과 같은 IT 기업들과 불꽃 튀는 경쟁을 하고 있습니다.

메이저리그가 보여줄 다음 혁신은 무엇일까요? VR(Virtual Reality)을 통한 중계나 웨어러블 소재를 통한 선수들의 실시간 건강체크 등이 예상되는데요. 앞으로 메이저리그에서 발전되고 활용될 다양한 혁신 기술들을 기대해 봅니다.

글 ㅣ 김남우 ㅣ 스포츠 작가

  • 패스트볼(Fastball) 또는 직구라 불리는 이 구종은 야구에서 가장 오래됐고 가장 보편적으로 사용된다. 각종 기사에 투수의 최고 구속이 나오는 것은 패스트볼의 구속을 일컫는 것이다. 가장 보편적이고 많이 사용되기에 패스트볼의 속도에 대한 팬과 스카우트들의 관심 또한 식을 줄 모른다. 패스트볼의 범주에는 생각보다 많은 구종이 포함되기에 여기에서는 ‘직구’라고 불리는 포심 패스트볼과 투심 패스트볼에 한해서 이야기하기 한다. 크게 보면 스플리터(스플릿핑거 패스트볼), 커터(컷 패스트볼)도 패스트볼의 범주에 포함된다. [네이버 지식백과] [본문으로]
  • 체인지업은 ‘오프 스피드 피치(off-speed pitch)’라고도 불리는데 말 그대로 공의 속도를 줄여 타자의 타격 타이밍을 뺏는 것이 주된 목적이다. [네이버 지식백과] [본문으로]

챗봇과 대화를 할 수 있어요