야구는 흐름의 경기. 그래프는 흐름을 시각적으로 보여주는 도구다. 야구 경기도 그래프로 나타낼 수 있을까?
문제는 그래프를 그리려면 '숫자'가 필요하다는 것. 야구 경기는 자연과학 현상이 아니기 때문에 숫자로 바꾸기가 쉽지 않다.
이 과제에 처음 도전했던 사람은 크리스토퍼 세이(Christoper Shea).
세이는 1999 시즌을 제외하고 1977 시즌부터 2006 시즌까지 모든 메이저리그 경기를 분석했다. 경기수로는 6만2830 경기나 됐다.
세이는 이닝, 아웃카운트, 주자상황을 고려해 경기를 승리로 마무리하는 확률을 계산했다.
이를테면 이렇다. 6만 번이 넘는 경기 중 9876 경기에서 홈팀이 1회초에 먼저 한 점을 내줬다. 이 중 경기가 끝났을 때 홈팀이 이긴 것은 4826번(48.9%).
이 4826번 가운데 2945번 선두 타자가 1루에 살아나갔다. 홈팀이 최종 승자가 된 것은 1599경기(54.3%)였다.
세이는 이런 식으로 1회부터 경기가 끝날 때까지 모든 상황과 최종 승률을 일일이 비교했다.
'세이버메트리션'이라 불리는 야구 통계학자들은 상황별 승률을 통계학적으로 보정해 메이저리그가 아니라도 활용할 수 있도록 했다. 이를 흔히 WP(Win Probability 또는 WE, WIn Expectancy)라고 부른다.
숫자가 나왔으니 그래프를 그리는 건 그리 어려운 일이 아니다.
7일 목동 구장에서 열린 삼성 대 히어로즈 경기를 그래프로 그려보자.
히어로즈 기준으로 그렸기 때문에 그래프가 1에 가까우면 히어로즈가 유리하고 아래쪽을 향하면 삼성이 분위기를 탄 것이다.
그래프를 보면서 한번 경기를 되짚어 보면 ;
1회초 선취점을 내주긴 했지만 1회, 2회 두 점 씩 올리며 초반 분위기는 히어로즈가 잡았다.
5회초 최형우가 2루타를 터뜨리고 조동찬이 희생플라이를 날리며 역전. 분위기는 삼성 쪽으로 기운다.
곧바로 5회말 히어로즈가 두 점을 뽑아내며 분위기를 반전 시키지만 6회초 진갑용이 역전 싹쓸이 2루타를 날리며 흐름을 탄다.
그것도 잠시 브룸바가 날린 라인드라이브 타구가 그대로 담장을 넘어가며 9대 8 역전.
삼성은 8회초 조동찬의 외야 플라이 때 신명철이 홈을 밟아 동점을 만들 뻔 했지만 황재균이 리터치가 빨랐다고 어필하면서 상승세가 꺾인다.
이택근이 오승황을 상대로 쐐기포를 날린 분위기 그대로 경기 종료.
기록지만 있다면 100년 전 경기라도 그래프를 그릴 수 있는 게 WP의 매력이다.
삼성이 첫 한국시리즈 패권을 차지했던 2002년 경기도 바로 이렇게 되살릴 수 있다.
이승엽과 마해영이 얼마나 믿기지 않는 일을 해냈는지 이 그래프보다 확실한 방법으로 보여줄 수 있을까?
야구 통계학을 뜻하는 '세이버메트릭스'는 곧잘 해부용 메스에 비교된다. 경기를 헤집고 분석하는 구실이 메스와 비슷하기 때문이다.
하지만 존 쏜(John Thorn)과 피트 팔머(Pete Palmer)가 지적한 것처럼 "해부용 메스는 조사와 실험을 위해 생명을 빼앗지만 세이버메트릭스는 야구에 생명을 불어넣는다. (중략) 통계 없이도 야구를 사랑할 수는 없다. 하지만 통계 없이는 야구를 이해할 수 없다."
문제는 그래프를 그리려면 '숫자'가 필요하다는 것. 야구 경기는 자연과학 현상이 아니기 때문에 숫자로 바꾸기가 쉽지 않다.
이 과제에 처음 도전했던 사람은 크리스토퍼 세이(Christoper Shea).
세이는 1999 시즌을 제외하고 1977 시즌부터 2006 시즌까지 모든 메이저리그 경기를 분석했다. 경기수로는 6만2830 경기나 됐다.
세이는 이닝, 아웃카운트, 주자상황을 고려해 경기를 승리로 마무리하는 확률을 계산했다.
이를테면 이렇다. 6만 번이 넘는 경기 중 9876 경기에서 홈팀이 1회초에 먼저 한 점을 내줬다. 이 중 경기가 끝났을 때 홈팀이 이긴 것은 4826번(48.9%).
이 4826번 가운데 2945번 선두 타자가 1루에 살아나갔다. 홈팀이 최종 승자가 된 것은 1599경기(54.3%)였다.
세이는 이런 식으로 1회부터 경기가 끝날 때까지 모든 상황과 최종 승률을 일일이 비교했다.
'세이버메트리션'이라 불리는 야구 통계학자들은 상황별 승률을 통계학적으로 보정해 메이저리그가 아니라도 활용할 수 있도록 했다. 이를 흔히 WP(Win Probability 또는 WE, WIn Expectancy)라고 부른다.
숫자가 나왔으니 그래프를 그리는 건 그리 어려운 일이 아니다.
7일 목동 구장에서 열린 삼성 대 히어로즈 경기를 그래프로 그려보자.
히어로즈 기준으로 그렸기 때문에 그래프가 1에 가까우면 히어로즈가 유리하고 아래쪽을 향하면 삼성이 분위기를 탄 것이다.
그래프를 보면서 한번 경기를 되짚어 보면 ;
1회초 선취점을 내주긴 했지만 1회, 2회 두 점 씩 올리며 초반 분위기는 히어로즈가 잡았다.
5회초 최형우가 2루타를 터뜨리고 조동찬이 희생플라이를 날리며 역전. 분위기는 삼성 쪽으로 기운다.
곧바로 5회말 히어로즈가 두 점을 뽑아내며 분위기를 반전 시키지만 6회초 진갑용이 역전 싹쓸이 2루타를 날리며 흐름을 탄다.
그것도 잠시 브룸바가 날린 라인드라이브 타구가 그대로 담장을 넘어가며 9대 8 역전.
삼성은 8회초 조동찬의 외야 플라이 때 신명철이 홈을 밟아 동점을 만들 뻔 했지만 황재균이 리터치가 빨랐다고 어필하면서 상승세가 꺾인다.
이택근이 오승황을 상대로 쐐기포를 날린 분위기 그대로 경기 종료.
기록지만 있다면 100년 전 경기라도 그래프를 그릴 수 있는 게 WP의 매력이다.
삼성이 첫 한국시리즈 패권을 차지했던 2002년 경기도 바로 이렇게 되살릴 수 있다.
이승엽과 마해영이 얼마나 믿기지 않는 일을 해냈는지 이 그래프보다 확실한 방법으로 보여줄 수 있을까?
야구 통계학을 뜻하는 '세이버메트릭스'는 곧잘 해부용 메스에 비교된다. 경기를 헤집고 분석하는 구실이 메스와 비슷하기 때문이다.
하지만 존 쏜(John Thorn)과 피트 팔머(Pete Palmer)가 지적한 것처럼 "해부용 메스는 조사와 실험을 위해 생명을 빼앗지만 세이버메트릭스는 야구에 생명을 불어넣는다. (중략) 통계 없이도 야구를 사랑할 수는 없다. 하지만 통계 없이는 야구를 이해할 수 없다."