요즘 우리 프로야구는 '희망 고문'이 한창입니다. 시즌 중반에 돌입하면서 일주일 동안 4~7위 네 팀이 모두 자리를 바꿀 정도로 혼전을 거듭하고 있습니다. 미끄러진 팀 팬은 그래도 곧 제 자리를 찾을 것이라고 믿고, 순위가 오른 팀 팬은 또 어쩐지 불안한 가운데서도 그 자리가 굳건하기를 바랍니다. 그런데 혹시 야구 성적을 예측할 수 있는 도구는 없는 걸까요?
야구에 웬 피타고라스 법칙?
우리말로 흔히 '야구 통계학'이라고 번역하는 세이버메트릭스(Sabermetrics)의 아버지 빌 제임스는 1990년대 초반 "각 팀의 시즌 중반 승률보다 득점, 실점이 최종 승률을 예측하는 데 효과적"이라는 주장을 펼칩니다. 그러면서 우리가 중학교 때 배우는 피타고라스 정리를 이용해 '피타고라스 승률'이라는 것을 만들어 소개합니다.피타고라스 승률은 기본적으로 득점과 실점의 거듭제곱을 가지고 계산합니다. 처음에는 거듭제곱 지수로 2를 쓰는 게 보편적이었지만 "1.83을 쓰는 게 맞다", "아니다, 로그 지수를 써야 한다"는 주장까지 등장한 상태입니다. 엄밀함에 대한 접근은 다르지만 이들이 시즌 예측을 위해 피타고라스 승률을 쓴다는 사실은 여전합니다.
피타고라스 승률로 현재 프로야구 각 팀 상황을 알아보면 두산(.615), SK(.607), KIA(.573)는 흔들림이 없습니다. 실제 승률과 차이를 보이지만 순위가 바뀔 정도는 아닙니다. 올 시즌 프로야구는 현재까지 굳건한 3강 체제입니다.
반면 6위 LG는 .480으로 5위 히어로즈(.456)보다 피타고라스 승률이 높습니다. 7위 삼성(.437)도 6위 롯데(.427)보다 좋은 면모를 보이고 있습니다. 이 예상이 맞다면 앞으로 프로야구 순위는 LG-히어로즈-삼성-롯데 순서로 정리될지 모르겠습니다.
그런데 5위 히어로즈는 2위 SK와 12경기나 치른 반면 8위 한화하고는 8경기밖에 안 했습니다. LG는 한화와 12경기, SK와 9경기입니다. 1위 두산과는 히어로즈가 8경기, LG가 9경기로 큰 차이가 없습니다. 혹시 상대 경기 숫자 차이에 따라서 승률에 영향을 받은 건 아닐까요?
이번엔 로그5 공식이라고?
제임스는 시즌 전체만 예상하는 공식을 만든 게 아닙니다. 매 경기를 예측해 볼 수 있는 승률도 고안했습니다. 각 팀의 승률을 기준으로 두 팀 간 예상 승률을 알아낸 것입니다. 이것이 바로 로그(log)5 공식입니다.
두 팀의 승률을 이 공식에만 집어넣으면 계산은 끝입니다. 현재 1위를 달리고 있는 두산이 2위 SK와 만나서 이길 확률은 .521(=(.594-.594×.574)÷(.594+.574-2×.594×.574))입니다. 같은 방식으로 계산하면 두산이 한화를 이길 확률은 .709입니다.
당연히 상위권 팀이 하위권 팀을 이길 확률이 높고 그 반대도 마찬가지로 나타납니다. 실제 야구에서 특수한 '먹이사슬'이 존재하는 건 사실이지만 이 공식과 큰 차이는 없습니다. 결국 많이 이긴 팀이 상위권에 올라가고 별로 못 이긴 팀이 하위권에 쳐지는 구조니까요.
그런데 시즌 초반에는 현재와 상황이 달랐습니다. 8연패에 빠졌을 때 히어로즈를 만나는 팀과 6연승을 거둘 때 만나는 팀은 느낌이 다르겠죠?
그래서 시즌 초부터 매일 매일 승률에 따라 각 팀 간 예상 승률을 구했습니다. 이를테면 히어로즈가 매일 맞붙는 상대 팀을 이길 확률을 그래프로 나타내면 아래 그래프처럼 나타납니다.
이 승률 평균을 내보면 어떤 상대와 맞붙었는지 알 수 있지 않을까요? (편의상 이렇게 계산해 나온 승률을 '스케줄 승률'이라고 부르겠습니다.)
롯데랑 히어로즈는 힘들었구나…
스케줄 승률 1위는 SK(.658)입니다. 1위를 오래 지켰고 또 (경기 당일 기준으로) 하위권 팀과 맞붙은 경기도 많았다는 방증일 겁니다. 2위는 두산(.611), 3위는 KIA(.567)입니다. 굳건한 3강 체제는 여기서도 확인됩니다.구단 | 승률 | 피타고라스 승률 | 스케줄 승률 |
두산 | .594 | .615 | .611 |
SK | .574 | .607 | .658 |
KIA | .537 | .573 | .567 |
히어로즈 | .462 | .456 | .385 |
LG | .456 | .480 | .440 |
롯데 | .448 | .427 | .363 |
삼성 | .433 | .437 | .476 |
한화 | .375 | .426 | .500 |
거꾸로 스케줄 승률이 가장 낮은 팀은 롯데(.363)와 히어로즈(.385)입니다. 순위도 낮고 상위권 팀과 경기도 많았지만 실제 승률을 보면 나름 선전을 했다고 볼 수 있습니다. LG도 실제 승률과 차이를 보이지만 이 두 팀 수준은 아닙니다. 시즌 초반 2위까지 올라간 데서 손해를 봤지만 또 스케줄이 그렇게 나쁜 편은 아니었다고 해석해도 큰 무리는 없을 것 같습니다.
한화는 역시 문제입니다. 스케줄 승률이 5할이나 되는데 승률은 .375밖에 안 됩니다. 좋은 쪽으로든 나쁜 쪽으로든 차이가 가장 큽니다. 한화 팬들껜 죄송한 얘기지만, 현 상태라면 후반기 반등도 기대하기 어려울 것 같습니다. 앞으로는 더 험난한 일정이 기다리고 있을 확률이 크니까요.
그럼 네 개 팀 중에 어떤 팀이 끝까지 4강 싸움을 벌일까요? 저는 히어로즈와 LG를 선택하고 싶지만, 손민한이 돌아왔다는 것을 숫자는 모르니 좀 더 지켜봐야 되겠죠?