요즘 우리 프로야구는 '희망 고문'이 한창입니다. 시즌 중반에 돌입하면서 일주일 동안 4~7위 네 팀이 모두 자리를 바꿀 정도로 혼전을 거듭하고 있습니다. 미끄러진 팀 팬은 그래도 곧 제 자리를 찾을 것이라고 믿고, 순위가 오른 팀 팬은 또 어쩐지 불안한 가운데서도 그 자리가 굳건하기를 바랍니다. 그런데 혹시 야구 성적을 예측할 수 있는 도구는 없는 걸까요?

사용자 삽입 이미지

야구에 웬 피타고라스 법칙?

우리말로 흔히 '야구 통계학'이라고 번역하는 세이버메트릭스(Sabermetrics)의 아버지 빌 제임스는 1990년대 초반 "각 팀의 시즌 중반 승률보다 득점, 실점이 최종 승률을 예측하는 데 효과적"이라는 주장을 펼칩니다. 그러면서 우리가 중학교 때 배우는 피타고라스 정리를 이용해 '피타고라스 승률'이라는 것을 만들어 소개합니다.

사용자 삽입 이미지
피타고라스 승률은 기본적으로 득점과 실점의 거듭제곱을 가지고 계산합니다. 처음에는 거듭제곱 지수로 2를 쓰는 게 보편적이었지만 "1.83을 쓰는 게 맞다", "아니다, 로그 지수를 써야 한다"는 주장까지 등장한 상태입니다. 엄밀함에 대한 접근은 다르지만 이들이 시즌 예측을 위해 피타고라스 승률을 쓴다는 사실은 여전합니다.

피타고라스 승률로 현재 프로야구 각 팀 상황을 알아보면 두산(.615), SK(.607), KIA(.573)는 흔들림이 없습니다. 실제 승률과 차이를 보이지만 순위가 바뀔 정도는 아닙니다. 올 시즌 프로야구는 현재까지 굳건한 3강 체제입니다.

반면 6위 LG는 .480으로 5위 히어로즈(.456)보다 피타고라스 승률이 높습니다. 7위 삼성(.437)도 6위 롯데(.427)보다 좋은 면모를 보이고 있습니다. 이 예상이 맞다면 앞으로 프로야구 순위는 LG-히어로즈-삼성-롯데 순서로 정리될지 모르겠습니다.

그런데 5위 히어로즈는 2위 SK와 12경기나 치른 반면 8위 한화하고는 8경기밖에 안 했습니다. LG는 한화와 12경기, SK와 9경기입니다. 1위 두산과는 히어로즈가 8경기, LG가 9경기로 큰 차이가 없습니다. 혹시 상대 경기 숫자 차이에 따라서 승률에 영향을 받은 건 아닐까요?


이번엔 로그5 공식이라고?

제임스는 시즌 전체만 예상하는 공식을 만든 게 아닙니다. 매 경기를 예측해 볼 수 있는 승률도 고안했습니다. 각 팀의 승률을 기준으로 두 팀 간 예상 승률을 알아낸 것입니다. 이것이 바로 로그(log)5 공식입니다.

사용자 삽입 이미지

두 팀의 승률을 이 공식에만 집어넣으면 계산은 끝입니다. 현재 1위를 달리고 있는 두산이 2위 SK와 만나서 이길 확률은 .521(=(.594-.594×.574)÷(.594+.574-2×.594×.574))입니다. 같은 방식으로 계산하면 두산이 한화를 이길 확률은 .709입니다.

당연히 상위권 팀이 하위권 팀을 이길 확률이 높고 그 반대도 마찬가지로 나타납니다. 실제 야구에서 특수한 '먹이사슬'이 존재하는 건 사실이지만 이 공식과 큰 차이는 없습니다. 결국 많이 이긴 팀이 상위권에 올라가고 별로 못 이긴 팀이 하위권에 쳐지는 구조니까요.

그런데 시즌 초반에는 현재와 상황이 달랐습니다. 8연패에 빠졌을 때 히어로즈를 만나는 팀과 6연승을 거둘 때 만나는 팀은 느낌이 다르겠죠?

그래서 시즌 초부터 매일 매일 승률에 따라 각 팀 간 예상 승률을 구했습니다. 이를테면 히어로즈가 매일 맞붙는 상대 팀을 이길 확률을 그래프로 나타내면 아래 그래프처럼 나타납니다.

사용자 삽입 이미지

이 승률 평균을 내보면 어떤 상대와 맞붙었는지 알 수 있지 않을까요? (편의상 이렇게 계산해 나온 승률을 '스케줄 승률'이라고 부르겠습니다.)

롯데랑 히어로즈는 힘들었구나…

스케줄 승률 1위는 SK(.658)입니다. 1위를 오래 지켰고 또 (경기 당일 기준으로) 하위권 팀과 맞붙은 경기도 많았다는 방증일 겁니다. 2위는 두산(.611), 3위는 KIA(.567)입니다. 굳건한 3강 체제는 여기서도 확인됩니다.

 구단  승률  피타고라스 승률  스케줄 승률
 두산  .594  .615  .611
 SK  .574  .607  .658
 KIA  .537  .573  .567
 히어로즈  .462  .456  .385
 LG  .456  .480  .440
 롯데  .448  .427  .363
 삼성  .433  .437  .476
 한화  .375  .426  .500

거꾸로 스케줄 승률이 가장 낮은 팀은 롯데(.363)와 히어로즈(.385)입니다. 순위도 낮고 상위권 팀과 경기도 많았지만 실제 승률을 보면 나름 선전을 했다고 볼 수 있습니다. LG도 실제 승률과 차이를 보이지만 이 두 팀 수준은 아닙니다. 시즌 초반 2위까지 올라간 데서 손해를 봤지만 또 스케줄이 그렇게 나쁜 편은 아니었다고 해석해도 큰 무리는 없을 것 같습니다.

한화는 역시 문제입니다. 스케줄 승률이 5할이나 되는데 승률은 .375밖에 안 됩니다. 좋은 쪽으로든 나쁜 쪽으로든 차이가 가장 큽니다. 한화 팬들껜 죄송한 얘기지만, 현 상태라면 후반기 반등도 기대하기 어려울 것 같습니다. 앞으로는 더 험난한 일정이 기다리고 있을 확률이 크니까요.

그럼 네 개 팀 중에 어떤 팀이 끝까지 4강 싸움을 벌일까요? 저는 히어로즈와 LG를 선택하고 싶지만, 손민한이 돌아왔다는 것을 숫자는 모르니 좀 더 지켜봐야 되겠죠?
신고

 Sportugese
• 내용이 마음에 드셨다면 이 블로그를 '좋아요' 해주세요


• 매일매일 스포츠 이야기를 나누시려면 Sportugese 페이스북 페이지를 찾아주세요

• 트위터에 @sportugese도 열려 있습니다 

• 계속 블로그 내용을 받아보고 싶으시면 RSS 구독 신청을 해주시면 감사하겠습니다

• 인터넷 주소창에 http://kini.kr를 입력하시면 언제든 Sportugese와 함께 하실 수 있습니다

• 떠나시기 전 이 글도 추천해주세요