여기는 스포츠가 공용어입니다.


❝스포츠에서 유일한 것이 승리라면 이기는 그 순간 다시 경합을 벌여야겠다는 욕구는 사라질 것이다. 그렇다면 마이클 조던과 로저 클레멘스가 나이 마흔에 계속 경쟁을 벌였던 사실을 어떻게 이해할 것인가.❞

─ '소크라테스 야구장에 가다' 中에서

지난번에 불양 형님께서 아스트랄한 제목이라 표현해 주셨던, <피타고라스 승률이란 무엇인가?>라는 졸고(拙稿)를 보시면 이번 시즌 피타고라스 승률과 실제 승률간에는 약 18포인트 정도 오차 가 존재합니다. 그 결과 승수로는 약 2.2 경기 정도 차이가 나게 됩니다. 국내 리그는 무승부 때문에 승률 계산에 반영하는 총 경기 숫자가 팀마다 달라서 이 차이가 더 벌어질 수 있다는 점도 말씀드렸습니다.


공교롭게도 이런 차이가 확실히 드러난 팀이 바로 1, 2위 삼성과 두산이었습니다. 물론 시즌 최종일에 3위로 주저 앉은 SK 역시 무승부를 제외하고 계산한 피타고라스 승수보다 1승 적은 70승에 만족해야 했습니다만 이는 무승부가 6 경기로 가장 많은 탓이었을 겁니다. 그래서 SK를 논외로 치면 삼성은 피타고라스 승수보다 4승을 더 거둔데 반해 두산은 3승이 적었습니다.


피타고라스 승률은 득점은 많고 실점이 적은 팀이 더 많이 이긴다는 걸 기본 전제로 삼고 있습니다. 따라서 득점과 실점 사이 차가 크면 클수록 승수를 더 많이 올리기에 유리합니다. 이 차이는 두산이 앞섭니다. (삼성 ; 86, 두산; 131) 하지만 어제 11:0으로 이기고 오늘 0:2로 졌다고 해서, 어제 경기에서 불필요한(?) 10점을 끌어다 10:2로 2승 무패를 만들 수는 없는 노릇입니다.


제 글을 꾸준히 읽어오신 분이라면 제가 득점분포에 관심이 많다는 걸 아실지도 모르겠습니다. 전반기가 끝나고 <득점별 승률에 관하여>, <실점별 승률에 관하여>라는 졸작(拙作)을 올리기도 했고, 또 제 준플레이오프 시뮬레이션과 관련해 pooias 님께서 올려주신 글에 답글을 달면서 말씀을 드리기도 했습니다. 


기본적으로 한 팀 득점 분포는 통계적으로 고르지가 않습니다. 어떤 동일한 분포 곡선을 따라 발생하지는 않는다는 뜻입니다. 하지만 어떠한 시행이든 시도 횟수가 늘어나면 정규분포와 가까운 발생 모양이 나타나게 됩니다. 한 시즌 득점 분포만 봐도 이와 유사한 모양을 보입니다. 최근 세이버메트릭스 블로그 BTB에서는 오클랜드와 LAA의 득점 분포 차이를 다루면서 와이블 분포를 소개하기도 했습니다. 굳이 이렇게 어려운 확률 분포를 끌고 오지 않아도 리그 전체 평균과 비교하면 어떤 팀이 유독 어떤 점수를 많이 얻고 잃었는지 알 수 있을 겁니다.


그럼 먼저 이번 시즌 득·실점별 승률을 알아보도록 하겠습니다. 다음은 이번 시즌 득점별 승률 현황. 실점별 승률은 [1 - 득점별 승률]을 구하시면 되겠죠? 득점이 0점이면 승률은 .000, 거꾸로 실점이 0점이면 승률은 1,000일 테니까요.



차이는 득점이 늘어나면 승률이 얼마나 증가하는지를 보여줍니다. 그러니까 3점에서 4점째을 올리는 순간 승률이 5할 이상으로 올라갑니다. 4점이라는 점수가 중요한 이유입니다. 또 일곱 번째 점수도 중요합니다. 승률이 .867까지 205 포인트나 상승하니 말입니다.


이제 우리는 두 팀의 득·실점 분포를 비교할 수 있는 기본 가정을 모두 세운 셈이 됐습니다.


1) 리그 평균과 비교할 때 각 팀의 득·실점 분포는 어떤 차이를 보이는가?

2) 이 차이에서 승률 차이는 얼마인가?


그럼 각 득·실점 상황에서 승패에 따라 승수에서 어느 정도 손익이 발생했는지 확인할 수 있을 겁니다. 이번 글은 이런 과정을 거쳐 마무리 짓는 걸로 하겠습니다.


그럼 양 팀의 득·실점 분포를 그래프로 확인해 보겠습니다. 먼저 삼성 ;



삼성 타선은 3점과 7점을 가장 많이 뽑아냈습니다. 위 표에서 확인해 보면 3득점 때 승률은 .301밖에 안 되고 7득점에서는 .867로 올라갑니다. 삼성이 세 번째로 높은 빈도를 기록한 건 승률 .179가 나오는 2점. 뭔가 약간 불안한 감이 들기도 하는 득점 분포입니다. 한편 실점에 있어서는 각각 2, 3, 4점이 차례대로 1, 2, 3위를 차지했습니다. 해당 실점에서 평균 승률은 .821 - .699 - .470입니다.


이어 두산을 보면 ;



두산은 4득점과 2득점을 가장 많이 기록했습니다. 두 점수에서 평균 승률은 각각 .530, .179였습니다. 2득점이 많다는 건 그다지 바람직한 일은 아닙니다. 그다음은 8점. 9할에 가까운 승률(.889)을 기대할 수 있는 득점입니다. 실점에서는 3실점과 2실점 이어서 5실점 순으로 실점 빈도가 높았습니다. 삼성과 비교할 때 5점이 많다는 건 그리 좋은 현상이 아니었겠죠.


이런 차이를 바탕으로 손익을 계산해 보죠. 먼저 양 팀의 득점별 승수와 승률입니다.



승수와 승률은 각각 해당 득점 때 기록을 나타냅니다. 주의해야 할 건 무(0)득점에 그쳤을 때. 이번 시즌 0득점 전체 평균은 6.4%였습니다. 126경기로 환산해 보면 8경기 정도가 나옵니다. 이 비울과 비교해 각 팀이 무득점으로 묶인 경우를 비교했습니다. 삼성은 무득점 경기 4번으로 기록 +4, 두산은 5 경기로 +3을 기록했습니다.

나머지 경기는 평균 승률과 실제 승수의 곱으로 몇 승이나 더 이득을 봤는지 계산하는 겁니다. 이렇게 나온 결과와 무점 때 (+)부분을 더한 결과가 計에 나와 있습니다. 그러니까 삼성은 득점 분포, 즉 공격의 힘으로 약 14승을 더 거뒀고, 두산은 9승 정도를 더 거뒀다고 할 수 있습니다.

이어서 실점입니다. 야구에서 공격으로는 질 수 없고 수비로는 이길 수 없습니다. 공격에서 이기고, 수비로는 지는 거죠. 그래서 실점에서는 승수 대신 팻수를 생각했습니다. 



득점별로 이길 확률은 실점별로 질 확률입니다. 그래서 '몇 패를 줄였는가'를 계산해 본 결과가 공격 떄와 마찬가지로 計에 나와 있습니다. 무실점도 마찬가지로 계산한 결과입니다. 삼성은 투수 및 수비진 힘으로 6패를 줄였고, 두산은 5패를 줄였습니다.

이를 토대로 승차 계산을 해보면 ((14-9)+(6-5))/2 = 3이 나옵니다. 실제로 두 팀은 2.5 경기 차이였습니다. 점수 분포를 보는 게 피타고라스 승률만 보는 것보다 중요한 의미를 지닌다는 걸 확인할 수가 있는 겁니다.

그럼 이를 토대로 무엇을 확인할 수 있을까요? 만약 이번 시즌이 끝나고 박명환과 김동주 선수가 FA로 풀릴 상황이었면 단순히 성적만으로 누구를 잡는 게 옳을까요? 그 판단은 여전히 여러분의 몫이지만, 어느 정도 해답이 드러난 것 같기도 합니다. 물론, 내년 시즌에도 꼭 같으라는 법은 없지만 말입니다. ^_^



댓글,

더 보기