타자가 공격을 하는 가장 중요한 이유는 뭘까요? 당연히 '득점을 올리려고'입니다. 그럼 득점은 왜 하려고 하는 걸까요? 너무도 당연하게 '경기에서 이기려고'입니다. 그게 야구라는 경기 최종 목적이고, 또 야구 선수가 야구를 하는 가장 중요한 까닭입니다.
타자들이 득점을 생산해 내는 방식은 다양합니다. 득점 창출에 관여하는 방식이 다양하다는 의미죠. 따라서 어느 한두 가지 기록으로는 타자가 실제 팀 득점에 얼마나 공헌했는지를 알아내기란 쉬운 일이 아닙니다. 그래서 1차 자료, 즉 Raw Stats를 가공한 새로운 공식이 세상에 나오게 됐습니다.
이런 2차 스탯 중 제가 가장 신뢰하는 지표 하나가 XR입니다. XR은 eXtrapolated Runs 약자로 RC(Runs Created)와 마찬가지로 필드에서 벌어진 이벤트 각각에 대해 가중치를 부여한 다음 선형가중방식(Linear Weights Formula)으로 산출한 추정 득점입니다. 공식을 보시면 ;
XR = (0.49 x 1B) + (0.79 x 2B) + (1.06 x 3B) + (1.42 x HR) + (0.34 x (HP + BB - IBB)) + (0.25 x IBB) - (.090 x (AB - H - K)) - (0.098 x K) + (0.18 x SB) - (0.32 x CS) - (0.37 x GIDP) + (0.37 x SB) + (0.04 x SH)
언뜻 복잡한 듯 보이지만 득점에 도움이 되는 이벤트는 더하고 그렇지 않은 이벤트는 빼는 방식으로 더하고 빼면 그만입니다. 물론 각 이벤트별로 가중치가 다릅니다. 이를테면 단타는 0.49점과 가치가 갖고 '그거(병살타)'는 0.37점 손해입니다. 이 가중치는 Jim Furtado라는 사람이 개별 이벤트를 득점과 연관짓는 시뮬레이션을 통해 얻어낸 수치입니다.
그럼 이 XR이란 놈이 실제 득점과 맞아 떨어지느냐를 알아봐야겠죠? 이걸 어떻게 알아볼까요?
1) 우긴다.
2) 믿어 살라고 사정한다.
3) 엑셀 양에게 물어본다.
4) 그냥 그런가 보다 하고 넘어간다.
찍을 때는 3번! 그랬더니 ;
엑셀 양이 R² .9699라는 결과를 알려주었습니다. XR 변화가 득점 변화 96.99%를 설명할 수 있다는 뜻입니다. 거의 일치한다고 봐야겠죠?
이제 우리는 한 타자 XR이 그 선수가 생산해 낸 득점을 잘 설명해준다는 사실을 알게됐습니다. 그럼 이렇게도 이런 걸 알아볼 차례입니다. 많은 득점을 올리는 게 경기를 이기는 것과 얼마나 부합하는 걸까?
실점도 고려해서 한번 알아보겠습니다. 득점과 실점을 통해 팀의 예상 승수를 구해보는 게 바로 피타고라스 승률입니다. 피타고라스 승률은 얼마나 정확할까요? 이번에도 엑셀 양에게 물어봤습니다. 그래프를 보시면 ;
R² .8712 상당히 설명력 높습니다. 무승부도 나온다는 점을 고려하면 굉장한 수치를 보여준다고 생각합니다.
여기서 한 가지 관점을 더 끌어와 보겠습니다. 빌 제임스가 얘기한 'Marginal Runs(MR)'라는 녀석입니다. 쉽게 말씀드리면 MR은 팀이 '추가적인 1승'을 거두기 위해 필요한 점수입니다. 이렇게 구합니다.
MR = (팀 득점 - 리그평균득점 ÷ 2) + (리그평균실점 × 1.5 - 팀 실점)
한번 보기를 통해 이 접근법이 얼마나 설득력이 있는지 알아보겠습니다. 세 팀이 126 경기를 치르는 리그가 있다고 치겠습니다. 각 팀별 득·실점은 다음과 같습니다.
A : 700 득점, 600 실점
B : 650 득점, 650 실점
C : 600 득점, 700 실점.
피타고라스 승률을 구해 보면 A : .570, B : .500, C : 0.430으로 나옵니다.
126 경기를 뛴다고 했으니까 무승부를 고려하지 않을 때 예상 승수는 A : 72승, B : 67승, C : 54승이 되겠습니다.각 팀별 MR은 A : 750, B : 650, C : 550 이렇게 됩니다. 표로 한번 비교해 보겠습니다.
750점 / 72승 , 650점 / 67승, 550점, 57승. 뭔가 그럴 듯한 관계가 있다고 보이지 않으십니까?
실제로 MR을 구해 팀 승수와 비교해 보면 ;
R²=.7712 괜찮은 설명력입니다.
공격으로 질 수는 없습니다. 득점을 한 점도 올리지 못한다고 해도 그것 때문에 경기에서 진 건 아닙니다. 1점이라도 실점한 투수·수비력에 문제가 있는 거지 공격력 때문에 진 건 아니라는 소리입니다. 거꾸로 투수진이 연일 영봉을 한다고 해도 경기에서 이긴 건 그들 때문이 아니라 타자들 때문입니다. 요컨대 타격이라는 관점에서는 상대팀보다 1점이라도 더 뽑아내는 게 중요하고 결국 승리는 타격의 몫입니다.
지금까지 득점을 올리는 게 승수를 쌓는 원동력이라는 너무도 당연한 사실을 숫자로 증명해 봤습니다. 그 전에는 XR이 실제로 타자가 득점 창출에 공헌한 정도를 증명한다는 사실도 알아봤습니다. 그럼 XR이 높은 타자가 득점 생산이라는 측면에 있어 가장 지대한 공헌을 했다고 주장해도 틀린 게 아니겠죠? 그리고 그 선수가 팀 승리에 기여한 바가 가장 크다고 해도 무리가 따르지 않는 주장일 것입니다.
역대 XR 상위 30걸을 보겠습니다.
XR로 보면 이승엽 선수는 아시아 홈런 신기록(56개)을 세운 2003년보다 1999 시즌 활약이 더 뛰어났습니다. 사실 XR 공식 가중치는 시대별로 영향을 받는 게 사실입니다. 투고타저 시절에 갖는 1점이 역인 상황에서 1점과 다르다는 건 직관적으로 알 수 있습니다. 그런 점에서 1992 시즌 장종훈 선수도 괴물이었습니다. 이종점 선수의 '94 시즌이야 신문에 따로 이 선수의 기록 변화를 보여주는 꼭지까지 있을 정도였으니 패스.
XR은 누적 수치입니다. 따라서 경기수가 적었던 시절 선수들은 명단에서 빠질 수밖에 없습니다. XR을 타석 숫자로 나눠 XA 수치를 구하면 프로 원년(1982년) 백인천 선수가 .259로 높은 수치를 보입니다. 말이 나온 김에 XA 상위 30걸도 알아보겠습니다.
태평양 팬으로서 김동기 선수가 29위에 올라온 게 아주 반갑게 느껴집니다. XR에서도 그랬지만 호세 선수는 정말 너무도 강렬한 임팩트를 남기고 떠난 것 같습니다. 장효조, 이정훈, 김봉연 같은 추억의 강타자들도 당연하다는 듯 자리를 지키고 있습니다.
위에서 확인한 것처럼 MR은 추가적인 1승을 얻기 위한 득점입니다. 126 경기를 기준으로 했을 때 득·실점이 평균인 팀은 승률 .500(63승)을 기록하게 됩니다. 이 때 64승을 올리려면 몇 점이 더 필요한가 하는 게 바로 MR 개념입니다. 일반적으로는 10점입니다. 하지만 팀마다 득·실점에 따라 이 점수가 달라질 수 있습니다.
예를 들어 1993년 쌍방울은 추가적인 1승을 거두는 데 6.51점이면 충분했습니다. 반면 1999년 쌍방울은 14.55점이나 필요했습니다. 이 둘이 역대 최저치와 최고치입니다. 만약 XR 14.55를 기록한 타자 A가 있다면 1999년 쌍방울에서 A가 팀에게 안긴 추가 승수는 1승입니다. 이 숫자는 1993년에는 2.24승으로 올라갑니다. 나머지 타자 8명이 리그 평균 성적을 올렸다면 그렇다는 뜻입니다. A를 제외한 나머지 타자가 평균이었다면 기본 승수 63승에 2.24승을 더한 65.24승, 승패에 소수점은 없으니까 65승을 거둘 수 있었던 셈입니다.
이런 논리를 바탕으로 각 시즌별 팀별 MR을 계산해 각 타자가 팀에 추가로 선물한 승수를 계산해 봤습니다. 그 상위 30걸은 ;
이승엽 선수도 그렇습니다만, 이종범 선수 정말 대단합니다.
그런데 500점을 올린 팀에서 100점을 만들어낸 선수와 300점밖에 못내는 팀에서 100점을 만들어낸 선수가 차지하는 팀 내 비중이 다를 수밖에 없다. 따라서 한 선수 XR이 팀 전체 득점에서 차지하는 비율을 계산하면 팀 내 공격력의 몇 %나 책임졌는지 알아볼 수 있을 것입니다. 그렇게 구한 30걸입니다.
'94 이종범 선수는 정말 괴물이었죠? '양신' 양준혁 선수야 뭐 ^^; 김기태 선수, 참 군계일학(群鷄一鶴)이었고 고군분투(孤軍奮鬪)했습니다. 홍현우 선수는 정말 안타까운 케이스가 아닐 수 없고, '96 '리쿠' 박재홍 선수도 정말 훌륭했습니다. '84 시즌 삼미 정구선 선수, 2003년 괴수두목(김태균), '85 시즌 박종훈 선수, '95 장종훈 선수, '85 신경식 선수 모두 팀이 5할 밑을 허덕이는데 올린 수치라 해당 팀 팬들에게는 남다른 의미로 기억돼 있으리라 봅니다.
여기서 아이디어를 얻어, 계산 하나를 해봤습니다. 팀이 못하는데 나홀로 잘하는, 이른바 군계일학(群鷄一鶴) 지수. 기본 원리는 아주 단순합니다. 1) 팀 성적이 안 좋다. 2) 그 선수는 잘했다. 3) 팀 내에서 차지하는 비중이 높았다. 따라서 팀이 못하면 못 할수록, 선수가 잘했으면 잘했을수록, 비중이 높으면 높을수록 높은 수치를 보입니다. 여기에 해당하는 30걸 명단입니다.
김기태 선수, 정말 지존입니다! 이동수 선수도 장래가 촉망되던 신인왕 출신이었는데 기대만큼 꽃을 피우지는 못했습니다. 쌍방울과 더불어 삼미 - 청보 - 태평양 라인 눈에 많이 들어옵니다. 지난해 홈런왕 박경완 선수 이름도 보이네요. 롯데도 심심찮게 -_-; 빙그레-한화 라인도 제법 -_-; 삼성에선 역시나 양신 ^^; 31위도 김기태 선수라는 사실을 알려드리면서 넘어가겠습니다.
야구 통계 이야기를 쓰면 살아 있는 야구는 보지 않고 죽은 야구를 본다고 지적하시는 분들도 많이 계신다는 것 압니다. 하지만 통계는 죽어 있는 지난 역사 속의 야구에도 생명을 불어넣습니다. 야구의 기본적인 룰과 원리가 바뀌지 않는 이상 통계는 유효합니다. 살아 있는 야구를 사랑하는 방법은 많습니다. 하지만 죽은 야구를 사랑하는 법은 그리 많지 않습니다. 기억이란 왜곡되게 마련이고 추억이란 저마다의 잣대가 너무도 굳건한 법이니까요.
숫자는 거짓말을 하지 않습니다. 그걸 받아들이는 기준이 다를 뿐입니다. 그리고 때로는 다른 걸 넘어 '틀릴' 수도 있습니다. 이번에 한 제 작업이 '틀린 것'이 아니길 바라며 글을 마칩니다.