여기는 스포츠가 공용어입니다.


❝스포츠에서 유일한 것이 승리라면 이기는 그 순간 다시 경합을 벌여야겠다는 욕구는 사라질 것이다. 그렇다면 마이클 조던과 로저 클레멘스가 나이 마흔에 계속 경쟁을 벌였던 사실을 어떻게 이해할 것인가.❞

─ '소크라테스 야구장에 가다' 中에서

RC란 무엇인가?


혹시라도 세이버메트릭스에서 사용되는 용어들에 대해 좀더 이해하고자 하시는 분이 계실지 모르겠다는 생각으로, 그리고 여러분들께 일러드리기보다 제가 공부하겠다는 생각으로 한번 몇몇 메트릭들에 대해 이야기 해보는 일련의 게시물들을 포스팅 해볼까 합니다.

이런 의도로, 현재 파울볼 내 여성 유저들에게, 정확히 표현해 누님 유저분들께 가장 큰 사랑을 받고 계신 Lenore 님께 여쭤본 결과 우선순위로 결정된 것이 빌 제임스의 RC(Runs Created, 득점 창출)였습니다. 그리하여 먼저 이번에 RC, 이어서 XR을 우선적으로 알아보도록 하겠습니다.

RC는 매우 직관적인 메트릭입니다. 그러니까 선형회귀분석 등의 통계적 수단에 근거한 복잡 오묘한 스탯이 아니라, 상식을 바탕으로 함 엄밀성을 추구 야구 경기가 실제로 진행되는 방식을 기본으로 이루어진 메트릭이라는 말씀입니다. 물론 말은 이렇게 하지만, 사실 공식 자체는 제법 복잡한 편입니다. -_-;

하지만 사실 원리는 단순합니다. 토대를 이루는 기본적인 틀은 ;

RC = (A×B)/C로 쓸 수 있습니다.

영어 표현을 쓰자면, Where ; A = H + BB, B=TB, C=AB+BB 이렇게 됩니다. 그러니까 A는 주자가 루상에 출루하는 것, B는 선행 주자 및 타자 주자 자신을 진루시키는 것, 그리고 C는 그 기회를 뜻한다고 볼 수 있습니다.

말씀드리자면, 어떻게든 살아서 출루에 성공하고, 그 주자를 홈으로 불러 들여 득점을 올리는 것, 이게 야구 경기에서 공격의 가장 중요하고 또 기본적인 목적 아니겠습니까? 그리고 이는 사실 상식적으로 충분히 납득이 가는 내용입니다. 이러한 상식을, 기본 원리를 수학적 공식을 빌어 표현한 것이 바로 RC인 셈입니다.

이 공식으로 이번 시즌 서튼 선수의 활약을 알아보면 ;

A = 124 + 78
B = 251
C = 424 + 78

RC = 101

RC라는 정의에 출실하자면, 이는 서튼 선수가 101점을 창출해 냈다는 뜻입니다. 타점이나 득점 모두 100점 이상이면 대단하다고 할 만하지 않습니까? 마찬가지로 RC가 100을 넘어 간다는 것 역시 대단한 활약을 펼쳤다는 뜻입니다.

하지만 한눈에 보기에도 뭔가 부족하다는 생각이 드는 게 하나 있습니다. 가장 손쉽게 예를 들자면, 도루가 빠졌죠. 도루 역시 한 루를 더 진루하는 효과를 유발하는 이벤트인데 위의 공식에서는 전혀 고려되고 있지 않습니다. 그리하여 공식에 약간의 변화가 일어나게 됐습니다.

A = H + BB - CS
B = TB + 0.55 × SB
C = AB + BB

이를 일반적으로 도루 버전 RC라 칭합니다. A, B, C가 구성되는 원리는 기본적으로 위와 같습니다. 이런 방식으로 부족함을 채우면서 공식은 계속해서 진화를 거듭하게 되고, 이 과정에서 대략 20개가 넘는 파생 공식들이 생겨나게 됩니다. 흔히 이를 Tech뒤에 숫자를 붙여 표현하고는 합니다. 이에 대한 자세한 설명은 생략하겠습니다.

이렇게 진화를 거듭한 결과, 2002년 빌 제임스는 자신의 저서 『Win Shares』에서, 현재까지 제가 알고 있는 마지막 버전의 RC를 소개하게 됩니다.

A = H + BB + HBP - CS - 그거
B = TB + 0.24 × (BB - IBB + HBP) + 0.62 × SB + 0.5 × (SH + SF) - 0.03 × SO
C = AB + BB + HBP + SH + SF

A에서는 더하고 빼는 과정이 '직관적'으로 이해가 갑니다. B의 가중치 역시 상대치를 고려하자면 그럴 듯해 보입니다. 삼진이 (-) 가중치를 갖게 되는 건, B의 의도에 충실하기 위해서입니다. 타자가 삼진을 당한다면, 타자의 힘으로는 주자를 진루 시킬 수가 없겠죠?

기본 공식에도 약간(?)의 변화가 찾아옵니다.

RC = (((2.4 × C + A) × (3 × C + B))/(9 × C)) - (0.9 × C)

사실 얼핏 복잡해 보이지만, 기본 원리는 그대로 유지한 상태입니다. 결론만 말씀드리자면, 이는 라인업에 나머지 8명의 타자가 가상의 평균적인 타자로 채워져 있는 경우를 고려해 설계된 모델입니다. 물론 동일한 숫자만큼 타석에 들어선다는 상황 역시 고려돼 있습니다. 여기서 평균적인 타자는 출루율 .300, 장타율 .400을 기록하는 선수를 뜻합니다.

따라서 A에는 8 × .300 = 2.4, B에는 8 × .400 ≒ 3의 가중치가 붙은 것입니다. 이렇게 가중치를 두고 구한 (A×B)/C에서 평균적인 8명의 수치를 제외하면, 바로 해당 타자의 RC가 산출되는 것입니다. 그리고 이 지점에서 여태껏 등장하지 않았던 새로운 요소 D가 등장합니다.

D = (HRRISP - (ABRISP × AVG)) + (HRROB - (ABROB × HR/AB))

RISP가 뒤에 붙은 건 Runners In Scoring Position, 즉 득점권 상황을 나타내고, ROB는 Runners On Base 즉 루상에 주자가 나가 있는 상황을 의미합니다. HR는 홈런, AB는 타수. 만약 이런 데이터를 구할 수 있다면, 위에서 계산된 값에 D를 더하면 바로 한 타자의 RC가 최종적으로 구해지는 셈입니다.

D를 더하지 않은 이번 시즌 RC 순위는 ;

1. 서튼 108.15
2. 데이비스 97.10
3. 김태균 94.98
4. 김재현 91.40
5. 심정수 88.39

이상이 RC의 원리이고, 또 공식입니다. 야구 공격의 기본적인 원리, 그리고 각 이벤트들이 갖는 가중치, 또한 라인업의 구성. 이 모두를 고려해 만들어진 메트릭이고 실제 득점과 비교할 때 상당히 높은 설명력을 갖기도 합니다.

이런 RC를 바탕으로 몇 가지 부수적인 메트릭이 등장하기도 했습니다. 가장 대표적인 게 RC/27입니다. 먼저 공식부터 보여 드리면 ;

RC/27 = ( RC / (AB-H+SH+SF+CS+GIDP)) × 27 또는

RC/27 = (( RC × 3 × LgIP)/(2 × LgG))/(AB-AB-H+SH+SF+CS+GIDP)

양쪽 모두 27개의 아웃 카운트, 즉 한 경기를 치르는 동안 한 타자가 몇 점이나 창출해 낼 수 있느냐를 근간으로 하고 있습니다. LgIP는 리그 전체 이닝, LgG는 리그의 전체 경기수를 뜻합니다. 참고로, 견제사/주루사 등으로 아웃 당하는 경우를 고려, RC/25가 사용되기도 합니다.

이번 시즌 RC/27 순위는 ;

1. 서튼 8.78
2. 김재현 7.93
3. 데이비스 7.93 (김재현 선수가 6모 정도 앞섰습니다.)
#. 김동주* 7.10 (규정타석 미달)
4. 김태균 7.09
5. 심정수 6.74

이 RC/27을 이용해, 세이버쟁이들은 OWP라는 메트릭을 또 만들어 냈습니다. OWP는 Offensive Winning Percentage의 약자입니다. 한 선수로만 이루어진 가상적인 타선이 리그 평균의 투수진과 수비진으로 한 팀을 이룬다면 과연 몇 %의 승률을 얻어낼 수 있을까를 보여주는 지표입니다. 뭐 방법론은 피타고라스 승률이겠죠?

OWP = (RC/27 ^ 1.83)/((RC/27^1.83)+(LgR/G^1.83))

여기서 LgR/G는 경기당 평균 득점. 그러니까 상대에게 경기당 평균 점수를 계속 허용한다고 할 때, 이 타자의 공격력으로는 몇 %나 승리를 거둘 수 있나, 를 보여준다고 하겠습니다.

한 타자만 예로 들어 설명해 보자면, 서튼 선수의 RC/27은 8.78입니다. 리그 평균 득점은 4.59. 이 데이터를 바탕으로 위 공식에 대입해 보면, 약 .766의 기대 승률을 구할 수 있습니다.

이상으로 간략하게(?) RC에 대한 설명을 마칠까 합니다.



+
2002 버전 Win Shares 공식은 B만 변경

B = 1.125 ×단타 + 1.69 × 2루타 + 3.02 × 3루타 + 3.73 × 홈런 + 0.29 × (BB - IBB + HBP) + 0.492 × (SB + SH + SF) - 0.04 × SO


댓글,

더 보기