2019 시즌 정규리그 마지막 등판에 나선 류현진. 샌프란시스코=로이터 뉴스1
대단합니다. '더 몬스터' 류현진(32·로스앤젤레스 다저스)이 제이컵 디그롬(31·뉴욕 메츠)의 추격을 뿌리치고 내셔널리그 평균자책점 1위 자리를 지켜냈습니다.
지난해 자이언상 사이영상 수상자인 디그롬은 25일(이하 현지시간) 안방 경기에서 7이닝 무실점으로 평균자책점을 2.43까지 낮추면서 시즌을 마감했습니다.
평균자책점 2.43을 기록 중이던 류현진이 선두 자리를 지키려면 △무실점 △2와 3분의 2이닝 이상 투구 & 1자책점 △6과 3분의 1이닝 이상 투구 & 2자책점 △10이닝 이상 투구 & 3자책점을 기록해야 하는 상황이었습니다.
복잡할 게 없었습니다. 류현진은 28일(이하 현지시간) 샌프란시스코 방문 경기에서 7이닝 무실점을 기록하면서 시즌 평균자책점을 2.32까지 낮췄습니다.
평균자책점 2.32는 내셔널리그는 물론 메이저리그 전체에서 제일 낮은 기록입니다. 아시아에서 태어난 투수가 메이저리그 양대 리그에서 평균자책점 1위에 오른 건 류현진이 처음입니다.
메이저리그 역사를 살펴봐도 아시아에서 태어난 선발 투수가 이보다 낮은 평균자책점을 기록한 적도 없습니다. 그 전까지는 다저스 팀 선배인 노모 히데오(野茂英雄·51)가 메이저리그 데뷔 시즌이던 1995년 남긴 2.54가 최저 기록이었습니다.
이날 류현진은 타석에서도 0-0으로 맞선 5회초 2사 3루에서 적시타를 터뜨리며 팀 승리를 이끌었습니다. 다저스는 결국 2-0으로 승리했기 때문에 이 점수가 결승점이 됐습니다. 류현진은 2013, 2014년에 이어 올해도 메이저리그 개인 통산 최다 타이 기록인 14승(5패)으로 시즌을 마감했습니다.
이 정도 성적이면 사이영상을 노려 봐도 괜찮지 않을까요? 그래서 컴퓨터에게 물어봤습니다.
머신러닝으로 2019 사이영상 예상하기
이 블로그를 꾸준히 읽어오신 분이라면 지난해 '머신러닝으로 2018 프로야구 최우수선수(MVP) 예상하기'라는 포스트가 올라왔던 걸 기억하실 겁니다. '더 하드볼 타임즈'(THT)에서 '그레이디언트 부스팅'이라는 머신러닝(기계학습) 방법으로 메이저리그 MVP와 사이영상 수상자를 예상한 걸 보고 '랜덤 포레스트' 기법으로 지난해 프로야구 MVP를 예상한 결과물이었습니다.
이번에도 기본적인 방법은 같습니다. 먼저 2009년부터 지난해까지 10년 동안 규정이닝을 채운 투수들 △투구 이닝 순위 △승리 순위 △패배 순위 △팬그래프스 대체 선수 대비 승리 기여도(fWAR) 순위 △평균자책점 순위 △수비 영향을 제거한 평균자책점(FIP) 순위 △삼진 순위 △볼넷 순위 △피홈런 순위 △9이닝당 탈삼진(K/9) 순위 △9이닝당 볼넷(BB/9) 순위 △삼진 대 볼넷 비율(K/BB) 순위 △인플레이타율(BABIP) 순위를 주고 사이영상 투표 점수를 예측하도록 했습니다.
그 결과 이 모델은 최근 10년 동안 양대 리그 사이영상 수상자 20명 가운데 18명을 맞췄습니다. 다저스가 속한 내셔널리그(NL) 사이영상 수상자는 전부 정확하게 맞췄고 아메리칸리그(AL)에서는 2012년과 2016년이 틀렸습니다.
연도 | 리그 | 예상 | 실제 | 결과 |
2009 | NL | 팀 린스컴 | 팀 린스컴 | O |
AL | 잭 그링키 | 잭 그링키 | O | |
2010 | NL | 로이 할러데이 | 로이 할러데이 | O |
AL | 펠릭스 에르난데스 | 펠릭스 에르난데스 | O | |
2011 | NL | 클레이턴 커쇼 | 클레이턴 커쇼 | O |
AL | 저스틴 벌랜더 | 저스틴 벌랜더 | O | |
2012 | NL | R A 디키 | R A 디키 | O |
AL | 저스틴 벌랜더 | 데이비드 프라이스 | X | |
2013 | NL | 클레이턴 커쇼 | 클레이턴 커쇼 | O |
AL | 맥스 셔저 | 맥스 셔저 | O | |
2014 | NL | 클레이턴 커쇼 | 클레이턴 커쇼 | O |
AL | 코리 클루버 | 코리 클루버 | O | |
2015 | NL | 제이크 아리에타 | 제이크 아리에타 | O |
AL | 댈러스 카이클 | 댈러스 카이클 | O | |
2016 | NL | 맥스 셔저 | 맥스 셔저 | O |
AL | 저스틴 벌랜더 | 릭 포셀로 | X | |
2017 | NL | 맥스 셔저 | 맥스 셔저 | O |
AL | 코리 클루버 | 코리 클루버 | O | |
2018 | NL | 제이컵 디그롬 | 제이컵 디그롬 | O |
AL | 블레이크 스넬 | 블레이크 스넬 | O |
혹시 선수 이름을 이상하게 썼다고 생각하실 때는 SBS 이성훈 기자가 쓴 이 기사를 참고해 주시면 감사하겠습니다.
이 데이터는 투수 총 751명이 들어 있었고 이 가운데 731명은 사이영상 수상자가 아니었는데 729명(99.7%)이 사이영상 수상자가 아니라고 예상했으니 나쁜 모델이라고 하기는 어렵습니다.
이 모델이 사이영상 투표에서 제일 중요한 기준이 된다고 판단한 건 평균자책점 순위였습니다. 평균자책점 순위가 중요한 정도를 100이라고 하면 그다음으로 중요한 승리는 61.3 수준에 그쳤습니다.
최신 투표 트렌드를 알아보려고 최근 10년 데이터를 넣었는데 미국야구기자협회(BBWAA) 투표인단 역시 아직은 퍽 고전적인 기록을 선호한다는 사실을 알 수 있습니다. 물론 우리가 밀고 있는 후보는 평균자책점 1위 류현진이기 때문에 꼭 나쁠 건 없습니다.
그래서 류현진은 사이영상을 탈 수 있을까?
이 모델에게 2019년 수상자를 예상해 보라고 한 결과 올해 NL 사이영상 수상자는…
한국 팬들에게는 애석하게도 디그롬으로 나타났습니다. 이 랜덤 포레스트 모델은 류현진이 2위도 아니고 스티븐 스트라스버그(31·워싱턴)에 이어 3위에 이름을 올릴 것이라고 예상했습니다.
위에서 보신 것처럼 최근 10년 동안 이 모델은 NL 사이영상 수상자 예상에 실패한 적이 없습니다. 11년 연속 성공을 이어 갈까요? 수상자가 류현진이라면 예상이 틀려도 기분이 나쁠 것 같지 않습니다.
이건 그냥 '기사적인 표현'으로 실제 이 모델이 리그에 따라 정확도가 달라지는 건 아닙니다. NL이 수상자와 아닌 선수 가운데 차이가 더 커서 정확도가 높았던 것뿐입니다.
올해 AL 사이영상 레이스에서는 휴스턴 팀 동료 게릿 콜(29)과 저스틴 벌랜더(36)가 접전 중인 것으로 나타났습니다. 이 정도면 누가 타도 이상하지 않은 분위기. AL에서는 이 모델이 올해도 틀릴 확률이 적지 않은 분위기입니다.
류현진은 MLB.com 인터뷰에서 "솔직히 말하면 나도 디그롬이 사이영상을 탈 만한 성적을 남겼다고 생각한다"면서 "올 시즌을 시작하기 전에는 평균자책점 1위 같은 건 생각하지도 못했고 건강하게 한 시즌을 보내자는 생각만 했다. 30번 선발 등판이 목표였는데 29번 성공했다. 내 노력이 보상받은 것 같아 기쁘다"고 말했습니다.