새로운 투수 스탯 DRA와 페드로 마르티네스

얼마 전 베이스볼 프로스펙터스Jonathan Judge가 DRA(Deserved Run Average)라는 투수의 새로운 스탯을 소개했다. 기존 RA9ERA와 같은 스탯을 좀 더 보정하여, 보다 상황 중립적인 환경에서 9이닝당 해당 투수가 마땅히 실점했어야 할 점수를 구한 것이다. 세부적인 계산 과정은 다음과 같다.

Step 1: 먼저 투수가 타자에 대해 허용한 각종 이벤트에 대해서, 매번 기대 실점(Run expectancy)을 부여하여 더한다. 각 이벤트에 대한 기대 실점 값은 2014년 기준으로 다음과 같다. (출처: 베이스볼 프로스펙터스)

  • 볼넷: +0.29
  • 고의사구: +0.17
  • 몸에 맞는 공: +0.31
  • 1루타: +0.45
  • 2루타: +0.72
  • 3루타: +1.00
  • 홈런: 1.40
  • 1아웃: -0.22
  • 2아웃: -0.76
  • 삼진아웃: -0.25

이벤트의 연속성 및 투수 교체 전/후 상황에 의해 좌우되는 실점과는 달리, 위 기대 실점은 매번 중립적인 상황을 가정하므로, 좀 더 객관적인 기대 실점값을 얻어낼 수 있다.

Step 2: 앞에서 구한 기대 실점에 대해서, 당시 투수가 투구했던 상황에 따라 조정한다. 그 조정 대상이 되는 요인들은 다음과 같다.

이를 통해서 파크팩터, 상대 타자, 프레이밍, 팀의 수비 수준 등에 의한 유/불리 상황이 중립화되며, 좀 더 중립적인 환경에서의 투수의 실점이 산출된다.

Step 3: 위에서 조정한 타석당 투수의 평균 대비 가치(value/PA)를 기반으로 최종 DRA를 계산한다. 이 때 추가적으로 다음의 사항을 더 고려한다.

위의 요인들을 반영할 때, 단순히 각 상수를 곱하여 더하는 방법(Multiple regression)이 아니라 MARS(Multivariate Adaptive Regression Splines) 방법을 사용했다. MARS는 여러 상호 독립적/비독립적 요인들 간의 관계를 단순 선형화하지 않고, 범위를 세부적으로 나눠 각 구간에 대해서 적응적으로 계수 및 기저 함수(Basis functions)를 다르게 정의하는 방식이다. 함수 모델을 결과에 매우 미세하게 일치시키므로 오차가 매우 낮고 정확하다. 이를 통해 얻어진 타석당 투수의 평균 대비 가치(value/PA)를 점수로 환산하여 9이닝으로 환산하면 DRA가 얻어진다.

그렇다면 이 DRA는 투수에게 어떤 의미를 지닐까? DRA는 투수의 실점을 중립적인 상황으로 조정한 값이다. 따라서 투수의 파크팩터, 포수/심판의 성향, 상대한 타자, 피안타의 연속성 등에 의한 유/불리함을 조정하고, 투수가 실점했어야 마땅한 값을 보여주는 것이다. 베이스볼 프로스펙터스는 이제 DRA를 기반으로 한 투수의 WAR(DRA_PWARP)를 제공하고 있다.

그럼 최근에 단일 시즌 기준으로 가장 낮은 DRA를 기록했던 선수는 누구일까? 아래는 최근 25년간 가장 낮은 DRA를 기록했던 투수 상위 25인의 리스트이다.

Rank Season Name DRA RA/9
1 2000 Pedro Martinez 1.03 1.87
2 2004 Jason Schmidt 1.23 3.30
3 1997 Pedro Martinez 1.49 2.46
4 1995 Greg Maddux 1.55 1.62
5 2004 Randy Johnson 1.64 3.29
6 2009 Zack Greinke 1.80 2.54
7 2009 Tim Lincecum 1.87 2.79
8 2013 Jose Fernandez 1.89 2.48
9 2013 Max Scherzer 1.90 3.09
10 2013 Matt Harvey 1.93 2.33
11 2013 Clayton Kershaw 1.93 2.14
12 2007 Erik Bedard 1.98 3.29
13 2011 Justin Verlander 2.01 2.66
14 1997 Roger Clemens 2.04 2.26
15 2004 Johan Santana 2.05 2.79
16 1992 Curt Schilling 2.11 2.63
17 1995 Randy Johnson 2.14 2.79
18 2011 Josh Beckett 2.15 3.07
19 2009 Chris Carpenter 2.17 2.32
20 2003 Pedro Martinez 2.17 2.52
21 2014 Clayton Kershaw 2.18 1.94
22 2009 Josh Johnson 2.20 3.38
23 1997 Greg Maddux 2.23 2.29
24 1992 Juan Guzman 2.27 2.84
25 2002 Curt Schilling 2.27 3.24

페드로 마르티네스의 2000년이 가장 낮았던 DRA 시즌이었다. 그는 실제로는 9이닝당 1.87점을 실점했지만, 매번 중립적인 상황이라고 가정했다면 1.03점을 실점했을 것이다. 한편, 그 다음으로는 2004년의 제이슨 슈미트가 1.23점의 DRA로 가장 낮았는데, 실제 그의 3.3 RA9와는 큰 차이를 보인다.

그런데 DRA 스탯을 해석할 때는 다소 유념할 사항이 있다. 첫째, 평균자책점(ERA)이 아닌, 실제 실점(RA9)에 스케일에 맞춰져 있다는 점이다. 따라서 ERA, FIP와 값을 비교하려면 DRA에 .92를 곱해야 한다. 둘째, 득점 환경에 따른 조정을 하지 않았다. 따라서 2000년 페드로 마르티네스와 2014년 클레이튼 커쇼의 DRA를 직접 비교하는 것은 큰 의미가 없다. 셋째, DRA는 FIP, SIERA, cFIP 등과 같이 투수의 실제 능력을 측정하기 위한 스탯이 아니다. 투수의 책임이 큰 삼진, 볼넷, 홈런 뿐 아니라 발생하는 모든 이벤트에 대해서 고려하고 있다. 따라서 기존 RA9, ERA와 마찬가지로 운(Luck)의 영향력이 매우 크며, 스탯의 예측력은 떨어진다. 실제 투수의 능력을 확인하고 싶다면 cFIP를 확인하는게 바람직하다. 특히, DRA 계산 시 사용된 MARS 분석 방법은 과잉적합(overfitted) 문제를 야기한다. 따라서 모델의 적정성 여부는 계속 검증이 필요하다. 투구할 때의 기온, 심판의 판정 성향, 대기 타석의 타자 수준 등이 정말 조정이 필요한 요인인지, 혹은 이로 인해 오히려 노이즈가 증폭되는 것은 아닌지에 대해서는 지속적인 연구가 필요하다.

더욱이, DRA 결과에 대해 납득이 쉽지 않은 사례가 일부 있다. 대표적인게 가장 낮은 DRA를 기록했던 페드로 마르티네스의 ’00 시즌과, 흔히 그보다 더 뛰어난 시즌이라고도 평가받는 ’99 시즌이다. 두 시즌의 RA9, FIP/0.92, DRA의 값은 각각 다음과 같다.

  • 1999년: 2.36, 1.51, 2.63 (RA9, FIP/0.92, DRA)
  • 2000년: 1.82, 2.36, 1.03 (RA9, FIP/0.92, DRA)

RA9, FIP/0.92 로만 보면 두 시즌의 성적은 1.5~2.4 수준에서 큰 차이를 보이지 않는다. 그러나 DRA로 비교하면 2.63과 1.03이 되어, 무려 그 차이가 두 배를 훌쩍 넘는다. DRA가 좀 더 타당성을 인정받으려면 각 과정에서 얼만큼의 조정이 이루어졌는지, 그리고 그것이 적절한지 확인되어야 하고, 무엇보다 ’99 페드로의 매우 높은(!) DRA를 설명할 수 있어야 한다. 이러한 비판은 여러 세이버메트리션들로부터 제기되었고, DRA 스탯의 고안자인 Jonathan Judge는 이에 대해서 충분한 보완 설명을 제공하겠다고 답했다.

아무튼 DRA는 기존의 ERA, RA9 보다도, 투수의 실점에 대해서 객관적으로 확인 수 있는 매우 유용한 지표이다. 이제 마지막으로 2015년 투수들의 현재까지(~5/22) DRA 상위 25인을 살펴보자.

Rank Player ERA FIP cFIP DRA
1 Dallas Keuchel 1.67 2.79 104 2.99
2 Shelby Miller 1.33 3.30 95 3.06
3 Sonny Gray 1.92 2.63 79 3.10
4 Zack Greinke 1.52 3.23 97 3.23
5 Corey Kluber 3.79 2.24 60 3.23
6 Garrett Richards 2.29 3.03 97 3.24
7 Max Scherzer 1.75 2.06 67 3.25
8 Trevor Bauer 3.31 3.21 92 3.25
9 Aaron Harang 1.82 2.84 93 3.26
10 Johnny Cueto 3.03 3.37 82 3.27
11 Chris Young 0.94 2.81 93 3.30
12 Jesse Chavez 2.89 2.76 86 3.33
13 Michael Wacha 2.13 3.80 109 3.34
14 Dellin Betances 0.00 1.35 62 3.34
15 Jake Odorizzi 2.43 2.53 90 3.35
16 Jake Arrieta 2.77 2.25 78 3.37
17 Chase Anderson 2.54 3.29 102 3.37
18 A.j. Burnett 1.38 3.12 95 3.39
19 Will Harris 0.42 2.16 73 3.39
20 Ubaldo Jimenez 2.43 3.13 90 3.40
21 Chris Archer 2.47 2.52 80 3.41
22 John Lackey 2.96 3.21 102 3.43
23 Jimmy Nelson 3.73 4.26 106 3.45
24 Felix Hernandez 2.30 3.32 84 3.45
25 Lance Lynn 2.96 2.37 76 3.45
  • Share on Tumblr