2000년 페드로 마르티네스와 2014년 클레이튼 커쇼의 ERA

2014년 커쇼의 활약이 대단하다. 현재까지 ERA가 1.78인데, 이는 투수 최고의 퍼포먼스를 보인 2000년 페드로 마르티네스의 ERA와 유사하다. ERA 측면에서만 봤을 때, 두 성적이 지닌 가치를 비교하면 어떨까? 2000년은 역대 최고의 타고투저 시즌이었으며, 반면 2014년은 투고타저 현상이 두드러진다. 따라서 둘의 ERA를 리그 평균값과 파크 팩터로 조정해서 살펴보면(ERA-) 차이가 크다. ERA- 스탯 계산은 이전에 설명했으며, 혹시 ERA+가 더 익숙하다면 다음과 같이 ERA-로부터 쉽게 환산 가능하다.

  • ERA+ = ( 100 / ERA- ) x 100

’00 페드로는 35의 ERA-로 1920년 이후 역대 가장 낮다. 이는 리그 평균 ERA의 35% 수준인 것을 의미한다. 반면 ’14 커쇼는 50의 ERA-로, 역시 매우 낮은 수치를 기록 중이지만, 페드로와는 다소 차이를 보인다. 그런데 우리는 이 조정된 방어율로 ERA의 가치를 정확히 파악했다고 할 수 있을까?

ERA-는 서로 다른 시대의 선수를 비교하기에 매우 훌륭한 스탯임에 틀림없지만 완벽하진 않다. 리그 평균값과의 비교만을 수행했을 뿐, 실제의 득점 분포를 고려하지는 않기 때문이다. 예를 들어, 득점 환경이 낮을 때의 50 ERA-와 득점 환경이 높을 때의 50 ERA-의 가치를 비교하면 어떨까? 정확하게 비교하기 위해서는 득점 평균값 뿐 아니라 득점 분포를 고려해야 한다.

경기당 득점 분포(p)는 일반적으로 베이불 분포(Weibull distribution)를 따르며, 이를 통해 매우 정확하게 모델링 가능하다. 수식은 다음과 같다.

  • p(x) = ( c / a ) x { ( x – b ) / a }^( c – 1 ) x exp [ – { ( x – b ) / a }^c ]

c는 분포의 모양을, a는 분포의 스케일을 결정하는 파라미터이다. b는 분포의 중심 위치와 관련이 있다. 평균값 근처를 중심으로 지수적으로 분포가 감소하는 모형이며, 최대값 제한이 없으므로 오른쪽으로 더 긴 모양을 갖는다. 리그의 이 득점 분포를 알면, 투수의 ERA를 통해 승리 확률 계산할 수 있다. 이를 mERA+ 스탯이라고 하며, 더하드볼타임즈에 Sal Baxamusa가 제안했다. 투수가 허용하는 득점 분포에 대해서, 리그의 경기당 득점의 미디안(Median)까지 적분해서 계산하면 된다. 좀 더 간단히 식으로 살펴보면 아래와 같다. (출처: 더하드볼타임즈)

  • image

결국 평균적으로 발생하는 경기당 득점값 대비, 투수가 더 적게 실점을 허용할 확률을 계산하는 것이다. 이 값이 0.7이면 평균적인 상황을 가정했을 때, 이 투수가 던지면 70% 확률로 승리한다는 것을 의미한다. mERA+는 0.5가 평균이며 1이 최대값이다. 값이 높을수록 투수의 승리 확률이 높은 것이므로 더 우수한 것이다. 그럼, 투수들의 mERA+를 계산해보자.

이 스탯을 계산하기 위해서는 적분 및 반복적인 계산(Iterative solving)이 많이 수행되어야 한다. 따라서 여기서는 편의상 Tom Tango의 프로그램을 활용한다. 이 프로그램은 p(x)를 Tango Distribution으로 가정하여 작성되었다. 이 역시 베이불 분포를 기반으로 하고 있으며 큰 차이는 없다. Tango Distribution에는 Control value라는 상수값을 설정해야 하는데, 일반적으로 승리 확률 계산 시에는 .852가 정확하다고 알려져 있다. 이 값으로 세팅하여 시뮬레이션을 돌렸다. 상위 30인의 결과는 다음과 같다.

Rank Year Player ERA ERA- mERA+
1 2000 Pedro Martinez 1.74 35 85.40%
2 1994 Greg Maddux 1.56 37 83.00%
3 1995 Greg Maddux 1.63 39 81.90%
4 1999 Pedro Martinez 2.07 42 81.40%
5 1968 Bob Gibson 1.12 38 79.90%
6 2005 Roger Clemens 1.87 44 79.20%
7 1997 Roger Clemens 2.05 45 79.10%
8 1997 Pedro Martinez 1.9 45 78.60%
9 1931 Lefty Grove 2.06 46 78.50%
10 1996 Kevin Brown 1.89 46 77.80%
11 1985 Dwight Gooden 1.53 44 77.80%
12 2003 Pedro Martinez 2.22 48 77.60%
13 2009 Zack Greinke 2.16 48 77.40%
14 1990 Roger Clemens 1.93 47 77.30%
15 1978 Ron Guidry 1.74 47 76.60%
16 1997 Randy Johnson 2.28 50 76.30%
17 2002 Pedro Martinez 2.26 50 76.30%
18 1937 Monty Stratton 2.4 51 76.00%
19 1964 Dean Chance 1.65 48 75.50%
20 1995 Randy Johnson 2.48 52 75.50%
21 2014 Chris Sale 2.01 50 75.50%
22 1955 Billy Pierce 1.97 50 75.30%
23 1923 Dolf Luque 1.93 50 75.20%
24 1930 Lefty Grove 2.54 53 75.00%
25 1939 Lefty Grove 2.54 53 75.00%
26 1936 Lefty Grove 2.81 54 74.90%
27 1999 Randy Johnson 2.48 53 74.80%
28 2014 Clayton Kershaw 1.78 50 74.60%
29 2014 Felix Hernandez 1.95 51 74.60%
30 1930 Dazzy Vance 2.61 54 74.40%

’00 페드로는 ERA+뿐 아니라 mERA+에서도 역대(1920년 이후) 최고의 수치를 기록했다. ’99 페드로는 ERA-로 보면 ’68 밥 깁슨보다 수치가 나빴지만, mERA+는 오히려 더 높아 역대 4위로 상승했다. 동일하게 우수한 조정 방어율이라면, 득점 환경이 높은 시대에서 승리 확률이 더 높게 나타난다. 즉, 평균 방어율 2.0인 시대에 1.0의 방어율을 기록한 투수보다, 평균 방어율 4.0인 시대에 2.0을 기록한 투수가 더 가치있다는 것이다. mERA+를 이용하면 타고투저 시대에 조정 방어율로 인한 과소평가를 어느정도 극복할 수 있다. 역대 20위 안에 무려 5번이나 랭크된 ’97~’03 페드로는, ERA+/ERA-만으로는 오히려 그 가치를 제대로 평가받지 못한다고 할 수 있겠다.

한편 올 시즌 커쇼는 74.6%의 mERA+로 역대 28위에 랭크되었다. ERA-로 보면 ’99 랜디 존슨보다 좋지만 mERA+로 보면 오히려 더 나쁘다. 또, ’14 커쇼는 ’14 크리스 세일과 조정 방어율이 동등하지만 mERA+에서는 더 나쁜데, 이는 아메리칸 리그가 좀 더 득점 친화적인 환경이기 때문이다. 마지막으로 2014년 투수들의 mERA+ 성적을 살펴보자.

Rank Player ERA ERA- mERA+
1 Chris Sale 2.01 50 75.50%
2 Clayton Kershaw 1.78 50 74.60%
3 Felix Hernandez 1.95 51 74.60%
4 Johnny Cueto 2.05 55 72.20%
5 Masahiro Tanaka 2.51 63 68.30%
6 Jon Lester 2.51 63 68.30%
7 Corey Kluber 2.46 65 67.00%
8 Cole Hamels 2.37 65 66.80%
9 Adam Wainwright 2.34 65 66.70%
10 Henderson Alvarez 2.48 67 65.80%
11 Garrett Richards 2.54 69 64.70%
12 Scott Kazmir 2.73 73 62.80%
13 Yu Darvish 3.06 74 62.60%
14 Hisashi Iwakuma 2.86 75 61.80%
15 Tyson Ross 2.63 75 61.50%
16 Jose Quintana 3.04 76 61.50%
17 Sonny Gray 2.86 76 61.30%
18 Rick Porcello 3.11 78 60.40%
19 Jeff Samardzija 2.91 78 60.20%
20 Tanner Roark 2.86 78 60.20%
  • Share on Tumblr