2014년 커쇼의 활약이 대단하다. 현재까지 ERA가 1.78인데, 이는 투수 최고의 퍼포먼스를 보인 2000년 페드로 마르티네스의 ERA와 유사하다. ERA 측면에서만 봤을 때, 두 성적이 지닌 가치를 비교하면 어떨까? 2000년은 역대 최고의 타고투저 시즌이었으며, 반면 2014년은 투고타저 현상이 두드러진다. 따라서 둘의 ERA를 리그 평균값과 파크 팩터로 조정해서 살펴보면(ERA-) 차이가 크다. ERA- 스탯 계산은 이전에 설명했으며, 혹시 ERA+가 더 익숙하다면 다음과 같이 ERA-로부터 쉽게 환산 가능하다.
- ERA+ = ( 100 / ERA- ) x 100
’00 페드로는 35의 ERA-로 1920년 이후 역대 가장 낮다. 이는 리그 평균 ERA의 35% 수준인 것을 의미한다. 반면 ’14 커쇼는 50의 ERA-로, 역시 매우 낮은 수치를 기록 중이지만, 페드로와는 다소 차이를 보인다. 그런데 우리는 이 조정된 방어율로 ERA의 가치를 정확히 파악했다고 할 수 있을까?
ERA-는 서로 다른 시대의 선수를 비교하기에 매우 훌륭한 스탯임에 틀림없지만 완벽하진 않다. 리그 평균값과의 비교만을 수행했을 뿐, 실제의 득점 분포를 고려하지는 않기 때문이다. 예를 들어, 득점 환경이 낮을 때의 50 ERA-와 득점 환경이 높을 때의 50 ERA-의 가치를 비교하면 어떨까? 정확하게 비교하기 위해서는 득점 평균값 뿐 아니라 득점 분포를 고려해야 한다.
경기당 득점 분포(p)는 일반적으로 베이불 분포(Weibull distribution)를 따르며, 이를 통해 매우 정확하게 모델링 가능하다. 수식은 다음과 같다.
- p(x) = ( c / a ) x { ( x – b ) / a }^( c – 1 ) x exp [ – { ( x – b ) / a }^c ]
c는 분포의 모양을, a는 분포의 스케일을 결정하는 파라미터이다. b는 분포의 중심 위치와 관련이 있다. 평균값 근처를 중심으로 지수적으로 분포가 감소하는 모형이며, 최대값 제한이 없으므로 오른쪽으로 더 긴 모양을 갖는다. 리그의 이 득점 분포를 알면, 투수의 ERA를 통해 승리 확률 계산할 수 있다. 이를 mERA+ 스탯이라고 하며, 더하드볼타임즈에 Sal Baxamusa가 제안했다. 투수가 허용하는 득점 분포에 대해서, 리그의 경기당 득점의 미디안(Median)까지 적분해서 계산하면 된다. 좀 더 간단히 식으로 살펴보면 아래와 같다. (출처: 더하드볼타임즈)
결국 평균적으로 발생하는 경기당 득점값 대비, 투수가 더 적게 실점을 허용할 확률을 계산하는 것이다. 이 값이 0.7이면 평균적인 상황을 가정했을 때, 이 투수가 던지면 70% 확률로 승리한다는 것을 의미한다. mERA+는 0.5가 평균이며 1이 최대값이다. 값이 높을수록 투수의 승리 확률이 높은 것이므로 더 우수한 것이다. 그럼, 투수들의 mERA+를 계산해보자.
이 스탯을 계산하기 위해서는 적분 및 반복적인 계산(Iterative solving)이 많이 수행되어야 한다. 따라서 여기서는 편의상 Tom Tango의 프로그램을 활용한다. 이 프로그램은 p(x)를 Tango Distribution으로 가정하여 작성되었다. 이 역시 베이불 분포를 기반으로 하고 있으며 큰 차이는 없다. Tango Distribution에는 Control value라는 상수값을 설정해야 하는데, 일반적으로 승리 확률 계산 시에는 .852가 정확하다고 알려져 있다. 이 값으로 세팅하여 시뮬레이션을 돌렸다. 상위 30인의 결과는 다음과 같다.
Rank | Year | Player | ERA | ERA- | mERA+ |
1 | 2000 | Pedro Martinez | 1.74 | 35 | 85.40% |
2 | 1994 | Greg Maddux | 1.56 | 37 | 83.00% |
3 | 1995 | Greg Maddux | 1.63 | 39 | 81.90% |
4 | 1999 | Pedro Martinez | 2.07 | 42 | 81.40% |
5 | 1968 | Bob Gibson | 1.12 | 38 | 79.90% |
6 | 2005 | Roger Clemens | 1.87 | 44 | 79.20% |
7 | 1997 | Roger Clemens | 2.05 | 45 | 79.10% |
8 | 1997 | Pedro Martinez | 1.9 | 45 | 78.60% |
9 | 1931 | Lefty Grove | 2.06 | 46 | 78.50% |
10 | 1996 | Kevin Brown | 1.89 | 46 | 77.80% |
11 | 1985 | Dwight Gooden | 1.53 | 44 | 77.80% |
12 | 2003 | Pedro Martinez | 2.22 | 48 | 77.60% |
13 | 2009 | Zack Greinke | 2.16 | 48 | 77.40% |
14 | 1990 | Roger Clemens | 1.93 | 47 | 77.30% |
15 | 1978 | Ron Guidry | 1.74 | 47 | 76.60% |
16 | 1997 | Randy Johnson | 2.28 | 50 | 76.30% |
17 | 2002 | Pedro Martinez | 2.26 | 50 | 76.30% |
18 | 1937 | Monty Stratton | 2.4 | 51 | 76.00% |
19 | 1964 | Dean Chance | 1.65 | 48 | 75.50% |
20 | 1995 | Randy Johnson | 2.48 | 52 | 75.50% |
21 | 2014 | Chris Sale | 2.01 | 50 | 75.50% |
22 | 1955 | Billy Pierce | 1.97 | 50 | 75.30% |
23 | 1923 | Dolf Luque | 1.93 | 50 | 75.20% |
24 | 1930 | Lefty Grove | 2.54 | 53 | 75.00% |
25 | 1939 | Lefty Grove | 2.54 | 53 | 75.00% |
26 | 1936 | Lefty Grove | 2.81 | 54 | 74.90% |
27 | 1999 | Randy Johnson | 2.48 | 53 | 74.80% |
28 | 2014 | Clayton Kershaw | 1.78 | 50 | 74.60% |
29 | 2014 | Felix Hernandez | 1.95 | 51 | 74.60% |
30 | 1930 | Dazzy Vance | 2.61 | 54 | 74.40% |
’00 페드로는 ERA+뿐 아니라 mERA+에서도 역대(1920년 이후) 최고의 수치를 기록했다. ’99 페드로는 ERA-로 보면 ’68 밥 깁슨보다 수치가 나빴지만, mERA+는 오히려 더 높아 역대 4위로 상승했다. 동일하게 우수한 조정 방어율이라면, 득점 환경이 높은 시대에서 승리 확률이 더 높게 나타난다. 즉, 평균 방어율 2.0인 시대에 1.0의 방어율을 기록한 투수보다, 평균 방어율 4.0인 시대에 2.0을 기록한 투수가 더 가치있다는 것이다. mERA+를 이용하면 타고투저 시대에 조정 방어율로 인한 과소평가를 어느정도 극복할 수 있다. 역대 20위 안에 무려 5번이나 랭크된 ’97~’03 페드로는, ERA+/ERA-만으로는 오히려 그 가치를 제대로 평가받지 못한다고 할 수 있겠다.
한편 올 시즌 커쇼는 74.6%의 mERA+로 역대 28위에 랭크되었다. ERA-로 보면 ’99 랜디 존슨보다 좋지만 mERA+로 보면 오히려 더 나쁘다. 또, ’14 커쇼는 ’14 크리스 세일과 조정 방어율이 동등하지만 mERA+에서는 더 나쁜데, 이는 아메리칸 리그가 좀 더 득점 친화적인 환경이기 때문이다. 마지막으로 2014년 투수들의 mERA+ 성적을 살펴보자.
Rank | Player | ERA | ERA- | mERA+ |
1 | Chris Sale | 2.01 | 50 | 75.50% |
2 | Clayton Kershaw | 1.78 | 50 | 74.60% |
3 | Felix Hernandez | 1.95 | 51 | 74.60% |
4 | Johnny Cueto | 2.05 | 55 | 72.20% |
5 | Masahiro Tanaka | 2.51 | 63 | 68.30% |
6 | Jon Lester | 2.51 | 63 | 68.30% |
7 | Corey Kluber | 2.46 | 65 | 67.00% |
8 | Cole Hamels | 2.37 | 65 | 66.80% |
9 | Adam Wainwright | 2.34 | 65 | 66.70% |
10 | Henderson Alvarez | 2.48 | 67 | 65.80% |
11 | Garrett Richards | 2.54 | 69 | 64.70% |
12 | Scott Kazmir | 2.73 | 73 | 62.80% |
13 | Yu Darvish | 3.06 | 74 | 62.60% |
14 | Hisashi Iwakuma | 2.86 | 75 | 61.80% |
15 | Tyson Ross | 2.63 | 75 | 61.50% |
16 | Jose Quintana | 3.04 | 76 | 61.50% |
17 | Sonny Gray | 2.86 | 76 | 61.30% |
18 | Rick Porcello | 3.11 | 78 | 60.40% |
19 | Jeff Samardzija | 2.91 | 78 | 60.20% |
20 | Tanner Roark | 2.86 | 78 | 60.20% |
안녕하세요. 항상 잘 보고 있습니다. 글 초반부에 ERA+ = ( 100 / ERA- ) x 100라는 공식이 있길래 제가 직접해봤습니다. 1999년 마르티네스의 ERA+는 레퍼런스에서 보니 243이고 ERA-는 팬그래프에서 보니 42였습니다. 저 공식을 따라 계산하니 ( 100 / 42 ) x 100= 238.09라는 값이 나왔습니다. 제가 계산을 잘못 한 건가요?
이건, BR와 Fangraphs의 파크팩터 추정치가 다르기 때문인 것 같습니다.