투수의 FIP 스탯과 BABIP

평균자책점(ERA)은 투수의 실력을 평가하는 잣대로써 가장 널리 쓰이는 스탯 중 하나이다. ERA는 투수의 9이닝당 평균 자책점을 의미하며, 여기엔 기록자의 주관이 약간 개입된다. 게다가, 이 스탯은 투수 능력 이외의 요소 – 팀의 수비, 운 – 가 많이 포함되어 있다. 이에 반하여 거의 100% 투수의 책임이라 볼 수 있는 요소 – 삼진, 볼넷, 홈런 – 만을 대상으로 ERA와 유사한 스케일로 조정하여 만든 스탯이 (흔히 수비 무관 평균자책점이라고 불리우는) 투수의 FIP(Fielding Independent Pitching)이다. 계산 방법은 다음과 같다.

  • FIP = { ( 13 x HR ) + ( 3 x BB ) – ( 2 x K ) } / 이닝 + cFIP

홈런 및 볼넷이 증가할 수록 FIP가 상승하고, 삼진이 많을수록 감소하게 되는 단순한 원리이다. (위 식에서 BB는 정확하게, BB+HBP-IBB를 의미한다.) cFIP는 FIP 값이 ERA와 유사한 범위를 같도록 고안된 상수값이다. 대략 3.2로 계산하면 큰 무리가 없으며, 연도별 정확한 값은 팬그래프닷컴에서 확인할 수 있다. Tom Tango에 의하면, 홈런은 평균적으로 중립적인 상황에서 1.409점의 득점 가치를 갖는데, 따라서 인플레이 상황(-0.04) 대비 홈런을 맞는 것은 1.409-(-0.04) 점을 허용하는 것과 같다. 단위를 9이닝으로 환산하기 위해 여기에 9를 곱하면, (1.409-(-0.04))*9=12.96의 값을 얻게 된다. 이와 같은 방법으로 볼넷/삼진에 대해서도 얻어내 정수로 단순화한 값이 13, 3, -2 이다. (참고로 위 값은 99-02년 데이터 기준으로 했다.)

FIP 스탯은 수식의 단순함에 비해 유용성이 ‘매우’ 크다. 투수가 전적으로 책임지는 지표만을 대상으로 고안한 스탯이므로, ERA보다 연도별 변동성도 적고 따라서 예측력도 높은 편이다. 하지만 FIP가 곧 투수의 진짜 실력이다라고 보기엔 무리가 있다. 그 이유는 다음과 같다.

  • 투수의 책임이 큰 요소 – 삼진, 볼넷, 홈런 – 만을 다루는 것에서 비롯되는 한계.
  • FIP 계수의 부정확성.
  • 피홈런에 대한 운.
  • 투수의 BABIP은 통제 불가하다고 가정했으나, 수식에 BABIP 요소(이닝)가 포함된 점.

첫째, 투수의 책임이 큰 요소만을 사용함으로써 발생하는 부정확성. 이게 크다면 차라리 ERA 스탯을 활용하면 된다. ERA는 투수뿐 아니라 수비의 책임 및 구장 효과 등이 함께 고려되어야 하는 요소들 – 안타, 땅볼, 뜬공, 도루 등 – 을 모두 다룬다. 하지만 이로 인해 투수 능력 외 외부 노이즈가 많이 포함된다. 이것이 모두 중립화되고 투수 실력만이 반영되기까지는 많은 시간이 필요할 것이다. 일반적으로 약 6~8년의 시간이 필요하다고 알려져 있으며, 따라서 투수의 전체 커리어를 평가할 때는 FIP보다 오히려 ERA 스탯이 더 유용할 수 있다.

둘째, FIP 계수의 부정확성 문제. FIP 계수들은 통계를 기반으로 대략적으로 산출된 값이다. 그러나 이 역시 샘플 데이터 선정에 따라 변화 가능하다. 실제 득점 환경과 현재 FIP 계수값 사이의 차이가 너무 커지면 FIP 유용성은 떨어질 것이다. 참고로 베이스볼 프로스펙터스의 SIERA 스탯은 좀 더 정교한 계수를 사용하고 있으므로 오차를 줄일 수 있다. (게다가 SIERA는 투수의 그라운드볼 성향까지 고려한다.)

셋째, 피홈런에 대한 운. FIP는 피홈런, 삼진, 볼넷 만을 대상으로 하므로, 적은 경기에 대해서는 스몰 샘플 사이즈 문제로 유용성이 떨어진다. 특히 가중치가 큰 홈런의 경우에는 영향이 더 크다. 더욱이, 홈런은 상대 타자나 구장 효과에 의해 큰 영향을 받는 요인이다. 따라서 한 시즌과 같이 단기간에 대해서 투수의 실력을 평가하고자 할 경우, 리그 평균적인 (플라이볼 대비) 홈런 비율을 적용하여 FIP 스탯을 조정하는 것도 좋은 방법이다. 이 스탯이 xFIP 이며, 이를 통해 우리는 피홈런에 의한 운 요소를 어느정도 제거할 수 있다.

또한, FIP는 기본적으로 투수가 BABIP을 통제할 수 없다고 가정한다. 그러나 FIP의 분모가 이닝이며, 이것은 BABIP에 영향을 받는다. BABIP이 높은 투수는 상대적으로 적은 이닝을 소화하게 되고, 낮은 투수는 많은 이닝을 소화하게 된다. 따라서 동일한 피홈런, 볼넷, 삼진을 기록한 투수라고 하더라도 BABIP이 낮은 투수의 FIP값이 더 낮게 산출된다. 이는 기본적으로 FIP 컨셉과 맞지 않는 것이며, Tom Tango 본인도 후회하는 부분이라고 언급한 적이 있다. 그렇다면 이 영향은 심각한 수준일까? 만약 투수의 BABIP이 한 시즌 수준에서 완전히 운이라고 생각한다면, BABIP을 아예 배제하는 것도 좋은 방법이다. 이것은, FIP의 분모를 이닝이 아닌 타석수로 대체함으로써 가능하다. 이 스탯을 편의상 FIP/PA 라고 하고, 이전의 FIP를 FIP/IP 라고 하자. 수식은 다음과 같다. (Tango의 제안값 PA/4를 활용했다.)

  • FIP/PA = { ( 13 x HR ) + ( 3 x BB ) – ( 2 x K ) } / ( PA / 4 ) + cFIP*

cFIP*는 FIP/PA가 ERA와 유사한 스케일을 갖도록 고안된 상수값이며, 2013년 기준으로 정확히 3.16이다. 그렇다면 2013년 주요 선수들의 FIP/PA 스탯을 살펴보자.

Player ERA FIP/IP FIP/PA
Matt Harvey 2.27 2.00 2.07
Clayton Kershaw 1.83 2.39 2.45
Adam Wainwright 2.94 2.55 2.64
Felix Hernandez 3.04 2.61 2.71
Jose Fernandez 2.19 2.73 2.75
Max Scherzer 2.90 2.74 2.85
A.J. Burnett 3.30 2.80 2.88
Cliff Lee 2.87 2.82 2.93
Madison Bumgarner 2.77 3.05 3.08
David Price 3.33 3.03 3.14
Mat Latos 3.16 3.10 3.15
Chris Sale 3.07 3.17 3.26
Hyun-Jin Ryu 3.00 3.24 3.29
Cole Hamels 3.60 3.26 3.30
Stephen Strasburg 3.00 3.21 3.31
Zack Greinke 2.63 3.23 3.32
Bartolo Colon 2.65 3.23 3.34
Justin Verlander 3.46 3.28 3.37
Yu Darvish 2.83 3.28 3.38
Ricky Nolasco 3.70 3.34 3.43
Hisashi Iwakuma 2.66 3.44 3.51
Hiroki Kuroda 3.31 3.56 3.64
Tim Lincecum 4.37 3.74 3.70
Shelby Miller 3.06 3.67 3.76
Andy Pettitte 3.74 3.70 3.76
Matt Cain 4.00 3.93 3.97
Ervin Santana 3.24 3.93 3.99
CC Sabathia 4.78 4.10 4.07
Bronson Arroyo 3.79 4.49 4.55
R.A. Dickey 4.21 4.58 4.62

맷 하비와 커쇼는 FIP/IP뿐 아니라 FIP/PA에서도 나란히 전체 1위, 2위의 성적을 유지했다. 대부분 FIP가 낮은 투수들은 FIP/PA에서 값이 상승한다. 위 투수들 중 린스컴과 사바시아만이 FIP보다 FIP/PA에서 값이 감소했다. 그들은 ERA가 매우 높았으며, 한편 BABIP도 .300 이상으로 높은 편이었다. BABIP을 전혀 투수의 책임으로 보지 않는다고 하면, FIP/PA로 환산할 때 이점이 크게 작용하는 선수들이다. 한편, 클리프 리는 ERA가 2.87이고 FIP가 2.82였는데, FIP/PA로 보면 다시 2.93으로 증가한다. FIP로 보면 마치 BABIP이 높아서 FIP에서 이점을 본 것 같지만, 사실 그의 BABIP은 .287로 리그 평균값(.294)보다 낮은 수준이었다.

전체적으로 보면 투수들의 FIP/IP와 FIP/PA 값 차이가 크지 않다. 둘 간의 상관계수를 살펴보면 무려 .998로 나타난다. 이것은 애초에 FIP/IP와 BABIP 간 상관계수가 .048에 불과하기 때문이다. 즉, 현재의 FIP 스탯은 이미 충분히 BABIP과 무관하다고 볼 수 있으며, 따라서 현재의 수식으로도 (BABIP 관점에서는) 의도하는 결과를 얻을 수 있다고 봐야겠다.

  • Share on Tumblr