투수 스탯의 연도별 상관계수(year-to-year correlation)

이전에 타자 스탯 연도별 상관계수를 확인했다. 투수 스탯은 어떨까? 즉, 한 시즌에 낮은 ERA를 기록한 투수는 다음 시즌에도 낮은 ERA를 기록할수 있을까? 또는, 한 시즌에 낮은 FIP를 기록한 투수는 다음 시즌에도 낮은 FIP를 기록할수 있을까? 그 상관성은 어느정도일까?

투수 스탯의 연도별 상관계수 역시 신뢰도와 관련이 높다. 어떤 스탯의 연도별 상관성이 낮다는 것은, 그것은 선수의 실력보다는 운이나 다른 외부 요인에 의한 영향을 더 많이 받는다는 것이기 때문이다. 반대로, 스탯의 연도별 상관성이 높다면, 그것은 선수 개인의 특성 또는 실력에 의존적인 스탯이다. 

1920–2019년 규정이닝을 만족한 투수를 대상으로, 어떤 해와 그 다음 해 스탯의 상관계수를 확인했다. 그 평균값은 다음과 같다.

MetricY2Y Corr.
ERA.302
FIP.528
K%.768
BB%.705
WHIP.400
BABIP.205
LOB%.205

ERA(.302)는 FIP(.528)에 비해 상대적으로 연도별 상관성이 낮다. 즉, ERA보다는 FIP가 실제 투수의 실력을 더 잘 설명한다. FIP는 투수의 책임이 큰 요소 – 삼진, 볼넷, 홈런 – 만을 포함한 스탯이므로, 이는 당연하다. K%(.768)와 BB%(.705)는 상관성이 매우 높다. 그만큼 변동성이 적기 때문에, 단기간에서 더 의미있는 스탯이다.

반면 BABIP(.205)와 LOB%(.205)는 연도별 상관성이 낮다. 하지만 아주 낮지는 않다. 이전엔 투수의 BABIP이 순전히 운의 영역이고 실력과 상관없다고 알려졌지만, 이는 특정 투수의 특정 기간 데이터만을 대상으로 한 결과이다. 또, LOB% 역시 마찬가지로 투수의 실력과 별 상관없다고 알려져 있지만, 주자를 득점시키지 않는 것은 투수의 능력과 상관성이 있다. LOB%가 투수의 BABIP 수준으로 연도별 상관성이 높다는 점은 인상적이다. 

한편 이 연도별 상관성은 시대에 따라서 변하고 있을까? 10년 평균 연도별 상관계수의 변화는 다음과 같다.

시대에 따른 큰 차이가 없다. K%, BB%는 항상 상관성이 높고, BABIP와 LOB% 상관성이 낮다.

Leave a Reply

Your email address will not be published. Required fields are marked *