투수 스탯의 연도별 상관계수(year-to-year correlation) (2)

이전에 투수 스탯의 연도별 상관계수를 확인했다. BABIP과 LOB%는 연도별 상관성이 낮고, FIP, K%, BB%는 높았다. 그렇다면 플라이볼 대비 땅볼 비율(GB/FB)이나 플라이볼 대비 홈런 비율(HR/FB) 등, 이런 세부적인 스탯은 어떨까? 타자에 대해서 확인한것처럼 이번에는 투수에 대해서, 타구 유형이나 스트라이크/볼 접근법 등에 대한 상관성을 확인해보자. 이것도 마찬가지로, 연도별 상관성이 높다면 선수 개인의 특성 또는 실력에 의존적인 스탯이다. 

2002–2019년 규정이닝을 만족한 투수를 대상으로, 어떤 시즌과 그 다음 시즌 스탯의 상관계수를 확인했다. 그 평균값은 다음과 같다.

MetricY2Y Corr.
ERA.315
FIP.559
ERA – FIP.109
xFIP.678
K%.761
BB%.676
WHIP.440
BABIP.190
LOB%.163
K/BB.649
AVG.484
LD%.150
GB%.804
FB%.806
IFFB%.354
GB/FB.828
HR/FB.207
IFH%.060
BUH%.135
Fastball%.859
Slider%.840
Changeup%.891
Curveball%.876
Z-Swing%.655
O-Swing%.584
Swing%.741
Z-Contact%.728
O-Contact%.731
Contact%.767
Zone%.648
F-Strike%.618
SwStr%.785
Pull%.561
Cent%.217
Oppo%.564
Soft%.351
Med%.190
Hard%.336

위 결과를 간단히 정리하면 다음과 같다.

  • xFIP(.678), FIP(.559), ERA(.315) 순으로 연도별 상관성이 높다. ERA와 FIP의 차이는 연도별 상관성이 낮다(.109). 즉, 운이나 다른 요소의 영향이 크다.
  • 삼진 비율(.761)과 볼넷 비율(.676)의 연도별 상관성은 높다. 이 둘의 비(K/BB) 역시 마찬가지이다(.649). 반면 BABIP(.190)과 LOB%(.163)는 그렇지 않다.
  • 땅볼 비율(.804)과 플라이볼 비율(.806)은 연도별 상관성이 높지만, 라인드라이브 비율(.150)은 상대적으로 낮다. 플라이볼 대비 땅볼 비율(.828)은 타자뿐 아니라 투수의 성향도 잘 나타낸다.
  • 투수의 경우, 번트안타 비율(.135)이나 플라이볼 대비 홈런 비율(.207)의 연도별 상관성이 낮다. 즉, 투수보다는 외부 요인이나 운의 영향이 큰 지표이다.
  • 패스트볼, 슬라이더, 체인지업 등 투수가 던지는 구종 비율은 당연히 연도별 상관성이 높다.
  • 타자의 스윙 비율(.741)이나 컨택 비율(.767)도 의외로 연도별 상관성이 높다. 즉, 타자의 스윙을 많이 유도하거나 많은 컨택을 허용하는 투수가 있다는 것이다.
  • 타구의 강도는 연도별 상관성이 낮다.

결국, 투수는 타자와 달리 연도별 상관성이 높은 스탯과 낮은 스탯이 있다. 투수를 평가할때, 특히 적은 샘플에서는, 이 둘을 어느정도 구분해서 봐야겠다.

3 thoughts on “투수 스탯의 연도별 상관계수(year-to-year correlation) (2)

  1. 안녕하세요. 좋은 글 잘 읽고 있습니다. 혹시 상관관계를 구하는 공식이 어떻게 되나요? 그리고 연도별 상관계수를 구한다고 하셨는데, 정확하게 해당 년도의 어떤 수치와의 상관관계를 구하신 건지가 궁금합니다.

Leave a Reply

Your email address will not be published. Required fields are marked *