이전에 투수 스탯의 연도별 상관계수를 확인했다. BABIP과 LOB%는 연도별 상관성이 낮고, FIP, K%, BB%는 높았다. 그렇다면 플라이볼 대비 땅볼 비율(GB/FB)이나 플라이볼 대비 홈런 비율(HR/FB) 등, 이런 세부적인 스탯은 어떨까? 타자에 대해서 확인한것처럼 이번에는 투수에 대해서, 타구 유형이나 스트라이크/볼 접근법 등에 대한 상관성을 확인해보자. 이것도 마찬가지로, 연도별 상관성이 높다면 선수 개인의 특성 또는 실력에 의존적인 스탯이다.
2002–2019년 규정이닝을 만족한 투수를 대상으로, 어떤 시즌과 그 다음 시즌 스탯의 상관계수를 확인했다. 그 평균값은 다음과 같다.
Metric | Y2Y Corr. |
ERA | .315 |
FIP | .559 |
ERA – FIP | .109 |
xFIP | .678 |
K% | .761 |
BB% | .676 |
WHIP | .440 |
BABIP | .190 |
LOB% | .163 |
K/BB | .649 |
AVG | .484 |
LD% | .150 |
GB% | .804 |
FB% | .806 |
IFFB% | .354 |
GB/FB | .828 |
HR/FB | .207 |
IFH% | .060 |
BUH% | .135 |
Fastball% | .859 |
Slider% | .840 |
Changeup% | .891 |
Curveball% | .876 |
Z-Swing% | .655 |
O-Swing% | .584 |
Swing% | .741 |
Z-Contact% | .728 |
O-Contact% | .731 |
Contact% | .767 |
Zone% | .648 |
F-Strike% | .618 |
SwStr% | .785 |
Pull% | .561 |
Cent% | .217 |
Oppo% | .564 |
Soft% | .351 |
Med% | .190 |
Hard% | .336 |
위 결과를 간단히 정리하면 다음과 같다.
- xFIP(.678), FIP(.559), ERA(.315) 순으로 연도별 상관성이 높다. ERA와 FIP의 차이는 연도별 상관성이 낮다(.109). 즉, 운이나 다른 요소의 영향이 크다.
- 삼진 비율(.761)과 볼넷 비율(.676)의 연도별 상관성은 높다. 이 둘의 비(K/BB) 역시 마찬가지이다(.649). 반면 BABIP(.190)과 LOB%(.163)는 그렇지 않다.
- 땅볼 비율(.804)과 플라이볼 비율(.806)은 연도별 상관성이 높지만, 라인드라이브 비율(.150)은 상대적으로 낮다. 플라이볼 대비 땅볼 비율(.828)은 타자뿐 아니라 투수의 성향도 잘 나타낸다.
- 투수의 경우, 번트안타 비율(.135)이나 플라이볼 대비 홈런 비율(.207)의 연도별 상관성이 낮다. 즉, 투수보다는 외부 요인이나 운의 영향이 큰 지표이다.
- 패스트볼, 슬라이더, 체인지업 등 투수가 던지는 구종 비율은 당연히 연도별 상관성이 높다.
- 타자의 스윙 비율(.741)이나 컨택 비율(.767)도 의외로 연도별 상관성이 높다. 즉, 타자의 스윙을 많이 유도하거나 많은 컨택을 허용하는 투수가 있다는 것이다.
- 타구의 강도는 연도별 상관성이 낮다.
결국, 투수는 타자와 달리 연도별 상관성이 높은 스탯과 낮은 스탯이 있다. 투수를 평가할때, 특히 적은 샘플에서는, 이 둘을 어느정도 구분해서 봐야겠다.
안녕하세요. 좋은 글 잘 읽고 있습니다. 혹시 상관관계를 구하는 공식이 어떻게 되나요? 그리고 연도별 상관계수를 구한다고 하셨는데, 정확하게 해당 년도의 어떤 수치와의 상관관계를 구하신 건지가 궁금합니다.
안녕하세요.
1. 상관계수 공식은 위키 페이지를 참고하시면 좋습니다. https://en.wikipedia.org/wiki/Correlation
2. ERA의 경우, 해당 연도 선수들의 ERA와 다음 연도 선수들의 ERA를 비교한 것입니다.
친절한 답변 감사드립니다 글 보면서 많이 배우고 있습니다 ^_^