류현진의 구종은 얼마나 예측이 어려울까?

이전에 류현진의 커맨드가 얼마나 뛰어난지 CSAA 스탯을 살펴봤다. 그렇다면 이번엔 류현진의 구종 예측이 얼마나 어려운지 확인해보자. 이는 이전에 설명한 것처럼, 구종 엔트로피 스탯으로 확인할수 있다.

엔트로피(Entropie)는 통계역학에서 확률변수의 불확실성을 나타내기 위한 로그 함수이다. 투수가 던진 각 구종의 비율을 엔트로피 함수에 적용하여, 구종 예측이 얼마나 불확실한지 정량적으로 평가한다. 엔트로피 계산은 다음과 같이 한다.

  • Entropie = – p1 x log(p1) – p2 x log(p2) – p3 x log(p3) – …

p1, p2, p3 등은 각 구종의 발생 비율을 의미한다. 구종별 비율에 대해 로그를 적용하고, 다시 비율로 가중치를 곱하여 모두 더한다. 각 확률값은 1보다 작으므로 로그값을 양수로 만들기 위해 앞에 마이너스를 붙인다. 각 구종의 발생 비율이 비슷할수록 예측이 어려우므로, 엔트로피 값은 증가한다. 반대로 비율 차이가 클수록, 예측은 쉽고 엔트로피는 낮다.

이제 류현진의 2019년 구종 엔트로피 값을 계산해보자. 팬그래프에 의하면 류현진은 2019년 5월 25일까지 패스트볼, 커터, 커브, 체인지업에 대해 각각 44.8%, 21.9%, 10.2%, 23.1%의 비율로 던졌다. 엔트로피는 1.264로 계산된다. 반면 맥스 슈어저는 패스트볼, 슬라이더, 커터, 커브, 체인지업에 대해 각각 48.6%, 21.5%, 7.8%, 7.3%, 14.8%의 비율로 던졌다. 엔트로피는 1.354로 계산된다. 슈어저의 구종이 류현진보다 예측하기 더 어렵다는 뜻이다. 보통 투수들의 엔트로피는 1 근처에 분포하며, 1.1보다 크면 구종 예측이 어려운 투수, 0.9보다 낮으면 예측이 쉬운 투수로 간주할 수 있다. 슈어저보다 낮긴 하지만 류현진의 구종 엔트로피도 매우 높은 수치인 것이다.

그럼 리그 전체에서 구종 불확실성이 가장 큰 투수들은 누구일까? 2019년 규정이닝 투수를 대상으로, 구종 엔트로피 수치가 높은 투수들은 다음과 같다.

RankNameEntropieFB%
1Mike Leake1.490 35.30%
2Trent Thornton1.448 45.00%
3Jeff Samardzija1.433 43.10%
4Trevor Bauer1.409 47.30%
5Max Scherzer1.371 48.60%
6Masahiro Tanaka1.367 29.40%
7Marco Gonzales1.364 33.50%
8Brett Anderson1.361 49.80%
9Kenta Maeda1.340 39.80%
10Marcus Stroman1.328 39.60%
11Mike Minor1.308 42.10%
12Joe Musgrove1.305 49.90%
13Eric Lauer1.294 52.40%
14Trevor Richards1.288 40.00%
15Hyun-Jin Ryu1.264 44.80%
16Mike Fiers1.262 50.90%
17Zack Wheeler1.261 56.70%
18Wade Miley1.253 19.70%
19Jake Odorizzi1.250 55.50%
20Cole Hamels1.245 49.50%

Leave a Reply

Your email address will not be published. Required fields are marked *