류현진의 구종은 얼마나 예측이 어려울까?

이전에 류현진의 커맨드가 얼마나 뛰어난지 CSAA 스탯을 살펴봤다. 그렇다면 이번엔 류현진의 구종 예측이 얼마나 어려운지 확인해보자. 이는 이전에 설명한 것처럼, 구종 엔트로피 스탯으로 확인할수 있다. 엔트로피(Entropie)는 통계역학에서 확률변수의 불확실성을 나타내기 위한 로그 함수이다. 투수가 던진 각 구종의 비율을 엔트로피 함수에 적용하여, 구종 예측이 얼마나 불확실한지 정량적으로 평가한다. 엔트로피 계산은 다음과 같이 한다. Entropie = – p1 x ...

구종 예측이 어려운 투수 확인하는 방법, 엔트로피

이전에 투수의 볼배합 능력을 측정하려는 시도를 소개한 적이 있다. 누적합계검사(Cumulative Sum Test, CSUM) 방법을 통해, 투수가 직구를 얼마나 랜덤하게 던지느냐를 측정한 것이었다.

이번엔 투수의 볼배합 능력을 평가하는 또 다른 방법을 소개하고자 한다. 베이스볼위드알(Baseballwithr.wordpress.com)에 짐 알버트(Jim Albert)가 소개한 엔트로피 계산법이다. 엔트로피(Entropie)는 통계역학에서 확률변수의 불확실성을 나타내기 위한 로그 함수이다. 투수가 던진 각 구종의 비율을 엔트로피 함수에 적용하여, 구종 예측이 ...

커쇼가 수비수 없이 혼자서 던진다면?

커쇼가 수비수 없이 혼자서 공을 던진다면 어떨까? 아무리 커쇼라도 수많은 실점을 허용할 것이고, 평균자책점(ERA)은 급상승하게 될 것이다. 좀 더 구체적으로 정말 얼만큼의 성적을 기록하게 될까? 재미삼아 그의 성적을 예상해보자. (수비수는 없지만 공을 잡아주는 사람은 있다고 가정하자.)

일단 투수가 타자를 상대하면, 삼진 아웃(K)과 볼넷(BB)이 아닌 모든 이벤트는 '거의' 득점으로 연결될 것이다. 평범한 내야 땅볼(GB)이라도 투수가 잡기 어려울 ...

2014년 각종 투구지표 상위 랭커

1. Strike ratio

스트라이크의 비율이다. 거의 모든 메이저리그 투수는 40~50%의 비율로 스트라이크를 던진다. 48% 이상이면 굉장히 공격적인 피칭이라고 볼 수 있는데, 올 시즌 필 휴즈의 56.4%는 상당히 놀랍다. Zone%이 높은 투수가 꼭 우수한 것은 아니지만, 적어도 제구력이 뛰어나다고 할 수는 있겠다.

Rank
Player
Zone%

1
Phil Hughes
56.4%

2
Nathan Eovaldi
51.1%

3
Wei-Yin Chen
50.4%

4
Clayton Kershaw
50.0%

5
Brett Oberholtzer
49.9%

2. Contact ratio

해당 투수가 던진 공에 대한 타자들의 컨택 성공률이다. 컨택의 ...

2000년 페드로 마르티네스와 2014년 클레이튼 커쇼의 ERA

image

2014년 커쇼의 활약이 대단하다. 현재까지 ERA가 1.78인데, 이는 투수 최고의 퍼포먼스를 보인 2000년 페드로 마르티네스의 ERA와 유사하다. ERA 측면에서만 봤을 때, 두 성적이 지닌 가치를 비교하면 어떨까? 2000년은 역대 최고의 타고투저 시즌이었으며, 반면 2014년은 투고타저 현상이 두드러진다. 따라서 둘의 ERA를 리그 평균값과 파크 팩터로 조정해서 살펴보면(ERA-) 차이가 크다. ERA- 스탯 계산은 이전에 설명했으며, 혹시 ERA+가 더 ...

클레이튼 커쇼와 사이영 포인트 (2)

지난번에 Tom Tango 버전의 사이영 포인트(CYP)를 소개했다. 최근의 사이영상 투표 결과 트렌드를 많이 반영한 것이며, 수상자를 예측하기에 유용하다고 언급했다. 수식은 CYP = ( IP/2 – ER ) + SO/10 + W 인데, 이닝/자책점, 삼진, 승리 이렇게 사이영상 투표에 크게 영향을 미치는 요소들을 모두 독립적으로 것으로 간주하여, 스코어로 환산한 것이다. 1) ( IP/2 - ER ) 는 ...

클레이튼 커쇼와 사이영 포인트

노히터 - 클레이튼 커쇼가 부상으로 인한 시즌 초반 공백기에도 불구하고, 내셔널리그 사이영상(CYA) 후보로 부상하고 있다. 현재까지 커쇼의 CYA 가능성이 어느정도 되는지 사이영 포인트(CYP)를 통해 대략적으로 살펴보자. CYP(Cy Young Point)는 다음과 같이 계산한다.

CYP = ( IP/2 - ER ) + SO/10 + W

Tom Tango가 2013년 고안한 버전이며, 기존의 Bill James 버전에 비해 굉장히 단순하다. 완봉, 패배, ...

랜디 존슨과 페드로 마르티네스의 탈삼진 능력

랜디 존슨과 페드로 마르티네스는 역대 가장 많은 홈런과 득점이 발생했던 시기인 1990년대 후반과 2000년대 초반에, 무려 300개가 넘는 탈삼진을 잡으며 리그를 지배했다. 오늘날과 같이 탈삼진 200개가 대단한 이 시점에서 보면 이해하기가 어려울 지경이다. 하지만 얼핏 생각하면, 경기 당 득점이 많이 발생한다는 것은 그만큼 투수가 타자를 많이 상대한다는 것이고, 따라서 탈삼진의 개수도 그에 따라 증가할 수 있을 것 ...