타구의 포구 확률(catch probability)을 간단히 계산하는 방법

이전에 스탯캐스트의 새로운 스탯, 포구 확률(catch probability)을 소개했다. 타구를 잡기 위해 수비수가 이동해야 하는 거리와 타구의 체공 시간(hang time)을 고려하여, 통계적으로 타구의 포구 확률을 산출한 것이었다. 그러나 이 스탯은 산출 공식이 명확히 알려지지 않아서, 개별 타구에 대한 확률 계산이 어렵다. 그런데 지난 3월 쿠주 키드(The Kudzu Kid)는 팬그래프닷컴에 포구 확률을 간단히 계산하는 수식을 소개했다. 이…

  • Share on Tumblr

투수의 WAR를 계산하는 매우 간단한 방법

이전에 투수의 WAR 계산 방법을 소개한 적이 있다. 그러나 중립적인 상황에서 9이닝당 실점 및 기대승률 계산 과정이 약간 복잡하다. 이번엔 투수의 WAR를 아주 간단히 계산할 수 있는 방법을 소개하고자 한다. 우선 투수의 ERA+ 또는 FIP+ 스탯을 기반으로, 기대승률을 산출한다. 이 스탯들은 이미 리그 평균(100)을 기준으로 조정된 것이므로, 다음과 같이 피타고리안 승률식에 바로 적용 가능하다. W%…

  • Share on Tumblr

마이크 트라웃은 평균 이하의 중견수인가? (2)

최근 ‘포구 확률(catch probability)’이라는 스탯캐스트의 새로운 스탯이 소개됐다. 타구를 잡기 위해 수비수가 이동해야 하는 거리와 타구의 체공 시간(hang time)을 고려하여, 통계적으로 타구의 포구 확률을 산출한 것이다. 수비수와 타구의 거리가 멀수록, 타구의 체공 시간이 짧을수록 포구의 난이도는 높아지며 포구 확률은 감소한다. 상황별 포구 확률은 ‘베이스볼 서번트’에서 확인할 수 있다. 기존의 UZR 스탯은 타구의 위치를 기반을 난이도를 결정하였으나,…

  • Share on Tumblr

퀄리티 타석(Quality At-Bat)의 조건

타자의 퀄리티 타석(Quality At-Bat, QAB)을 정의해볼 수 있다. 실제 출루여부와 관계없이, 비록 아웃을 당했더라도 타석에서 어느정도의 퀄리티를 보인 타석이다. 실제로 그것이 얼만큼의 생산성이 있는지는 논란이 있을 수 있지만, 일반적인 믿음을 바탕으로 hkingsley는 팬그래프에서 퀄리티 타석(QAB)의 조건으로 최소 다음을 조건 중 하나를 만족할 것을 제안했다. 안타 볼넷 몸에 맞는 공 에러로 인한 출루 희생 번트 희생 플라이…

  • Share on Tumblr

투수들이 위협을 느끼는 타자들

이전에 타자의 성적을 예측하는 이상한 방법을 소개했다. 타자의 성적과 관계없이, 상대 투수가 그 타자에게 던진 투구만을 확인하여, 타사의 성적을 예측하는 방법이었다. 타자가 맞이한 패스트볼 비율(FB%), 스트라이크 비율(Zone%), 초구 스트라이크 비율(F-Strike%)과 타자의 wOBA는 평균적으로 다음 관계를 갖는다. (wOBAp는 투수가 던진 투구 패턴만으로 예상할 수 있는 타자의 wOBA를 의미한다.) wOBAp = 0.8 – 0.5 x Zone% – 0.3 x…

  • Share on Tumblr

앞으로 이치로는 얼만큼 더 많이 타석에 들어설수 있을까?

이치로는 메이저리그에서 앞으로 얼만큼 더 많이 타석에 들어설 수 있을까? 워낙 다양한 변수가 있기에, 선수의 타석 수를 예측하는건 어렵다. 그럼에도 불구하고 그동안 메이저리그 선수들의 타석 수 통계를 바탕으로, 커리어 잔여 타석을 어느정도 가늠할 수 있다. Newsense는 지난 2010년 Tom Tango의 블로그에 선수의 나이와 최근 연도 타석 수만을 바탕으로, 앞으로 커리어 타석을 예측하는 회귀식을 소개했다. 수식은…

  • Share on Tumblr

구원 투수 ERA와 승계주자 실점

구원 투수를 평가할 때 평균자책점(ERA)은 그리 좋은 기준이 아니다. ERA가 지닌 여러 단점 외에도, 선발 투수가 남긴 주자가 홈으로 들어왔을 때 구원 투수는 아무런 책임을 지지 않기 때문이다. 그러나 주자를 홈으로 불러들이는 행위는 당연히  구원 투수의 책임이며, 이로 인해 실제 본인 책임에 비해 더 낮은 ERA를 기록하게 된다. 많은 이닝을 던지는 선발 투수는 이러한 운의…

  • Share on Tumblr

마이크 트라웃은 내년 10 WAR를 기록할 수 있을까?

이전에 Tom Tango의 Marcel 예측 시스템을 소개한 적이 있다. 특성 선수의 이전 3년 성적을 가중 평균한 후, 적당히 평균값으로 회귀시켜 현재의 실제 실력을 추정하는 방법이었다. 더욱 나아가, Tom Tango는 얼마 전 선수의 최근 WAR만으로 향후 WAR를 예측할 수 있는 방법(WARcel: WAR Marcel)을 소개하였다. 계산 방법은 다음과 같다. WAR(t+1) = { 0.6 x WAR(t) + 0.3 x…

  • Share on Tumblr

성적으로부터 실력과 운을 구분하기

모든 스탯은 운과 기량이 결합된 결과이다. 이전에 이항 분포(binomial distribution)의 우연 변동(random variation)에 의한 분산 계산을 소개한 적이 있다. 수식은 다음과 같다. luck^2 = p x ( 1 – p ) / n 이를 바탕으로 어떤 성적에 대해 운이 얼마나 비중을 차지하는지 확인해보자. 가장 단순한 예로, 팀의 한 시즌 승률을 다뤄보겠다. 팀은 한 경기에서 이기거나…

  • Share on Tumblr

마이크 트라웃과 데이빗 오티스의 wRC+

마이크 트라웃은 2016년 메이저리그 전체에서 가장 높은 wRC+(171)를 기록했다. wRC+는 타자의 타석당 득점 생산력을 평가하는 지표로, 파크팩터와 리그 수준까지 고려를 하므로 타자의 공격력을 가장 정확히 평가할 수 있는 타자의 대표적인 스탯이다. 그러나 wRC+는 주루 플레이로 인한 기여도(BsR)는 고려하지 않아, 야수의 공격력을 완전히 나타내지는 못한다. 따라서 빌리 해밀턴, 디 고든, 마이크 트라웃 등 빠른 발의 선수들을…

  • Share on Tumblr