마이크 트라웃과 역대 최고의 7년

이전부터 매년 마이크 트라웃과 역대 최고의 n년을 확인하고 있다. 그는 2012년부터 2017년까지 6년동안 53.7 WAR를 기록하였는데, 이는 역대 여섯 번째로 훌륭한 '최고의 6년'이었다. 그렇다면 2018년 성적을 포함한 그의 연속 7년은 어떨까? 그는 2018년에 자신의 커리어 중 가장 뛰어난 타격 성적을 기록했다. 타율, 출루율, 장타율이 각각 .312, .460, .628이었으며, wOBA는 .447, wRC+는 그의 커리어 평균(172)을 훨씬 뛰어넘는 191이었다. ...

베이지안(Bayesian) 추론법을 활용한 마이크 트라웃의 명예의 전당 헌액 가능성은?

선수의 명예의 전당 헌액 가능성을 예측할 수 있을까? 이전에 JAWS, 블랙/그레이 잉크 등 명예의 전당 관련 지표를 소개했다. 이 방법은 명예의 전당 헌액이 적합한지를 말해주나, 헌액 가능성을 알려주지는 않는다. 한편, 얼마 전 라이언 폴락(Ryan Pollack)이 SB네이션에 선수의 명예의 전당 헌액 가능성을 예측하는 방법을 소개했다. 참고하는 정보는 다음과 같다. 나이WAR포지션 선수의 나이와 WAR, 포지션을 고려하여 명예의 전당 헌액 ...

이전 연도 WAR 성적으로 다음 연도 WAR 성적을 예측할 수 있을까?

타자의 이전 연도의 WAR 성적을 기반으로, 다음 연도의 WAR를 예측할 수 있을까? 그렇다면 그 정확성은 얼만큼일까? 현재 플레이어 랭킹을 산출할 때, 이전 연도 WAR에 대해서 최근 순서로 각각 6, 3, 1의 가중치를 부여하여 평균값을 계산했다. 이는 실제 선수의 성적과 가장 근접한, 즉 다음 해의 WAR를 설명하기 가장 적합한 가중치라 하였는데, 정말 그런지 확인해보자.

1920년부터 2018년까지 2~6년 ...

2018년 LA 다저스의 월드시리즈 우승 확률은 얼마나 될까?

LA다저스의 월드시리즈 우승 확률은 어떻게 될까? 보스턴 레드삭스와 LA다저스의 정규시즌 성적을 바탕으로 이를 간단히 예측해보자. 이전에 오즈비(odds ratio)를 통한 포스트시즌 승률 계산법을 소개한 적이 있다. 오즈비는 확률/(1-확률)을 의미하며, 그 방법은 다음과 같다.

A팀 승률의 오즈비를 구한다.
B팀 승률의 오즈비를 구한다.
A팀 오즈비를 B팀 오즈비로 나눈다.
이를 다시 승률로 환산한다. 

두 팀의 승률은 각 정규시즌의 승률로 가정하자. 레드삭스는 108승 ...

타자 오타니와 투수 오타니가 대결하면 누가 이길까?

타자 오타니와 투수 오타니가 대결한다면 누가 이길까? 2018년 5월 26일까지 오타니는 타자로서 .309/.380/.588 타격 슬래시라인을 기록 중이다. 반면 투수 오타니는 3.35 ERA, 3.26 FIP, 3.12 xFIP의 성적을 기록하고 있다. 특히 압도적인 구위를 바탕으로 9이닝당 탈삼진률이 11.6에 달하여, .199라는 매우 낮은 피안타율을 기록하고 있다.

편의상 간단하게 타자 오타니와 투수 오타니의 대결을 다음과 같이 가정해보자. 오타니의 타율과 피안타율을 ...

기대득점(Run expectancy) 기준의 득점권 상황

우리는 '득점권 상황’이란 말을 자주 쓴다. '득점권 상황'이란 주자가 2루 이상에 있어, 타자가 안타를 쳤을 때 바로 득점으로 연결될 수 있는 상황을 의미한다. 그러나 모든 득점권 상황이, 기대득점 또는 득점 가능성이 높지는 않다. 이번엔 이를 고려해서 득점권 상황을 다시 정의해보자.

기대득점(run expectancy)은 해당 상황에서 이닝이 끝날 때까지 기대되는 평균적인 득점을 의미한다. 톰 탱고(Tom Tango)에 의하면 2010-2015년 상황별 ...

오타니에겐 어떤 리그(AL, NL)가 더 유리할까?

2018년 오타니 쇼헤이에 대한 기대가 매우 크다. 특히 투수와 타자를 모두 소화한다는 점에서 매우 흥미롭다. 그의 활약을 승리기여도(WAR)로 평가한다면, 투수로서와 타자로서의 기여도를 모두 합산해야 할 것이다.

그렇다면 아메리칸리그와 내셔널리그 중 그에게 더 유리한 리그는 어디일까? 이와 관련하여, 이전에 이현우 기자가 작성한 글이 있다. 글에서 그는 지명타자 자리가 있는 아메리칸리그가 더 오타니에게 유리하다 하였다. 그렇다면 질문을 조금 ...

피타고리안 승률(pythagorean expectation)은 왜 정확할까?

피타고리안 승률은 빌 제임스(Bill James)에 의해 고안된 지표로, 득점과 실점을 바탕으로 팀의 기대승률을 계산하는 방법이다. 수식의 형태가 피타고라스 공식과 유사하여 피타고리안 승률이라 불린다. 피타고라안 승률 계산법은 다음과 같다.

승률 = 득점^2 / (득점^2+실점^2)

수식의 단순함에도 불구하고 놀라운 정확도를 보인다. 그런데 이 피타고리안 승률법은 도대체 왜 이렇게 잘 들어맞을까?

이와 관련하여 수학자인 스티븐 밀러(Steven J. Miller)가 이전에 수학적 타당성에 ...

MVP를 수상하지 못한 최고의 시즌

애런 저지가 아깝게 2017년 아메리칸리그 MVP 수상에 실패했다. .284의 타율과 무려 52개의 홈런을 기록하며 8.2 WAR의 엄청난 성적을 거뒀다. 아쉬움이 남긴 하지만, 실제 팀 승리기여도 측면에서 알투베가 더욱 뛰어났던 것은 사실이다.

그렇다면 아쉽게 MVP를 수상하지는 못했지만, 위대한 시즌을 보낸 선수는 또 누가 있었을까? 이전에 사이영상을 수상하지 못한 최고의 시즌을 확인한 것처럼, MVP를 수상하지 못한 최고의 시즌을 살펴보자. ...

볼 카운트에 따른 스트라이크 판정의 변화

불행히도, 심판의 스트라이크 존은 유동적이다. 즉, 심판의 성향 또는 상황에 따라 스트라이크 존의 크기는 달라진다. 볼 카운트 상황에 따라서는 어떻게 다를까? 스트라이크 판정에 더 유리하거나 더 불리한 볼 카운트가 따로 있을까? 지난 10월 팬그래프커뮤니티에 볼 카운트에 따른 스트라이크 판정 영향에 대한 글이 소개됐다. 최근 5년 간 스탯캐스트 데이터를 바탕으로 스트라이크 존 경계로 온 공에 대해, ...

2017년 혼란의 사이영 레이스

2017년 사이영 레이스는 혼란의 연속이다.

우선 아메리칸리그는 코리 클루버와 크리스 세일의 경쟁이 치열하다. 클루버는 17승 4패, 2.35 ERA를, 세일은 17승 7패 2.75 ERA의 성적을 기록하고 있다. 사이영상 수상에 가장 중요한 지표인 승률과 평균자책점에서 클루버가 앞서고 있다. 하지만 세일은 벌써 209.1이닝을 소화하며 무려 300개의 탈삼진을 기록했다. FIP도 2.22로 메이저리그 전체에서 가장 좋다. FIP 기반의 WAR로 비교하면 세일이 ...

애런 저지의 후반기 부진과 평균으로의 회귀(regression toward the mean)

애런 저지의 후반기 성적이 저조하다. 그는 전반기에 .329/.448/.691 타격 슬래시라인과 30개의 홈런을 기록했다. 신인왕은 물론 아메리칸리그의 가장 강력한 MVP 후보였다. 그러나 후반기 부진이 계속되며, 8월 16일까지 겨우 .175/.344/.369의 성적을 기록하고 있다. 그가 부진한 이유는 무엇일까? 혹시 평균으로의 회귀(regression toward the mean) 현상으로 설명할 수 있지 않을까?

평균으로의 회귀 현상이란, 첫 번째 관측에서 극단적인 값을 가진 변수가, 다음 ...

현 세계 최고의 투수는? 클레이튼 커쇼? 맥스 슈어저?

 

현 세계 최고의 투수는 누구일까? 클레이튼 커쇼? 맥스 슈어저? 아니면 크리스 세일? 이에 대한 답을 얻기 위한 방법으로 지난 2011년 빌 제임스(Bill James)가 고안한 '세계 최고의 선발투수(The worlds number one starting pitcher)' 지표를 참고해보자. 테니스 또는 골프의 세계 랭킹 순위와 유사하며, 계산 과정은 다음과 같다.

모든 선발 투수의 포인트는 300점부터 시작하며, 이 점수가 최저값이다.
선발투수가 ...

마이크 트라웃은 내년 10 WAR를 기록할 수 있을까?

이전에 Tom Tango의 Marcel 예측 시스템을 소개한 적이 있다. 특성 선수의 이전 3년 성적을 가중 평균한 후, 적당히 평균값으로 회귀시켜 현재의 실제 실력을 추정하는 방법이었다. 더욱 나아가, Tom Tango는 얼마 전 선수의 최근 WAR만으로 향후 WAR를 예측할 수 있는 방법(WARcel: WAR Marcel)을 소개하였다. 계산 방법은 다음과 같다.

WAR(t+1) = { 0.6 x WAR(t) + 0.3 x ...

성적으로부터 실력과 운을 구분하기

모든 스탯은 운과 기량이 결합된 결과이다. 이전에 이항 분포(binomial distribution)의 우연 변동(random variation)에 의한 분산 계산을 소개한 적이 있다. 수식은 다음과 같다.

luck^2 = p x ( 1 – p ) / n

이를 바탕으로 어떤 성적에 대해 운이 얼마나 비중을 차지하는지 확인해보자. 가장 단순한 예로, 팀의 한 시즌 승률을 다뤄보겠다. 팀은 한 경기에서 이기거나 또는 ...