톰 탱고(Tom Tango)의 사이영 포인트는 왜 예측력이 뛰어날까?

톰 탱고(Tom Tango)의 사이영 포인트(CYP)에 대해 이전에 여러차례 언급했다. 사이영상 투표에 가장 중요한 지표 - 이닝, 자책점, 삼진, 승리 - 만을 대상으로 하여, 간단히 하나의 포인트로 나타낸 것이다. CYP = ( IP/2 – ER ) + SO/10 + W 톰 탱고가 2013년 고안한 것인데, 2006년 이후 빌 제임스의 사이영 포인트보다 예측 능력이 더 좋다. 2013년부터 2018년까지 사이영 ...

류현진의 승리 기여도(fWAR)는 왜 낮을까?

류현진의 2019년은 실점 억제 측면에서 역사적인 시즌이다. 9이닝당 실점이 1.83점에 불과하고, ERA는 무려 1.45이다. ERA는 1920년 이후 1968년 밥 깁슨(1.23)에 이은 역대 2위에 해당하는 매우 좋은 성적이다. 그럼에도 불과하고 류현진의 승리 기여도(fWAR)는 4.7에 불과하다. 이는 맥스 슈어저, 제이콥 디그롬, 게릿 콜보다 낮으며, 전체 7위에 해당한다. 그의 fWAR가 생각보다 낮은 이유는 무엇일까? fWAR는 간단히 말하면 FIP가 낮을수록, 그리고 ...

2019년 전반기에 류현진과 맥스 슈어저가 대결했다면 누가 이겼을까?

2019년 류현진과 맥스 슈어저의 활약은 눈부셨다. 류현진은 10승 2패 1.73 ERA를, 슈어저는 9승 5패 2.30 ERA의 성적을 기록했다. 특히 슈어저는 가장 많은 129.1이닝을 던지며 전반기에만 181개의 삼진을 잡았다. 류현진과 슈어저의 FIP는 각각 2.88과 2.01이다. 만약 2019년 전반기에 두 선수가 대결했다면 누가 이겼을까? 전반기 등판 성적을 기반으로, 대결 결과를 시뮬레이션 해보자. 두 선수가 전반기에 등판한 경기 중에서 ...

투수의 주요 스탯과 2019년 6월 7일까지의 순위

RA9는 투수가 마운드에 있을때 허용한 9이닝당 실점을 의미한다. 결과적으로 누가 가장 적게 실점했는지 나타낸다. RankNameRA91Hyun-Jin Ryu1.35 2Jake Odorizzi2.10 3Justin Verlander2.40 4Luis Castillo2.50 5Charlie Morton2.54 ERA는 투수가 마운드에 있을때 허용한 9이닝당 평균자책점을 의미한다. 그러나 여전히 수비수의 영향이 크고, 주자를 남기고 교체됐을때는 구원투수의 영향을 받는다. RankNameERA1Hyun-Jin Ryu1.35 2Jake Odorizzi1.96 3Zach Davies2.20 4Charlie Morton2.30 5Luis Castillo2.38 FIP는 수비수의 영향이 거의없는 ...

류현진의 구종은 얼마나 예측이 어려울까?

이전에 류현진의 커맨드가 얼마나 뛰어난지 CSAA 스탯을 살펴봤다. 그렇다면 이번엔 류현진의 구종 예측이 얼마나 어려운지 확인해보자. 이는 이전에 설명한 것처럼, 구종 엔트로피 스탯으로 확인할수 있다. 엔트로피(Entropie)는 통계역학에서 확률변수의 불확실성을 나타내기 위한 로그 함수이다. 투수가 던진 각 구종의 비율을 엔트로피 함수에 적용하여, 구종 예측이 얼마나 불확실한지 정량적으로 평가한다. 엔트로피 계산은 다음과 같이 한다. Entropie = – p1 x ...

류현진의 제구력은 얼마나 뛰어날까?

2019년 류현진의 활약이 놀랍다. 5월 19일 현재까지 5승 1패 1.72 ERA의 성적을 기록 중이다. 특히 삼진(54)과 볼넷(3) 비율이 가장 인상적이다. 그가 얼마나 뛰어난 제구력을 지녔는지 알수 있다. 그런데 투수의 제구력을 평가할수 있는 스탯이 있을까? 일반적으로 제구력은 컨트롤(control)과 커맨드(command)로 구분할수 있다. 컨트롤은 스트라이크 존 안으로 공을 던질수 있는 능력을 의미하며, 커맨드는 스트라이크 존 안 또는 경계에 자신이 ...

아메리칸리그 사이영상은 누가 받아야 할까? 저스틴 벌랜더? 블레이크 스넬?

아메리칸리그 사이영상은 누가 탈까? 저스틴 벌랜더와 블레이크 스넬이 강력한 후보로 꼽힌다. 벌랜더는 16승 9패 2.67 ERA의 성적을, 스넬은 20승 5패 1.97 ERA의 성적을 기록 중이다. 다승과 평균자책점만을 봤을 때 스넬이 훨씬 인상적이다. 하지만 벌랜더는 벌써 202이닝을 소화했으나, 스넬은 겨우 169이닝만을 소화했다. 소화한 이닝이 32이닝이나 차이가 나는 셈이다. 결국 낮은 자책점과 많은 이닝에 대해서 각각 얼만큼의 ...

애런 놀라와 투수 bWAR 평가방식의 문제점

베이스볼 레퍼런스 기준, 2018년 현재까지 투수 WAR 1위는 애런 놀라이다. 그의 WAR는 벌써 8.9이며, 맥스 슈어저(8.0)나 제이콥 디그롬(7.4)보다도 더 높다. 반면, 팬그래프 기준으로, 애런 놀라의 WAR는 5.4에 불과하며, 맥스 슈어저(6.0)와 디그롬(6.9)보다 낮다. 애런 놀라의 bWAR가 다른 투수보다 유독 더 높게 나타나는 이유는 무엇일까? 우리는 이를 신뢰해도 될까?

애런 놀라의 RA9는 2.13이다. 즉, 그는 9이닝당 2.13점을 실점했다. ...

2017년 혼란의 사이영 레이스

2017년 사이영 레이스는 혼란의 연속이다.

우선 아메리칸리그는 코리 클루버와 크리스 세일의 경쟁이 치열하다. 클루버는 17승 4패, 2.35 ERA를, 세일은 17승 7패 2.75 ERA의 성적을 기록하고 있다. 사이영상 수상에 가장 중요한 지표인 승률과 평균자책점에서 클루버가 앞서고 있다. 하지만 세일은 벌써 209.1이닝을 소화하며 무려 300개의 탈삼진을 기록했다. FIP도 2.22로 메이저리그 전체에서 가장 좋다. FIP 기반의 WAR로 비교하면 세일이 ...

투수의 인플레이 타구 책임까지 고려한 스탯, XRA

이전에 투수를 정교하게 평가하는 스탯, cFIP와 DRA를 소개했다. cFIP는 투수의 책임이 큰 이벤트를 바탕으로 당시 상황을 세부적으로 고려하여 조정한 스탯이며, DRA는 투수가 허용한 모든 이벤트를 바탕으로 정교하게 조정한 스탯이다. cFIP는 투수의 실제 실력을 판단하기에 우수하며, DRA는 투수의 실적을 객관적으로 평가하기에 적합하다.

그러나 이 두 스탯 또한 여전히 완전하지 못하다. cFIP는 인플레이 타구의 결과를 거의 무시하고 있으며, 반대로 DRA는 인플레이 ...

현 세계 최고의 투수는? 클레이튼 커쇼? 맥스 슈어저?

현 세계 최고의 투수는 누구일까? 클레이튼 커쇼? 맥스 슈어저? 아니면 크리스 세일? 이에 대한 답을 얻기 위한 방법으로 지난 2011년 빌 제임스(Bill James)가 고안한 '세계 최고의 선발투수(The worlds number one starting pitcher)' 지표를 참고해보자. 테니스 또는 골프의 세계 랭킹 순위와 유사하며, 계산 과정은 다음과 같다.

모든 선발 투수의 포인트는 300점부터 시작하며, 이 점수가 최저값이다.
선발투수가 ...

공의 회전 수(spin rate)와 구속의 상관관계

타구의 속도와 각도가 안타 확률에 큰 영향을 미친다는 것을 전에 확인했다. 그렇다면 투수가 던진 공의 회전 수(spin rate)는 어떨까? 회전 수가 클수록 구속이 빨라지거나 타자를 상대하는데 더 효과적일까? 이와 관련하여, 맷 페팃(Matt Petitt)은 자신의 블로그(Exploring Baseball Data with R)에 분석 결과를 공개했다. 2015~2016년 100개 이상의 공을 던진 투수들을 대상으로, 공의 회전 수와 구속 간에 상관계수를 구했다. 정밀한 분석을 ...

하반기 낮은 ERA가 예상되는 투수들

투수의 전반기 성적을 바탕으로 하반기 성적을 예측할 수 있을까? 투수의 상반기와 하반기 ERA는 얼만큼의 상관관계가 있을까?

Jclarke는 얼마 전 이와 관련하여 팬그래프에 자신의 분석 결과를 소개하였다. 2015년 규정 이닝을 기록한 57명의 투수를 대상으로 했을 때, 전반기와 하반기 ERA 간의 결정계수(R^2)는 .07로 나타났다. 즉, 전반기 어떤 투수의 ERA는 해당 투수 하반기 ERA의 겨우 7%만을 설명할 수 있다는 것이다. ...

2010년 이후 최고의 K%+ 시즌은?

지난 2014년에 리그의 삼진율(K%) 고려하여 특정 투수의 탈삼진 능력이 얼마나 뛰어난지를 확인할 수 있는 조정 스탯을 제안했다. 시대와 리그에 따라서 삼진 비율은 크게 변하기 때문에, 이를 고려하여 투수의 탈삼진 능력을 확인하기 매우 유용한 스탯이었다. 실제로 리그의 평균 K%는 1950년 10% 수준이었으나, 현재는 20% 수준으로 매우 크게 증가했다. 동일한 20%의 삼진률을 보이는 투수여도 시대에 따라 평가가 크게 ...

클레이튼 커쇼와 20승

출처: http://www.fangraphs.com/community/fun-with-game-score-xw-xl-and-xnd/

이전에 팀의 성적을 바탕으로, 투수의 승/패 성적을 조정하는 방법을 소개했다. 이번에는 투수 본인의 퍼포먼스만으로 적정한 승/패 스탯을 계산하는 법을 소개하고자 한다. 얼마 전 팬그래프 커뮤니티 리서치에 Chris Jeske가 소개한 방법으로, 투수의 게임 스코어를 바탕으로 계산하는 것이다.

게임 스코어(GS)는 투수의 단일 경기 퍼포먼스를 평가하기 위한 스탯이다. 여기서는 Tom Tango가 아닌 빌 제임스의 버전을 활용하도록 한다. 계산 방법은 다음과 같다.

GS = ...