피칭봇(PitchingBot)과 스터프(Stuff) 지표는 투수의 미래 성적을 더 잘 예측할 수 있을까?

이전에 투수의 투구 퀄리티를 평가하는 피칭봇(PitchingBot)과 스터프(Stuff)+ 지표들을 소개했다. 이들은 투수와 타자의 정보(handness), 스트라이크 존 높이, 볼 카운트, 구속(velocity), 회전 수(spin rate), 무브먼트(movement), 릴리즈 포인트(release point), 익스텐션(extension), 로케이션(location) 등의 정보를 기준으로 피치의 퀄리티를 판정하는 것이었다. 매우 다양한 정보를 기반으로 머신러닝 모델을 이용해서 산출된 수치이므로, 실제 투수의 실력을 매우 잘 설명할 것이라 기대된다. 그렇다면 이 지표들은 미래의 ...

2020년 셰인 비버의 ERA는 얼마나 대단한가?

2020년 셰인 비버의 활약이 대단하다. 9월 12일까지 10경기에 선발로 등판하여, 64.2이닝동안 7승 1패 ERA 1.53을 기록 중이다. 메이저리그 전체 ERA 1위이다. 일반적으로, MVP는 타자가 받는 경우가 많지만, 비버는 뛰어난 활약으로 현재 AL MVP 강력한 후보로 꼽히고 있다. 물론 1.53의 ERA는 대단히 훌륭하다. 하지만 이번 시즌은 경기 숫자가 적어, 1점 중반대의 ERA를 기록한다 하더라도 다른 시즌의 ...

투수 스탯과 다음 시즌 ERA와의 상관계수

이전에 타자의 다음 시즌 wOBA와 상관성이 높은 스탯을 확인했다. 이와 유사하게, 이번에는 투수의 다음 시즌 ERA와 상관성이 높은 스탯을 확인해보자. 다음 시즌 ERA를 예측하는데 유용한 스탯이 있을까? 그렇다면 상관관계는 얼마나 될까? 2002–2019년 규정이닝을 만족한 투수를 대상으로, 어떤 시즌의 스탯과 그 다음 시즌 ERA의 상관계수를 확인했다. 그 평균값은 다음과 같다. Metric (Y)ERA Corr. (Y+1)ERA.315FIP.437ERA – FIP-.083xFIP.439K%-.425BB%.091WHIP.315BABIP.000LOB%-.184K/BB-.340AVG.296LD%.023GB%-.056FB%.052IFFB%-.102GB/FB-.067HR/FB.109IFH%-.036BUH%.067Z-Swing%-.038O-Swing%-.195Swing%-.189Z-Contact%.344O-Contact%.258Contact%.337Zone%-.117F-Strike%-.155SwStr%-.359Pull%.142Cent%-.007Oppo%-.159Soft%-.225Med%.055Hard%.126 위 결과를 간단히 ...

타자 스탯과 다음 시즌 wOBA와의 상관계수

타자를 평가하는 대표적이고, 가장 대중적인 스탯은 OPS이다. 그런데 OPS는 출루율을 실제 가치보다 과소평가하기 때문에, wOBA나 이를 조정한 wRC+가 타자를 평가하기에 더 적합하다. 그런데 다음 연도 wOBA를 예측할수 있는 스탯이 있을까? 즉, 다음 시즌 wOBA와 상관성이 가장 높은 스탯이 무엇일까? 아마도 wOBA일 것이다. 즉, 이번 시즌에 wOBA가 높은 타자는 다음 시즌에도 역시 wOBA가 높을 거이다. 하지만 wOBA보다 ...

류현진의 2019년 최종 ERA는 몇일까? (5)

지난 6월부터 류현진의 2019년 최종 ERA를 추정하고 있다. 매달 류현진이 기록한 ERA를 바탕으로, 해당 기간까지 그와 유사한 ERA를 기록한 사례를 찾아 2019년 시즌 ERA를 추정했다. 지난 6월부터 매달 예상했던 그의 ERA 평균값과 오차범위는 다음과 같다. 6월 9일: 2.5±0.56월 29일: 2.3±0.57월 27일: 2.2±0.48월 10일:  2.0±0.3 시즌이 진행되면서 평균값은 2.5에서 2.0으로 줄어들었으며, 추정범위 역시 0.5에서 0.3으로 감소했다. 그러나 류현진은 8월에 ...

류현진의 2019년 최종 ERA는 몇일까? (4)

류현진의 7월까지의 성적을 바탕으로, 이와 유사한 ERA를 기록한 사례를 찾아 2019년 시즌 ERA를 추정했다. 2002년 이후 7월까지 100이닝 이상을 던지며 1.5~2.0 ERA를 기록한 투수들의 최종 ERA는 평균이 2.17, 표준편차가 0.42였다. 가장 낮았던 ERA는 2016년 클레이튼 커쇼의 1.69, 가장 높았던 ERA는 2007년 크리스 영의 3.12이었다. 이들의 성적을 바탕으로 예측한 류현진의 2019년 ERA는 대략 1.7~2.6 수준이었다. 그러나 류현진은 미국 ...

류현진의 2019년 최종 ERA는 몇일까? (3)

이전에 류현진의 5월, 6월까지의 성적을 바탕으로, 이와 유사한 ERA를 기록한 사례를 찾아 2019년 시즌 ERA를 추정했다. 2002년 이후 6월까지 80이닝 이상을 던지며 1.5~2.0 ERA를 기록한 투수들의 최종 ERA는 평균이 2.31, 표준편차가 0.50였다. 가장 낮았던 ERA는 2015년 잭 그레인키의 1.66, 가장 높았던 ERA는 2007년 댄 해런의 3.07이었다. 이들의 성적을 바탕으로 예측한 류현진의 2019년 ERA는 대략 1.8~2.8 ...

류현진의 2019년 최종 ERA는 몇일까? (2)

이전에 류현진 5월까지의 성적을 바탕으로, 이와 유사한 ERA를 기록한 사례를 찾아 2019년 시즌 ERA를 추정했다. 2002년 이후 5월까지 60이닝 이상을 던지며 1.0~1.5 ERA를 기록한 투수들의 최종 ERA는 평균이 2.51, 표준편차가 0.52였다. 가장 낮았던 ERA는 2015년 잭 그레인키의 1.66, 가장 높았던 ERA는 2008년 에딘슨 볼퀘즈의 3.21이었다. 이들의 성적을 바탕으로 예측한 류현진의 2019년 ERA는 대략 2.0~3.0 범위였다. 6월에도 ...

류현진의 2019년 최종 ERA는 몇일까?

류현진은 6월 8일까지 1.35의 놀라운 ERA를 기록하고 있다. 그렇다면 2019년 그의 최종 ERA는 어떨까? 이를 간단히 예측해보자. 우선, 이전에 확인한것처럼 상반기 성적으로 하반기 성적을 예측하기는 무척 어렵다. 다만 여기선 5월까지 류현진과 유사한 ERA를 기록한 사례를 바탕으로, 류현진의 2019년 시즌 ERA를 예측해보자. 2002년 이후 5월까지 60이닝 이상을 던지며 1.0~1.5의 ERA를 기록했던 시즌은 로저 클레멘스의 2005년, 제이크 피비의 ...

이전 연도 WAR 성적으로 다음 연도 WAR 성적을 예측할 수 있을까?

타자의 이전 연도의 WAR 성적을 기반으로, 다음 연도의 WAR를 예측할 수 있을까? 그렇다면 그 정확성은 얼만큼일까? 현재 플레이어 랭킹을 산출할 때, 이전 연도 WAR에 대해서 최근 순서로 각각 6, 3, 1의 가중치를 부여하여 평균값을 계산했다. 이는 실제 선수의 성적과 가장 근접한, 즉 다음 해의 WAR를 설명하기 가장 적합한 가중치라 하였는데, 정말 그런지 확인해보자. 1920년부터 2018년까지 2~6년 ...

2016년 박병호의 메이저리그 예상 성적은?

이전에 마이크 트라웃과 브라이스 하퍼 등의 2016년 성적을 예측해봤다. 이번에는 내년부터 메이저리그에서 뛰게 될 박병호의 성적을 예측해보자. 그는 아직 메이저리그 경력이 없으므로, KBO에서의 성적을 기반으로 예측해야 한다. 메이저리그가 아닌 다른 리그의 성적을 바탕으로 메이저리그 성적으로 전환하기 위해서, 빌 제임스의 MLE(Major League Equivalency) 개념을 활용해보자. 대략적인 방법은 다음과 같다.

다른 리그에서의 성적을 해당 구장의 파크팩터로 보정한다.
조정된 성적을 메이저리그의 ...

마이크 트라웃과 브라이스 하퍼의 2016년 성적은?

작년 12월 Marcel 시스템에 기반하여 마이크 트라웃의 '15년 성적을 예측했다. 당시 예측한 그의 성적은 .313/.404/.560의 타율/출루율/장타율과 .413의 wOBA였다. 실제로 그는 올 시즌 .299/.402/.590의 타격 슬래시라인과 .415의 wOBA를 기록했다. 기대 이상의 장타율(.590)을 기록했으나, wOBA는 예상치와 크게 다르지 않았다.

이번에는 다시 그의 2016년 성적을 예상해보자. 그의 3년간 타율/출루율/장타율/wOBA를 최근 연도 순으로 각각 5:4:3의 가중치를 부여하여 평균값을 구해보자. 그러면 ...

마이크 트라웃의 2015년 성적은?

이전에 Marcel이라는 성적 예측 시스템을 소개한적이 있다. 이번에는 Marcel을 비롯하여 이와 유사한 다른 예측 시스템인 ZiPS, Oliver, PECOTA, Steamer 등을 소개하려고 한다. 이들은 모두 향후 선수의 성적을 예측하고자 한다는 점에서 궁극적으로 추구하는 바가 같다. 그러나 구체적으로 그 성적을 예측하는 방법에 있어 차이를 보인다. 그렇다면 이들은 어떤 방법을 활용하는 것이며, 예측력은 얼마나 될까?

우선 Marcel은 Tom Tango에 ...

내가 메이저리그에서 풀타임으로 뛴다면 성적은? (2)

출처: http://www.fangraphs.com/community/

이전 포스트에서 내가 메이저리그를 풀타임으로 뛰었을 경우를 가정하여 성적을 예측해봤다. 전혀 스윙을 하지 않는 경우에도 투수의 제구력 난조에 의한 출루가 가능하여, 나의 성적은 타율/출루율/장타율 각각 .000/.073/.000 으로 예측됐다. 혹시 내가 타석에서 스윙을 한다면, 내 성적은 더 안 좋아질 것이라고 예상했다. 그 예상은 맞을까? 맞다면 성적은 얼마나 하락할까?

Catoblepas가 이와 관련하여 팬그래프 리서치에 흥미로운 글을 올렸다. 우리가 ...

마이크 트라웃의 전성기 시즌은 어떨까?

그는 배리 본즈가 될 수 있을까?

마이크 트라웃의 최고 전성기 시즌은 어떨까? 물론 지금도 엄청나지만 말이다. 매우 긍정적인 상황만을 가정해서, 그의 최고 시즌 성적을 간단히 예측해보자. 긍정적인 상황이란 다음의 조건들이다.

1. 기존 타자들의 Aging curve를 따라 27세까지 타격 능력이 성장한다.
2. 수비와 주루는 2012년 능력을 유지한다. (20세)
3. 가장 타자 친화적인 쿠어스 필드를 홈 구장으로 뛴다. (즉, 콜로라도 로키스로 이적한다.)
4. 매년 2013년과 동일한 경기 ...