애런 저지의 후반기 부진과 평균으로의 회귀(regression toward the mean)

애런 저지의 후반기 성적이 저조하다. 그는 전반기에 .329/.448/.691 타격 슬래시라인과 30개의 홈런을 기록했다. 신인왕은 물론 아메리칸리그의 가장 강력한 MVP 후보였다. 그러나 후반기 부진이 계속되며, 8월 16일까지 겨우 .175/.344/.369의 성적을 기록하고 있다. 그가 부진한 이유는 무엇일까? 혹시 평균으로의 회귀(regression toward the mean) 현상으로 설명할 수 있지 않을까?

평균으로의 회귀 현상이란, 첫 번째 관측에서 극단적인 값을 가진 변수가, 다음 관측에서는 좀 더 평균에 가까운 값을 갖는 통계적 경향성을 의미한다. 첫 번째에 극단적인 값은 운을 포함한 여러 요인이 결합된 결과이며, 따라서 다음 측정에서는 이러한 운적인 요소가 다시 평균에 가까워지는 것이다.

그렇다면 애런 저지의 후반기 부진을 평균 회귀로 설명할 수 있을까? 2016년 타격에서 평균 회귀 현상이 얼마나 나타났는지 살펴보자. 전반기와 후반기 모두 100타석 이상을 기록한 타자를 대상으로 했을 때, 전반기와 후반기 wRC+ 간의 상관계수는 겨우 .26으로 나타났다. 의외로 상관성이 높지 않다. 전반기에 아무리 뛰어났던 타자라 할지라도, 후반기에 잘한다는 보장은 없다. 이는 애초에 타자의 생산성(wRC+)이 상당부분 운에 좌우되기 때문이다.

좀 더 구체적으로, 2016년 전반기에 비슷한 wRC+를 기록한 타자들의 후반기 평균 wRC+를 살펴보자.

전반기 wRC+ 후반기 평균 wRC+
20~39 87
40~59 87
60~79 89
80~99 96
100~119 103
120~139 107
140~159 112
160~179 126
180~200 136

평균으로의 회귀 현상이 뚜렷하게 나타났다. 전반기 20~39 사이의 wRC+를 기록했던 타자들의 성적은 후반기 평균 87로 급상승했다. 반면, 180~200 범위의 wRC+를 기록했던 리그 최고 타자들은 후반기 겨우 136 wRC+를 기록했다. 전반기 성적이 매우 부진하거나 또는 뛰어나다 할지라도, 후반기 성적을 예측할 때 상당부분 전반가의 성적을 평균으로 회귀시켜 예측해야 하는 것이다.

그렇다면 애런 저지의 성적을 분석해보자. 그는 2017년 전반기 198의 wRC+를 기록했다. 26%를 제외한 나머지 74%를 평균으로 회귀시키면, wRC+는 겨우 125가 된다(= 0.74 x 100 + 198 x 0.26). 단순히 그의 전반기 성적과 평균으로의 회귀만을 가정했을 때, 그가 후반기에 기록할 것으로 예측되는 wRC+는 고작 125인 것이다. 애초에 그에 대한 우리의 후반기 기대치가 너무 높았음을 알게 된다. 그러나, 그럼에도 불구하고 그의 현재까지 후반기 87 wRC+는 너무 낮다.

  • Share on Tumblr