성적으로부터 실력과 운을 구분하기

모든 스탯은 운과 기량이 결합된 결과이다. 이전에 이항 분포(binomial distribution)의 우연 변동(random variation)에 의한 분산 계산을 소개한 적이 있다. 수식은 다음과 같다.

  • luck^2 = p x ( 1 – p ) / n

이를 바탕으로 어떤 성적에 대해 운이 얼마나 비중을 차지하는지 확인해보자. 가장 단순한 예로, 팀의 한 시즌 승률을 다뤄보겠다. 팀은 한 경기에서 이기거나 또는 이기지 못하거나 둘 중 하나이므로, 팀의 승률은 전형적인 이항 분포라고 볼 수 있다. 따라서 위의 수식을 이용해 우연에 의한 승률의 분산(Var)을 계산할 수 있다.

  • Var(luck) = 승률 x ( 1 – 승률 ) / 경기 수

한 시즌 162 경기를 가정 했을 때 평균 승률은 50%이므로 이를 대입하면, 우연에 의한 분산은 .5 x .5 / 162 = .0015432로 계산된다. 한편, 2016년 기준 모든 팀의 승률에 대한 분산은 .00438로 확인된다. 이 관측 결과는 실력(talent)과 운(luck)에 의한 변동성이 모두 더해진 결과이다.

일반적으로, 두 분산의 합은 다음과 같이 계산할 수 있다.

  • Var(luck+talent) = Var(luck) + Var(talent) + 2 x Cov(luck,talent)

여기에서 Cov는 2개의 확률변수의 상관정도를 의미하여, 공분산(Covariance)이라 한다. 그러나 운에 의한 변동성은 실력과는 상관성이 전혀 없으므로, Cov(luck,talent)은 0으로 취급할 수 있다. 따라서 전체 변동성은 다음과 같이 다시 정리된다.

  • Var(luck+talent) = Var(luck) + Var(talent)
  • Var(talent) = Var(luck+talent) – Var(luck)

앞에서 관측된 전체 분산은 .00438 이었고, 운에 의한 변동성은 .0015432 이었으므로, 실력(talent)에 의한 변동성은 .00438-.0015432=.0028368 이다. 이는 전체 변동량(.00438)의 약 64.8% 수준이다. 따라서 실제 변동량의 약 64.8% 만을 실제 실력에 의한 것이라 간주하는 것이 합당하다. 2016년 최고의 승률을 기록한 시카고 컵스의 예를 들어보자. 컵스는 실제로 64%의 승률을 기록했으나, 순전히 실력(talent)에 의한 승률만을 추정한다면 ( 64% – 50% ) x .648 + 50% = 59.1%이다. 물론 이는 여전히 전체에서 가장 높은 수치이다.

  • Share on Tumblr