피타고리안 승률(pythagorean expectation)은 왜 정확할까?

피타고리안 승률은 빌 제임스(Bill James)에 의해 고안된 지표로, 득점과 실점을 바탕으로 팀의 기대승률을 계산하는 방법이다. 수식의 형태가 피타고라스 공식과 유사하여 피타고리안 승률이라 불린다. 피타고라안 승률 계산법은 다음과 같다.

  • 승률 = 득점^2 / (득점^2+실점^2)

수식의 단순함에도 불구하고 놀라운 정확도를 보인다. 그런데 이 피타고리안 승률법은 도대체 왜 이렇게 잘 들어맞을까?

이와 관련하여 수학자인 스티븐 밀러(Steven J. Miller)가 이전에 수학적 타당성에 관한 논문을 발표하였다. 이 논문에서 그는 피타고리언 승률이 왜 잘 들어맞는지를 상세히 설명한다. 만일 팀의 득점과 실점이 각각 베이불 분포를 따르고, 서로 독립변수로 가정할 수 있다면, 팀의 승률은 우리가 알고있는 피타고리안 승률법과 같다는 것이다.

이전에 소개한적있는 베이불 분포는 지수 분포의 일반화된 형태로, 실제 야구 경기당 득점 분포와 매우 유사하여 이를 쉽게 모델링하기 위해 자주 쓰인다. 수식은 다음과 같다.

Latex formula

 

여기서 알파(Latex formula)는 분포의 범위를, 감마(Latex formula)는 분포의 형태를 결정하는 파라미터이다.

이제 위의 식으로부터, 평균 득점(RS)과 평균 실점(RA)을 계산할 수 있다. 이는 위 확률분포의 기대값을 계산하면 된다.

Latex formula

 

이제 승률을 계산해보자. 승률은 득점(RS)이 실점(RA)보다 클 확률을 의미하므로, 다음과 같이 적분하여 계산한다.

Latex formula

그런데 이 식을 잘 정리하면 아래와 같이 간단해진다.

Latex formula

결국 우리가 잘 알고있는 피타고리안 승률 수식으로 정리된다. 이때 피타고리안 지수는 최초 베이불 분포의 감마값에 의해 결정된다. 매년 거의 1.7에서 2.0 사이에 분포한다. 따라서 우리가 알고있는 지수 2를 사용하는 피타고리안 승률이 충분히 잘 들어맞는 것이다. 새삼 빌 제임스의 뛰어난 직관력이 놀랍다.

  • Share on Tumblr