이닝당 득점 발생 가능성을 계산하는 간단한 방법 (2)

이전에 이닝당 득점 발생 가능성을 계산하는 방법을 소개했다. 간단히, 득점 발생 확률 분포를 푸아송 분포로 가정했었다. 푸아송 분포는 이항 분포의 특수한 형태로, 발생 기회가 많지만 확률은 낮은 경우에 이항 분포는 푸아송 분포(Poisson distribution)를 따른다.

푸아송 분포를 이용하면, 정해진 시간 안에 어떤 사건이 일어날 횟수의 기댓값(λ)을 알 때, 그 사건이 k 회 일어날 확률(Pr)을 구할 수 있다. 계산식은 다음과 같다.

Latex formula

하지만 이 방법은 이닝당 득점을 설명하기에 정확하지는 않다. 푸아송 분포는 이닝당 득점의 평균과 분산이 같다고 가정하기 때문이다. 이로 인해, 푸아송 분포는 무득점 이닝 가능성을 실제보다 낮게 추정한다. 이전에 언급한 대로, 음이항 분포(negative binomial distribution)로 가정하는 것이 좀 더 정확하다.

음이항 분포는, 성공 확률을 p라고 했을 때, X 번째 시행에서 r 번째 성공이 나올 확률 분포를 의미한다. 또는, r 번째 성공을 얻기까지 발생한 실패 횟수(Y = X – r)의 확률 분포로 해석할 수도 있다. 확률(Pr)은 다음과 같이 계산한다.

Latex formula

이때, 평균과 분산은 다음과 같이 얻어진다.

Latex formula

Y를 어떤 이닝에 발생하는 득점이라 가정한다면, 아래와 같이 측정한 이닝당 득점의 평균과 분산으로부터 r과 p 파라미터를 얻을 수 있다.

Latex formula

한편, 감마 함수를 이용한 음이항 분포의 일반화 버전은 다음과 같다. 이 식을 이용하면 k 또는 r이 정수가 아니더라도 적용할 수 있다.

Latex formula

그럼 이제 음이항 분포를 이용해서 이닝당 득점 확률을 계산해보자. 팬그래프 션 돌리나(Sean Dolinar)에 의하면, 2011-2013년 AL 이닝당 득점 평균과 분산은 각각 .4830와 1.0136이다. 따라서 r과 p는 각각 .4396과 .4765이다. 이를 위 식에 적용하면 이닝당 k득점이 발생할 확률이 계산된다.

예를 들어, 0득점 발생 확률은,

Latex formula

즉, 무득점 이닝 가능성은 약 72%이다.

아래 그림은 2011-2013년 AL 데이터를 기준으로, 음이항 분포와 푸아송 분포로 계산한 이닝당 득점 발생 확률이다. 무득점 이닝이 상당히 많다는 점을 음이항 분포가 푸아송 분포보다 좀 더 잘 설명한다.

Leave a Reply

Your email address will not be published. Required fields are marked *