홈구장 이점(Home field advantage)은 정말로 존재할까? 존재한다면 그 효과는 어느정도일까? 2014년 메이저리그 모든 팀의 성적을 기준으로 이를 확인해보자. 베이스볼 레퍼런스에 의하면, 작년에 진행된 2430 경기 중에서 홈 팀이 거둔 성적은 1288승 1142패이다. 53%의 비교적 높은 승률이며, 반대로 원정 팀은 47%의 승률에 그친 것이다. 그렇다면 이 3%의 추가 이득을 홈구장 이점에 의한 것이라고 해석할 수 있을까? 이것이 우연에 의해서 발생한 변동(random variation)은 아닌지 간단한 가설 검정(hypothesis testing)을 해보도록 하자.
먼저, 53%의 승률이 단지 우연에 의해서 발생했다고 가정해보자. 그렇다면 이 우연이 발생할 확률은 얼마나 될까? 한 경기의 결과는 승리 또는 패배만으로 이루어진다. 따라서 승리는 50%의 확률을 평균으로 갖는 일종의 이항 분포(binomial distribution)라 볼 수 있다. 이 때 측정한 승률에 대한 분산(luck^2)은 다음과 같이 얻을 수 있다.
- luck^2 = p x ( 1 – p ) / n
p는 이벤트 발생 확률(승률)을 의미하며, n은 관측(경기) 수이다. 위 수식을 통해 우연에 의한 분산을 계산해보면 0.5 x ( 1 – 0.5 ) / 2430 = 0.000103가 되며, 표준편차(luck) .010(1%)이 얻어진다.
한편, 이항 분포는 충분한 샘플 수가 있을 때 정규 분포로 근사 가능하다. 따라서 우연에 의한 승률 분포는 50%를 중심으로, 표준편차 1%를 갖는 정규 분포라 볼 수 있다. 그런데 우리가 관측한 53%의 승률이 얻어지려면, 평균으로부터 표준편차(1%)의 세 배만큼이나 벗어나야 한다. 그러나 이러한 가능성(P-value)은 겨우 .003(0.3%) 수준이다. 따라서 관측된 53%의 승률은 확실히 홈구장 이점에 의한 효과라고 해석할 수 있다.
참고로, 2014년 각 팀의 홈, 원정 경기 승률을 확인해보자.
Team | Home | Away | Gap |
COL | 55.6% | 25.9% | 29.7% |
SDP | 59.3% | 35.8% | 23.5% |
PIT | 63.0% | 45.7% | 17.3% |
STL | 63.0% | 48.1% | 14.9% |
CIN | 54.3% | 39.5% | 14.8% |
CLE | 59.3% | 45.7% | 13.6% |
CHC | 50.6% | 39.5% | 11.1% |
TOR | 56.8% | 45.7% | 11.1% |
OAK | 59.3% | 49.4% | 9.9% |
CHW | 49.4% | 40.7% | 8.7% |
MIA | 51.9% | 43.2% | 8.7% |
LAA | 64.2% | 56.8% | 7.4% |
HOU | 46.9% | 39.5% | 7.4% |
WSN | 63.0% | 55.6% | 7.4% |
ATL | 51.9% | 45.7% | 6.2% |
BAL | 61.7% | 56.8% | 4.9% |
MIL | 51.9% | 49.4% | 2.5% |
NYY | 53.1% | 50.6% | 2.5% |
SFG | 55.6% | 53.1% | 2.5% |
ARI | 40.7% | 38.3% | 2.4% |
NYM | 49.4% | 48.1% | 1.3% |
PHI | 45.7% | 44.4% | 1.3% |
DET | 55.6% | 55.6% | 0.0% |
MIN | 43.2% | 43.2% | 0.0% |
TEX | 40.7% | 42.0% | -1.3% |
BOS | 42.0% | 45.7% | -3.7% |
LAD | 55.6% | 60.5% | -4.9% |
KCR | 51.9% | 58.0% | -6.1% |
SEA | 50.6% | 56.8% | -6.2% |
TBR | 44.4% | 50.6% | -6.2% |