홈구장 이점(Home field advantage)은 정말 존재하는가?

홈구장 이점(Home field advantage)은 정말로 존재할까? 존재한다면 그 효과는 어느정도일까? 2014년 메이저리그 모든 팀의 성적을 기준으로 이를 확인해보자. 베이스볼 레퍼런스에 의하면, 작년에 진행된 2430 경기 중에서 홈 팀이 거둔 성적은 1288승 1142패이다. 53%의 비교적 높은 승률이며, 반대로 원정 팀은 47%의 승률에 그친 것이다. 그렇다면 이 3%의 추가 이득을 홈구장 이점에 의한 것이라고 해석할 수 있을까? 이것이 우연에 의해서 발생한 변동(random variation)은 아닌지 간단한 가설 검정(hypothesis testing)을 해보도록 하자.

먼저, 53%의 승률이 단지 우연에 의해서 발생했다고 가정해보자. 그렇다면 이 우연이 발생할 확률은 얼마나 될까? 한 경기의 결과는 승리 또는 패배만으로 이루어진다. 따라서 승리는 50%의 확률을 평균으로 갖는 일종의 이항 분포(binomial distribution)라 볼 수 있다. 이 때 측정한 승률에 대한 분산(luck^2)은 다음과 같이 얻을 수 있다.

  • luck^2 = p x ( 1 – p ) / n

p는 이벤트 발생 확률(승률)을 의미하며, n은 관측(경기) 수이다. 위 수식을 통해 우연에 의한 분산을 계산해보면 0.5 x ( 1 – 0.5 ) / 2430 = 0.000103가 되며, 표준편차(luck) .010(1%)이 얻어진다.

한편, 이항 분포는 충분한 샘플 수가 있을 때 정규 분포로 근사 가능하다. 따라서 우연에 의한 승률 분포는 50%를 중심으로, 표준편차 1%를 갖는 정규 분포라 볼 수 있다. 그런데 우리가 관측한 53%의 승률이 얻어지려면, 평균으로부터 표준편차(1%)의 세 배만큼이나 벗어나야 한다. 그러나 이러한 가능성(P-value)은 겨우 .003(0.3%) 수준이다. 따라서 관측된 53%의 승률은 확실히 홈구장 이점에 의한 효과라고 해석할 수 있다.

참고로, 2014년 각 팀의 홈, 원정 경기 승률을 확인해보자.

Team Home Away Gap
COL 55.6% 25.9% 29.7%
SDP 59.3% 35.8% 23.5%
PIT 63.0% 45.7% 17.3%
STL 63.0% 48.1% 14.9%
CIN 54.3% 39.5% 14.8%
CLE 59.3% 45.7% 13.6%
CHC 50.6% 39.5% 11.1%
TOR 56.8% 45.7% 11.1%
OAK 59.3% 49.4% 9.9%
CHW 49.4% 40.7% 8.7%
MIA 51.9% 43.2% 8.7%
LAA 64.2% 56.8% 7.4%
HOU 46.9% 39.5% 7.4%
WSN 63.0% 55.6% 7.4%
ATL 51.9% 45.7% 6.2%
BAL 61.7% 56.8% 4.9%
MIL 51.9% 49.4% 2.5%
NYY 53.1% 50.6% 2.5%
SFG 55.6% 53.1% 2.5%
ARI 40.7% 38.3% 2.4%
NYM 49.4% 48.1% 1.3%
PHI 45.7% 44.4% 1.3%
DET 55.6% 55.6% 0.0%
MIN 43.2% 43.2% 0.0%
TEX 40.7% 42.0% -1.3%
BOS 42.0% 45.7% -3.7%
LAD 55.6% 60.5% -4.9%
KCR 51.9% 58.0% -6.1%
SEA 50.6% 56.8% -6.2%
TBR 44.4% 50.6% -6.2%
  • Share on Tumblr