포지션 조정값(Positional adjustment)은 얼마나 정확한가?

우리는 선수를 평가할 때 WAR 스탯을 흔히 활용한다. WAR 시스템에서는 서로 다른 포지션 간의 선수를 비교하기 위해 포지션 조정값을 활용한다. 포지션 조정값은 162경기 기준으로 다음과 같다.

포수: +12.5
유격수: +7.5
2루수/3루수/중견수: +2.5
좌익수/우익수: -7.5
1루수: -12.5
지명타자: -17.5

위 조정값은 수비에서 포지션에 따른 난이도를 고려하여 설정된 값이다. 하지만 값의 아름다운 대칭성에서 알 수 있듯이, 절대적으로 정확한 값이 아니고 다소 임의적으로 부여된 값이다. 그럼에도 불구하고 우리는 이 값에 따라 계산된 WAR로, 서로 다른 포지션의 선수를 평가하고 있다. 그렇다면 포지션 조정값은 왜 임의적으로 부여될 수 밖에 없으며, 이를 얼마나 신뢰할 수 있는걸까?

위의 포지션 조정값은 MGL의 Raw-UZR을 바탕으로, Tom Tango가 고안한 값이다. 포지션을 옮긴 선수들의 UZR 성적을 비교하여, 포지션 간 수비 난이도를 비교/분석했다. 그는 분석 과정에서 많은 어려움을 느꼈는데 사유는 다음과 같다.

외야수 간 난이도 불일치의 문제
내야수 간 난이도 불일치의 문제
외야수/내야수 간 난이도 불일치의 문제
포수 난이도 선정의 문제

1) 외야수 간 난이도 불일치의 문제. 외야수는 사실 서로 포지션 이동이 잦은 편이다(예, 추신수). 따라서 샘플 데이터가 많아 그나마 결론을 도출하기가 가장 쉬운 부분이다. Tango의 분석 결과에 의하면, 600BIP(Balls In Play) 기준으로 좌익수는 우익수보다 2.4점 더 가치를 갖는다. (즉, 좌익수일 때보다 우익수일 때 선수들의 UZR이 2.4점 더 낮다.) 한편, 중견수는 좌익수보다 9.7점, 그리고 우익수보다는 8.9점의 가치를 더 갖는다. 이 사실을 모두 종합하면, 중견수는 좌익수/우익수에 비해 난이도가 훨씬 더 높은 것으로 보인다. 하지만, 좌익수와 우익수 간 난이도를 비교하기는 어렵다. 데이터 샘플을 어떻게 선정하느냐에 따라 다른 결론이 도출되기 때문이다. 게다가, 좌익수에서 우익수로 이동한 선수들은 UZR이 감소하고, 반대로 우익수에서 좌익수로 이동한 경우에도 감소한다. 즉, 포지션 익숙한 정도에 따라서도 큰 차이를 보인다는 것이다. 더욱이, 어느 포지션에서 더 많은 시간을 보냈느냐에 따라서도 물론 다른 결론이 나온다. 단순히 좌익수/우익수 두 포지션에서 비슷한 시간을 보낸 선수들만을 대상으로 하면, 둘 간의 UZR 차이는 1점 미만으로 나타난다. 그러나 안타깝게도 여전히 중견수는 좌익수보다 10.3점 이상의 가치를, 우익수보다는 7.2점의 가치를 갖는다. 결국 Tango는 중견수는 좌익수/우익수보다 약 9점의 가치를, 좌익수/우익수는 서로 동등한 가치를 갖는다고 결론낸다. 나름 합리적인 결론이라고 생각되지만, “정확한” 것은 아니다. 좌익수/중견수/우익수의 포지션 간 비교에 있어서 0.1~0.3 WAR 차이는 오차 범위 이내임을 감안해야 한다.

2) 내야수 간 난이도 불일치의 문제. 역시 마찬가지이다. 유격수는 2루수보다 4.9점의 가치를, 3루수보다는 1.2점의 가치를 더 갖는다. 반면 2루수는 3루수보다 2.5점의 가치를 더 갖는다. 모순적인 결과일 수 있는데, 겨우 수십명의 샘플 데이터를 활용했기 때문에 그만큼 신뢰도가 낮은 것이다. 종합하면, 유격수가 가장 높은 가치를 갖는 것은 맞다. 그러나 2루수와 3루수를 판정하기에는 애매하다. 서로 완전히 다른 기술이 요구되는 포지션인 것 같다. 현재의 포지션 조정값과 비교했을 때, 2루수/유격수/3루수 간 0.1 WAR 정도의 오차는 감안해야겠다.

3) 외야수/내야수 간 난이도 불일치의 문제. 가장 크게 오차가 발생하는 부분이다. 내야수와 외야수를 겸했던 선수들이 많지 않기 때문에, (샘플 수 증가를 위해) 외야수 전체 평균 UZR과 내야수 전체 평균값을 비교한다. 재미있는 것은, 내야수에서 외야수로 옮긴 선수들의 UZR이 3.6점 감소하는 반면 외야수에서 내야수로 옮긴 선수들도 7.1점 감소한다. 이 둘을 단순히 고려했을 때 내야수는 외야수보다 3.5점의 가치를 더 갖는다고 볼 수도 있다. 하지만 외야수에서 내야수로 옮기는 경우가 훨씬 더 적기 때문에, 단순히 동등하게 비중을 둬서 더하는 방식이 꼭 옳은 것은 아니다. 또, 일반적으로 내야수에서 외야수로 전향하는 선수들은 수비 능력이 매우 떨어지는데, 이렇게 되면 샘플의 대표성도 떨어진다.

한편, 1루수에 대해서는 다른 포지션을 경험한 선수들이 많다. 따라서 1루수를 기준으로 다른 포지션의 수비 난이도를 비교하는 것도 좋을 것이다. 우선, 1루수와 다른 내야수 간 UZR 변화와 1루수와 외야수간 UZR 변화를 비교해보자. 의외로 그 차이가 7~8점으로 거의 같다. 즉, 내야수/외야수 간 평균 난이도 차이가 거의 없는 것으로, 앞의 결과와 비교하면 큰 차이를 보인다. 그런데, 먼저 1루수로 있다가 다른 포지션으로 옮겨간 경우를 보면, 내야수로 이동했을 때 UZR이 약 10점 감소한 반면, 외야수로 이동했을 때는 무려 20점이 감소한다. 반대로, 내야수가 1루수로 이동했을 때 UZR이 7.4점 상승하는 반면, 외야수가 1루수로 이동했을 때는 겨우 1.4점 상승한다. 이렇게 엄청난 비일관성에 대해 Tango는 샘플 데이터의 편향 및 사이즈 부족에 의한 왜곡이라 언급한다. 아무튼 그는 신뢰도가 비교적 높은 케이스의 비교 및 후속 연구를 통해, 2루수/3루수/중견수는 거의 동등한 난이도를 갖는다고 결론낸다. 그러나 내야수/외야수 간 0.3~0.5 WAR 조차도 오차 범위 이내라고 할 수 있다.

4) 포수의 난이도 선정의 문제. 포수의 경우는 거의 답이 없다(?). 직관적으로 값을 부여하여 현재와 같은 포지션 조정값이 설정됐다. 최대 1 WAR 이상의 오차가 있을 것이라 생각된다. 더욱이, 포수는 현재 UZR로 반영하지 못하고 있는 부분도 많다.

결론적으로, 현재의 WAR 시스템에서 포지션 조정값은 큰 오차를 갖는다. 외야수 간 0.1~0.3, 내야수 간 0.1, 그리고 외야수/내야수 간의 0.3~0.5 WAR는 오차 범위 이내라고 볼 수 있다. 따라서 서로 다른 포지션의 선수를 0.1 WAR의 해상도로 세밀하게 비교하는 것은 별로 의미없는 행위일 수 있다. 특히, 포수는 1~2 WAR까지 개인의 선호를 “적극” 반영하여 스탯을 참고해도 좋을 것 같다. (참고로 위의 상세한 포지션 간 UZR 비교값은 Tango가 샘플 데이터를 추가하면서 계속 수정되었다.)

추가로, 포지션 간 난이도 비교를 위한 다른 방법을 생각할 수도 있다. 리그 평균적으로, 모든 포지션에 대해 거의 동등한 능력/수준의 선수들이 배치된다고 가정하는 것이다. 즉, 공격&주루에서의 기여도가 적은 포지션은, 그만큼 수비에서 만회를 하고 있다고 간주하는 것이다. 물론 모든 포지션에 대해서 평균적인 능력이 완전히 동일하지는 않을 것이다. 그러나 어느정도 밸런스는 유지할 것이라고 본다. 아래는 2008년 SB Nation에 Sky Kalkman가 소개한 포지션 조정값이다. 이 값은 각 포지션에서의 공격력을 바탕으로 역추적하여 계산된 값이다. (즉, 공격력이 적은 포지션은 수비 난이도가 그만큼 높다고 가정한다.)

포수: +7.7
1루수: -14.3
2루수: -1.3
3루수: -5.5
유격수: +6.5
좌익수: -9.2
중견수: -1.5
우익수: -12.3
지명타자: -5.4

현재의 포지션 조정값과 비교하면, 포수/3루수/우익수가 큰 손해를, 지명타자가 큰 이득을 보게 되었다. 반대로 생각하면, 포수/3루수/우익수 선수들은 수비 난이도에 비해 높은 공격력까지 보여주는 선수들이라 해석할 수도 있겠다.

Suxism.com

썩빡꾸의 세이버메트릭스

포지션 조정값(Positional adjustment)은 얼마나 정확한가?

Leave a Reply Cancel reply

Related posts:

Leave a Reply Cancel reply