알렉스 로드리게스의 금지약물 복용 확률은?

메이저리그 선수가 금지약물 검사에서 양성반응을 보였을 때, 실제 이 선수가 해당 금지약물을 복용했을 확률은 얼마나 될까? 이를 확인할 때 베이즈 정리(Bayes` theorem)를 이용하면 유용하다. 베이즈 정리는 사전 확률과 제시된 근거에 따른 사후 확률 사이의 관계를 나타내는 정리다. 약물 검사를 예로 들어 관계식으로 정리하면 다음과 같다.

  • P ( PED+ | TEST+ ) = P ( TEST+ | PED+ ) x P ( PED+ ) / P ( TEST+ )

P ( PED+ | TEST+ )는 검사에서 양성반응을 보인 선수가 실제 약물을 복용했을 확률을 의미하며, 반대로 P ( TEST+ | PED+ )는 약물 복용 선수가 테스트에서 양성반응을 보일 확률이다. P ( PED+ )는 선수 약물 복용에 대한 사전 확률이고, P ( TEST+ )는 한 번의 테스트에서 양성반응 가능성을 의미한다.

그럼 이제 알렉스 로드리게스 선수가 약물 검사를 받는 상황이라고 가정하고, 거기에서 그가 양성 반응을 보였다고 하자. 이 때 로드리게스의 실제 복용 확률을 추정해보자. 일반적으로 테스트의 정확성은 민감도(Sensitivity)와 특이도(Specificity)로 설명할 수 있다. 민감도는 실제 약물을 복용한 사람이 검사에서 양성 판정을 받을 확률 – P ( TEST+ | PED+ ) – 을 의미하며, 특이도는 복용하지 않은 사람이 검사에서 음성 판정을 받을 확률 – P ( TEST- | PED- ) – 을 의미한다. 당연히 두 값은 100%에 가까울수록 정확한 테스트라고 할 수 있다. 일반적으로 95% 이상이면 정확한 편이다.

한편, 베이즈 추론을 위해서는 사전확률 – P ( PED+ ) – 을 가정해야 한다. 메이저리그 전체 선수 중에서 금지약물을 복용한 선수가 대략 10%라고 가정해보자. 그럼 P ( PED+ ) 는 일단 0.1이라고 할 수 있다. 그리고 검사에서 양성 반응을 보일 확률 – P ( TEST+ ) – 을 구해야 하는데, 약물을 복용했건 안했건 모두 양성 반응을 보일 가능성이 있으므로 다음과 같이 구해야 한다.

  • P ( TEST+ ) = P ( PED+ ) x P ( TEST+ | PED+ ) + P ( PED- ) x P ( TEST+ | PED- )

P ( PED+ ) 는 0.1, P ( PED- ) 는 1 – 0.1 = 0.9를 대입한다. 한편,  P ( TEST+ | PED+ )는 검사의 민감도를 의미하므로 0.95를, P ( TEST+ | PED- )는 1에서 특이도(0.95)를 뺀 값 0.05를 대입하면 된다. 위에서 얻어진 값을 모두 대입했을 때, P ( PED+ | TEST+ )는 67.9%가 얻어진다. 이 정도 확률이면 약물 복용을 의심하기엔 충분하지만 확실하다고 보기는 어렵겠다.

그렇다면, 이 선수에 대해서 다시 검사를 했을 때 또 양성 반응이 나타난다면 어떨까? 이번에는 사전확률을 0.1 대신 .679를 대입해야 할 것이다. 그랬을 때 이 선수의 복용 확률은 97.6%로 매우 크게 증가한다. 이 정도 가능성이면 로드리게스의 복용 사실을 주장하기에 큰 무리가 없다.

그럼, 마지막으로 내가 약물 검사에서 양성 반응이 나왔다면? 일반적인 시민이 금지약물을 복용했을 확률은 0.1% 미만일 것이다. 이를 대입했을 때 복용 확률은 겨우 1.9%로 추정된다. 한 번 검사에 큰 의미를 둘 필요가 없을 것이며, 일반 시민의 경우 연속 세 번 정도는 양성 반응이 나와야 의심스럽다고 할 수 있겠다.

Leave a Reply

Your email address will not be published. Required fields are marked *