‘스포츠에서 붉은색 유니폼을 입으면 승리할 확률이 높아진다’ 는 말은 사실일까? - 카이제곱검정
Data, Modeling, and Decisions 2011. 4. 10. 10:44‘스포츠에서 붉은색 유니폼을 입으면 승리할 확률이 높아진다’ 는 말은 사실일까?
아래 전문은 2006년 6월 10일자 동아일보에 게제된 뉴스이다.
러셀 힐 교수는 과학학술지 ‘네이처’ 5월호에 “붉은색 유니폼을 입으면 승리할 확률이 훨씬 높아진다”고 발표해 논란에 쐐기를 박았다.
실력 비슷하면 붉은색 유니폼 승률 60%
연구팀은 2004년 아테네 올림픽 경기 중 권투, 태권도, 레슬링 그레코로만형과 자유형 등 4개 격투기 종목을 분석했다. 경기자들은 파란색과 붉은색 유니폼 중 하나를 입는다. 연구 결과 붉은색 유니폼을 입은 선수의 승률이 55%로 절반을 넘었다. 붉은색의 승률이 가장 높은 종목은 태권도였다. 러셀 박사는 “경기자의 실력이 서로 비슷하면 붉은색 유니폼의 승률은 60%로 올라간다”고 말했다.
연구팀은 유럽축구대회인 유로2004에 참가한 각국 대표팀의 승률도 함께 조사했다. 이들은 두어 가지 다른 색의 유니폼을 번갈아 입는데 붉은색 유니폼을 입었을 때 승률이 높아지는 것은 물론 골도 더 많이 넣었다.
....
그리고 그 이후로도 언론에서는 이 연구를 거듭 언급하면서 붉은 유니폼을 입으면 이길 확률이 높아진다는 것을 기정사실화 하였다. 그렇지만 이 연구는 통계적으로 잘 못된 것으로 드러났는데 그 분석을 해보고자 한다. 아래 표는 Hill and Barton(2005) 에 의해서 수집된 데이타이다. 각각의 문제를 따라 가면서 분석을 해보자.
종목 |
Blue 유니폼 |
Red 유니폼 |
합계 |
권투(B) |
120 |
148 |
268 |
레슬링 그레코로만형(GW) |
24 |
27 |
51 |
레슬링 자유형(FW) |
23 |
25 |
48 |
태권도(TaeKwon) |
35 |
45 |
80 |
합계 |
202 |
245 |
447 |
% |
45.19% |
54.81% |
100% |
1. 먼저 귀무가설(null hypothesis) ‘각각의 종목에서 빨간색 유니폼을 입은 팀과 파란색 유니폼을 입은 팀의 승률은 50%로 같다’ vs 대립가설 ‘각각의 종목에서 두팀의 승률은 같지만 50%는 아니다’ 를 테스트해보자.
우도함수(Likelihood ratio)
여기서 우리는
따라서 이때 피어슨 카이 검정 통계량(Pearson's Chi-square statistics)는 다음과 같이 계산된다.
이때 자유도 1인 카이검정통계량의 p_value 는 0.04로이다. 이 결과에 따르면 통계적으로 각각의 종목에서 두팀의 승률은 같지만 50%는 아니라는 것을 알 수 있다. 즉, 이 연국팀이 전체적으로 붉은 유니폼을 입은 팀이 승리할 확률이 55%로 높다고 이야기하는 것은 이 가설을 테스트한 것이라고 할 수 있다.
따러서 이 가설에 의한 검정결과로 붉은색 유니폼을 입은 팀이 스포츠에서 이길 확률이 높다는 것은 논리적으로 맞는 말이 아니다.
이것을 제대로 테스트를 하려면 다음( 2)과 같은 가설을 세워야 한다.
2. 먼저 귀무가설(null hypothesis) ‘각각의 종목에서 빨간색 유니폼을 입은 팀과 파란색 유니폼을 입은 팀의 승률은 50%로 같다’ vs 대립가설 (alternative hypothesis)‘각각의 종목에서 두팀의 승률은 다르고 그 확률이 50%도 아니다’ 를 테스트해보자
자유도 3에서 카이제곱 통계량은 0.3015를 갖고 p value 는 0.9597로 통계적으로 유의하지 않다.
따라서 붉은 색 유니폼을 입은 팀이 승리할 확률이 높다는 것은 사실이 아니라고 할 수 있다. 즉 연구팀은 단순 전체 승률을 비교한 것으로 볼 때 (1) 번의 테스트를 고려한 것이고 셀제로 이렇게 테스트를 해야한다.
이게 바로 통계의 미학이 아닐까 생각한다.
재미있는 이야기라서 정리해서 올려둔다.
'Data, Modeling, and Decisions' 카테고리의 다른 글
서로 다른 두 모집단의 평균 비교 –검정력(1-beta), 신뢰구간이 주어졌을때 표본크기(샘플사이즈) 결정 (0) | 2011.04.11 |
---|---|
임의화응답(Randomized Response) 설문조사 - 대답하기 곤난한 설문을 할때 사용하는 방법 (0) | 2011.04.10 |
상관계수를 그래프를 보고 알 수 있을까? - 데이타 마이닝 (2) | 2011.04.10 |
본페로니 검정법 (Bonfenoni Test)란 무엇인가? (0) | 2011.04.07 |
표본조사- 오차범위(margin of error 혹은 표본오차범위의 의미, 지지율의 신뢰구간과 샘플크기 결정문제 (0) | 2011.03.28 |