스포츠에서 붉은색 유니폼을 입으 승리할 확률이 높아진다 말은 사실일까?

아래 전문은 2006 6 10일자 동아일보에 게제된 뉴스이다.

러셀 교수는 과학학술지네이처’ 5월호에붉은색 유니폼을 입으면 승리할 확률이 훨씬 높아진다 발표해 논란에 쐐기를 박았다.

실력 비슷하면 붉은색 유니폼 승률 60%


연구팀은 2004 아테네 올림픽 경기 권투, 태권도, 레슬링 그레코로만형과 자유형 4 격투기 종목을 분석했다. 경기자들은 파란색과 붉은색 유니폼 하나를 입는다. 연구 결과 붉은색 유니폼을 입은 선수의 승률이 55% 절반을 넘었다. 붉은색의 승률이 가장 높은 종목은 태권도였다. 러셀 박사는경기자의 실력이 서로 비슷하면 붉은색 유니폼의 승률은 60% 올라간다 말했다.

연구팀은 유럽축구대회인 유로2004 참가한 각국 대표팀의 승률도 함께 조사했다. 이들은 두어 가지 다른 색의 유니폼을 번갈아 입는데 붉은색 유니폼을 입었을 승률이 높아지는 것은 물론 골도 많이 넣었다.
....

그리고 이후로도 언론에서는 연구를 거듭  언급하면서  붉은 유니폼을 입으면 이길 확률이 높아진다는 것을 기정사실화 하였다.  그렇지만 연구는 통계적으로 못된 것으로 드러났는데 분석을 해보고자 한다. 아래 표는 Hill and Barton(2005) 의해서 수집된 데이타이다. 각각의 문제를 따라 가면서 분석을 해보자.

종목

Blue 유니폼

Red 유니폼

합계

권투(B)

120

148

268

레슬링 그레코로만형(GW)

24

27

51

레슬링 자유형(FW)

23

25

48

태권도(TaeKwon)

35

45

80

합계

202

245

447

%

45.19%

54.81%

100%

 

1.       먼저 귀무가설(null hypothesis) ‘각각의 종목에서 빨간색 유니폼을 입은 팀과 파란색 유니폼을 입은 팀의 승률은 50% 같다’ vs  대립가설 각각의 종목에서 두팀의 승률은 같지만 50% 아니다 테스트해보자.

우도함수(Likelihood ratio)  

여기서 우리는 붉은색 유니폼 팀이 이긴 횟수, 파란색 유니폼을 이긴 횟수, N 전체 승리한 횟수,     추정될 있다.

따라서 이때 피어슨 카이 검정 통계량(Pearson's Chi-square statistics) 다음과 같이 계산된다.

이때 자유도 1 카이검정통계량의 p_value 0.04로이다. 결과에 따르면 통계적으로  각각의 종목에서 두팀의 승률은 같지만 50% 아니라는 것을 있다. , 연국팀이 전체적으로 붉은 유니폼을 입은 팀이 승리할 확률이 55% 높다고 이야기하는 것은 가설을 테스트한 것이라고 있다.

따러서 가설에 의한 검정결과로 붉은색 유니폼을 입은 팀이 스포츠에서 이길 확률이 높다는 것은 논리적으로 맞는 말이 아니다.

이것을 제대로 테스트를 하려면 다음( 2) 같은 가설을 세워야 한다.

2.      먼저 귀무가설(null hypothesis) ‘각각의 종목에서 빨간색 유니폼을 입은 팀과 파란색 유니폼을 입은 팀의 승률은 50% 같다’ vs  대립가설 (alternative hypothesis)‘각각의 종목에서 두팀의 승률은 다르고 확률이 50% 아니다 테스트해보자

자유도 3에서 카이제곱 통계량은 0.3015 갖고 p value 0.9597 통계적으로 유의하지 않다.

따라서 붉은 유니폼을 입은 팀이 승리할 확률이 높다는 것은 사실이 아니라고 있다. 연구팀은 단순 전체 승률을 비교한 것으로 (1) 번의 테스트를 고려한 것이고 셀제로 이렇게 테스트를 해야한다.

이게 바로 통계의 미학이 아닐까 생각한다.

재미있는 이야기라서 정리해서 올려둔다.


Posted by wishart
,

맥니마 검정은 개의 변수가 paired 되어 있을때 사용할 있는 테스트로 우리가 흔히 접하는 카이스퀘어의 독립성검정이나 적합성 검정법과는 다르다. 검정법은 의학통계나 사회과학에서 많이 사용되고 있다.

우리가 흔히 범할 있는 오류로 변수가 합께 쌍을 이루고(독립이 아니다) 있음에도 불구하고 일반적인 카이스궤어 검정을 하면 통계적으로 매우 유의하게 나올 있는 상황에서도 유의하지 않다고 나오는 경우가 많다.  따라서 데이타의 성질을 제대로 파악하고 통계방법론을 적용해야 한다.

아래 테이블은 2개의 paired변수가 다음과 같이 있을때 실제 테스트 하고자 하려는 목적은 이들의 독립성이 아니라 확률 (0,1) (1,0)의 확률값이 같은지를 테스트를 하고자 한다.

Yi = 0

Yi = 1


Xi = 0

a

b

Xi = 1

c

d


맥니마 검정(McNemar test) 다음과 같은 가정을 한다.

1.     (Xi,Yi) 는 상호 독립이다.

2.    각각의 Xi  Yi 는 두개의 가능한 결과를 갖는다. 0 아니면 1의 카테고리 값을 갖는다.

3.    차이값= P(Xi = 0, Yi = 1) - P(Xi = 1, Yi = 0) 귀무가설에서 0 놓고 테스트 하는 것이 결국은 어떤 실험전후의 테스트 혹은 기존의 방법과 새로운 방법론 사이에 대한 차이값이 있는지 없는지를 테스트 하는 결과가 된다.

 

여기서 P1 = P(Xi = 0, Yi = 1) , P2 = P(Xi = 1, Yi = 0) 이라고 한다면 맥니마 검정은 다음과 같이 놓을 수 있다.

H0:

P1 = P2       for all i

Ha:

P1 ≠ P2       for all i

Test Statistic:

If b + c > 20,

T1 = (b - c)2/(b + c)

If b + c ≤ 20,

T2 = b

수정된 검정통계량T1:

T1' = (|b - c| - 1)2/(b + c)

Significance Level:

Critical Region:

T1 >

그렇다면 실제 데이타를 분석함으로써 이것이 일반적인 카이스퀘어 검정과 어떻게 다른지 완벽하게 이해를 해보도록 하자.

예제 1> 아래와 같이 유세 전후 정당의 지지도의 변화율을 알아보고자 한다. 이때 조사한 사람들은 결국 유세전후 같은 사람들을 대상으로 조사를 해야한다. 그래야 아래와 같은 표를 얻고 우리가 테스트 하려고 하는 가설은 다음과 같다.

 

유세후

 

 

유세전

A 정당

B 정당

A 정당

40(p11)

20(p12)

60(P1.)

B 정당

10(p21)

30(22)

40

50(P.1)

50(P.2)

100

 

H0: 유세전 A정당의 지지도는 유세후 B 정당의 지지도와 같다. 이것은 유세전 B정당의 지지도는 유세후 B정당의 지지도와 같다.

이것을 수식으로 나타내면

p11+p12=p11+p21---(1)

P21+p22=p12+p22---(2)

(1), (2) 방정식을 풀면 결국 p12=p21 된다. 따라서 가설을 다음과 같이 있다.

H0: p12=p21

이것은 결국 지지율에 변화가 생긴사람들( A->B, 혹은 B->A ) 변화율이 차이가 많으냐 아니냐를 테스트 하는 의미가 된다. 그리고 이때 검정 통계량은 다음과 같다.

X^2=[n12-(n12+n21)/2]^2/[(n12+n21)/2]+[n21-(n12+n21)/2]^2/[(n12+n21)/2]

      =(n12-n21)^2/(n12+n21)

따라서 가설을 검정하면 다음과 같은 결과를 얻는다.

X^2=(20-10)^2/30=3.333 < X^2 ,0.05 = 3.84

유세전후 지지율 차이는 없다고 있다.

예제2> Vianna, Greenwald, and Davies(1971) Hodgkin's 질병을 앓고 있는 환자들을 조사하였다. 그리고  Tosillectomy 면역력을 떨어뜨려Hodgkin's 질병을 유발한다는 것을 밝혀내려고 아래와 같은 데이타를 조사하였다.  그리고 이들은 카이제곱검정을 통하여 Chi-square statistics = 14.26 으로 확실히 유의하다는 결론을 얻었다.

 

Tosillectomy 유무

 

 

 

Tosillectomy

No Tonsillectomy

Hodgkin's

67

34

101

Control

43

64

107

110

98

208

 

그리고 Johnson and Johnson (1972) 85명의Hodgkin's 질병을 앓은 환자의 5살 차이이내의 성별이 같은 형제들을 조사여 다음과 같은 결과를 얻었다.

 

Tosillectomy 유무

 

 

 

Tosillectomy

No Tonsillectomy

Hodgkin's

41

44

85

Control

33

52

85

74

96

170

그리고 이들은 Chi-statistics=1.53 얻어Hodgkin'sTosillectomy와 아무런 관련이 없다는 결론을 얻었다. 그러나 얼마후 많은 사람들이 문제를 제기하였다. 왜냐하면 형제와 환자간은 독립이 아니기 때문에 이렇게 분석을 하면 안된다는 것이 었다.

그리고 이들은 위에서 설명한 맥니마 검정법을 제시하였다.

 

Sibling

 

 

Patient

Tosillectomy

No Tonsillectomy

Hodgkin's

37

7

44

Control

15

26

41

52

33

85

 

이것은 X^2 = 2.91 P_value=0.09 Johnson and Johnson 결과에 상당한 의문을 갖게 하는 결론을 얻었다.

이렇게 맥니마 검정에 대한 설명을 마침니다.

Posted by wishart
,