맥니마 검정은 개의 변수가 paired 되어 있을때 사용할 있는 테스트로 우리가 흔히 접하는 카이스퀘어의 독립성검정이나 적합성 검정법과는 다르다. 검정법은 의학통계나 사회과학에서 많이 사용되고 있다.

우리가 흔히 범할 있는 오류로 변수가 합께 쌍을 이루고(독립이 아니다) 있음에도 불구하고 일반적인 카이스궤어 검정을 하면 통계적으로 매우 유의하게 나올 있는 상황에서도 유의하지 않다고 나오는 경우가 많다.  따라서 데이타의 성질을 제대로 파악하고 통계방법론을 적용해야 한다.

아래 테이블은 2개의 paired변수가 다음과 같이 있을때 실제 테스트 하고자 하려는 목적은 이들의 독립성이 아니라 확률 (0,1) (1,0)의 확률값이 같은지를 테스트를 하고자 한다.

Yi = 0

Yi = 1


Xi = 0

a

b

Xi = 1

c

d


맥니마 검정(McNemar test) 다음과 같은 가정을 한다.

1.     (Xi,Yi) 는 상호 독립이다.

2.    각각의 Xi  Yi 는 두개의 가능한 결과를 갖는다. 0 아니면 1의 카테고리 값을 갖는다.

3.    차이값= P(Xi = 0, Yi = 1) - P(Xi = 1, Yi = 0) 귀무가설에서 0 놓고 테스트 하는 것이 결국은 어떤 실험전후의 테스트 혹은 기존의 방법과 새로운 방법론 사이에 대한 차이값이 있는지 없는지를 테스트 하는 결과가 된다.

 

여기서 P1 = P(Xi = 0, Yi = 1) , P2 = P(Xi = 1, Yi = 0) 이라고 한다면 맥니마 검정은 다음과 같이 놓을 수 있다.

H0:

P1 = P2       for all i

Ha:

P1 ≠ P2       for all i

Test Statistic:

If b + c > 20,

T1 = (b - c)2/(b + c)

If b + c ≤ 20,

T2 = b

수정된 검정통계량T1:

T1' = (|b - c| - 1)2/(b + c)

Significance Level:

Critical Region:

T1 >

그렇다면 실제 데이타를 분석함으로써 이것이 일반적인 카이스퀘어 검정과 어떻게 다른지 완벽하게 이해를 해보도록 하자.

예제 1> 아래와 같이 유세 전후 정당의 지지도의 변화율을 알아보고자 한다. 이때 조사한 사람들은 결국 유세전후 같은 사람들을 대상으로 조사를 해야한다. 그래야 아래와 같은 표를 얻고 우리가 테스트 하려고 하는 가설은 다음과 같다.

 

유세후

 

 

유세전

A 정당

B 정당

A 정당

40(p11)

20(p12)

60(P1.)

B 정당

10(p21)

30(22)

40

50(P.1)

50(P.2)

100

 

H0: 유세전 A정당의 지지도는 유세후 B 정당의 지지도와 같다. 이것은 유세전 B정당의 지지도는 유세후 B정당의 지지도와 같다.

이것을 수식으로 나타내면

p11+p12=p11+p21---(1)

P21+p22=p12+p22---(2)

(1), (2) 방정식을 풀면 결국 p12=p21 된다. 따라서 가설을 다음과 같이 있다.

H0: p12=p21

이것은 결국 지지율에 변화가 생긴사람들( A->B, 혹은 B->A ) 변화율이 차이가 많으냐 아니냐를 테스트 하는 의미가 된다. 그리고 이때 검정 통계량은 다음과 같다.

X^2=[n12-(n12+n21)/2]^2/[(n12+n21)/2]+[n21-(n12+n21)/2]^2/[(n12+n21)/2]

      =(n12-n21)^2/(n12+n21)

따라서 가설을 검정하면 다음과 같은 결과를 얻는다.

X^2=(20-10)^2/30=3.333 < X^2 ,0.05 = 3.84

유세전후 지지율 차이는 없다고 있다.

예제2> Vianna, Greenwald, and Davies(1971) Hodgkin's 질병을 앓고 있는 환자들을 조사하였다. 그리고  Tosillectomy 면역력을 떨어뜨려Hodgkin's 질병을 유발한다는 것을 밝혀내려고 아래와 같은 데이타를 조사하였다.  그리고 이들은 카이제곱검정을 통하여 Chi-square statistics = 14.26 으로 확실히 유의하다는 결론을 얻었다.

 

Tosillectomy 유무

 

 

 

Tosillectomy

No Tonsillectomy

Hodgkin's

67

34

101

Control

43

64

107

110

98

208

 

그리고 Johnson and Johnson (1972) 85명의Hodgkin's 질병을 앓은 환자의 5살 차이이내의 성별이 같은 형제들을 조사여 다음과 같은 결과를 얻었다.

 

Tosillectomy 유무

 

 

 

Tosillectomy

No Tonsillectomy

Hodgkin's

41

44

85

Control

33

52

85

74

96

170

그리고 이들은 Chi-statistics=1.53 얻어Hodgkin'sTosillectomy와 아무런 관련이 없다는 결론을 얻었다. 그러나 얼마후 많은 사람들이 문제를 제기하였다. 왜냐하면 형제와 환자간은 독립이 아니기 때문에 이렇게 분석을 하면 안된다는 것이 었다.

그리고 이들은 위에서 설명한 맥니마 검정법을 제시하였다.

 

Sibling

 

 

Patient

Tosillectomy

No Tonsillectomy

Hodgkin's

37

7

44

Control

15

26

41

52

33

85

 

이것은 X^2 = 2.91 P_value=0.09 Johnson and Johnson 결과에 상당한 의문을 갖게 하는 결론을 얻었다.

이렇게 맥니마 검정에 대한 설명을 마침니다.

Posted by wishart
,

의학통계에서 가장 많이 사용하는 통계분석방법론은 법주형자료(categorical data)일 것이다.

이 부분을 공부하면서 가장 처음 만나게 되는 것이 오즈(odds), 오즈비(odds ratio), 상대위험도(relative risk(chance))와 같은 용어이다.  그런데 이런 용어들은 자주 나오지만 왜 이런 개념이 나오게 되었고 왜 사용하는지 정확히 알고 있는 사람은 별로 없다.

이것을 설명하기 위해서 다음과 같은 예를 들어보자. 가령 당신은 오늘의 운을 테스트 하기 위해서 Bassassinator를 사용한 경우와 어떤 미끼도 사용하지 않을 경우에 대해서 각각 100번씩 시도를 하여 낚은 물고기를 횟수를 다음과 같이 기록하였다. 즉 여기서는 당신이 몇번 던졌는지 정확히 알 수 있고 이것은 통계적으로  모집단의 수와 일치한다.

  # of times caught # of times not caught Total # of casts
Bassassinator 50 50 100
No bait 2 98 100

1. 오즈(odds)

  당신이 물고기를 잡을 확률(P) / 물고기를 한 마리도 잡지 못할 확률 (1-P) 으로 물고기를 잡을 확률이 물고기 잡지 못할 확률에 몇 배가 되는 가의 값이 된다. 아래 결과에서 보듯이 Bassassinator을 사용했을때 물고기를 잡을 확률은 잡지 못할 확률에 1배이므로 같다고 할수 있다. 그렇지만 No bait를 한 경우는  물고기를 잡을 확률이 훨씬 작아진다.

   Bassaddinator 오즈 (odds) = a/b=50/50 = 1

   No bait의 오즈 (odds)= c/d=2/98 = 0.0204

2. 오즈비(odds ratio)

오즈비는 위에서 구한 오즈의 비율이다. 아래에서 보듯이 당신이 Bassassinator를 사용한 경우 물고기를 잡을 확률비는 no bait를 사용한 경우의 물고기를 잡을 확률비 대비 50배가 높다고 할 수 있다.

   Bassassinator vs. no bait 의 오즈비 =1.0/0.02 = 50.

3. 상대위험도(relative risk(chance))

 당신이 Bassassinator를 사용하고 물고기를 잡을 확률 = a/(a+b)= 50/100 = 0.50

 당신이  no bait의 경우  물고기를 잡을 확률 = c/(c+d)= 2/100 = 0.02

상대 위험도 ( relative risk ) =

 Bassassinator를 사용하고 물고기를 잡을 확률 /no bait의 경우  물고기를 잡을 확률  =  0.5/0.02 = 25

위에서 보듯 누구에게나 직관적이고 쉬운 개념은 상대위험도이다. 위의 경우 해석을 한다면 당신이 Bassassinator을 사용한 경우에 물고기를 잡을 확률이 25배가 높다고 할 수 있다. 너무나 간단하게 해석이 된다. 그렇다면 왜 오즈비를 사용하는 것일까?

여기서 이런 의문이 생길 수 밖에 없다.  이 답은 다음과 같다.

거의 모든 연구는 실제로 처리(treatment)그룹과 대조(control)그룹의 모집단수를 알 수  없다. 왜냐하면 연구자가 할 수 있는 것은 샘플수를 조정할 수 있을 뿐이다. 가령 위의 예를 다음과 같이 바꿔보자.

아래의 표는 물고기를 잡은 100명의 낚시꾼을 조사한 결과 이들중 40명이 Bassassinator를 사용하였다. 그리고 100명의 물고기를 한마리도 잡지 못한 낚시꾼을 조사한 결과 단지 이들중 20명이 Bassassinator를 사용한 것으로 조사되었다. 즉 전체 물고기를 잡은 사람수를 구할 수 있는 방법은 없다.  즉, 연구자는 각각의 모집단의 수를 알 수 없다.

  Bassassinator use No Bassassinator Total # 
Caught fish 40 60 100
Caught nothing 20 80 100

그래서 이때 모집단을 알 수 없기 때문에 대신 오즈비를 사용하게 된다.

오즈 (Bassassinator를 사용하고 물고기를 잡을 확률/ 잡지 못할 확률) =  40/60 = 0.67

오즈 (No Bassassinator 경우  물고기를 잡을 확률/ 잡지 못할 확률) =  20/80 = 0.25

 따라서,

성공적(물고기를 낚은)인 낚시꾼이 Bassassinator 를 사용하는 비율과 실패한(물고기를 낚지 못한 ) 낚시꾼의

오즈비(Odds ratio) =  0.67/0.25 = 2.7

이것은 물고기를 잡은 낚시꾼들은 물고기를 낚지 못한 낚시꾼들에 대비해서 Bassassinator를 2.7배 더 사용하는 경향이 있다라고 해석을 해야한다.

 흔히 범하는 실수는 Bassassinator를 사용하는 낚시꾼들은 물고기를 낚을 확률이 2배가 높다라고 해석하는 경우가 있는데 이것은 잘 못된 해석이다.


Posted by wishart
,