통계적으로 두 변수의 독립(independence)과 상관계수(correlation)와의 관계
Data, Modeling, and Decisions 2011. 3. 21. 09:16통계학을 배울때 반드시 경험하는 두변수의 독립성과 상관계수와의 관계가 있는데 아주 좋은 예가 있어서 소개를 한다.
1. 두변수가 독립이면 반드시 상관계수는 0 이다.
2. 그렇지만 상관계수가 0이라고 해서 두 변수가 독립은 아니다.
즉, 두 변수가 독립이 아니더라도 상관계수는 0이 될 수 있다.
이것은 반드시 기억을 해둬야 한다.
그리고 이런 것에 대한 좋은 예가 있어서 소개를 한다.
물론 쉽게는 서로 0을 기준으로 대칭(symmetric)이면서 경향을 보이는 변수는 상관계수는 0이지만 독립이 아니다.
가령 y= x^2 이 좋은 예일 것이다.
아래 이산형도 같은 아이디어에서 출발하여 만들었다.
위의 예에서 보듯이 상관계수는 0 이지만 독립은 아니다. 위에 설명과 다르게 설명한다면 다음과 같다.
두변수가 독립이라면 P(x=1,y=1) = P(x=1)* P(y=1)이 성립해야 하는데
P(x=1,y=1)= 1/3 이지만 P(x=1)* P(y=1)=(1/3)*(1/3 + 1/3)=2/9 이기 때문이다.
1. 두변수가 독립이면 반드시 상관계수는 0 이다.
2. 그렇지만 상관계수가 0이라고 해서 두 변수가 독립은 아니다.
즉, 두 변수가 독립이 아니더라도 상관계수는 0이 될 수 있다.
이것은 반드시 기억을 해둬야 한다.
그리고 이런 것에 대한 좋은 예가 있어서 소개를 한다.
물론 쉽게는 서로 0을 기준으로 대칭(symmetric)이면서 경향을 보이는 변수는 상관계수는 0이지만 독립이 아니다.
가령 y= x^2 이 좋은 예일 것이다.
아래 이산형도 같은 아이디어에서 출발하여 만들었다.
위의 예에서 보듯이 상관계수는 0 이지만 독립은 아니다. 위에 설명과 다르게 설명한다면 다음과 같다.
두변수가 독립이라면 P(x=1,y=1) = P(x=1)* P(y=1)이 성립해야 하는데
P(x=1,y=1)= 1/3 이지만 P(x=1)* P(y=1)=(1/3)*(1/3 + 1/3)=2/9 이기 때문이다.
'Data, Modeling, and Decisions' 카테고리의 다른 글
SAS를 활용한 샘플링(sampling) - 비복원추출, 복원추출 그리고 층화추출 (0) | 2011.03.25 |
---|---|
통계 피터스버그 역설 (Petersburg Paradox) - 한심한 갬블러(기대값이 무한대) (0) | 2011.03.23 |
SAS/SQL/Macro/DO을 이용한 두집단 평균비교 Permutation test for Means (0) | 2011.03.11 |
피셔의 정확도 검정(Fisher's Exact Probability Test) (0) | 2011.02.25 |
범주형 자료 분석 : 왜 오즈비(odds ratio) vs 상대 위험도(relative risk) 를 만들었을까 (0) | 2011.02.17 |