통계학을 배울때 반드시 경험하는  두변수의 독립성과 상관계수와의 관계가 있는데 아주 좋은 예가 있어서 소개를 한다. 
 

1. 두변수가 독립이면 반드시 상관계수는 0 이다.
2. 그렇지만 상관계수가 0이라고 해서 두 변수가 독립은 아니다.
    즉, 두 변수가 독립이 아니더라도 상관계수는 0이 될 수 있다.

이것은 반드시 기억을 해둬야 한다.
그리고 이런 것에 대한 좋은 예가 있어서 소개를 한다.
물론 쉽게는 서로 0을 기준으로 대칭(symmetric)이면서 경향을 보이는 변수는 상관계수는 0이지만 독립이 아니다.
가령 y= x^2 이 좋은 예일 것이다.

아래 이산형도 같은 아이디어에서 출발하여 만들었다.



위의 예에서 보듯이 상관계수는 0 이지만 독립은 아니다. 위에 설명과 다르게 설명한다면 다음과 같다.
두변수가 독립이라면 P(x=1,y=1) = P(x=1)* P(y=1)이 성립해야 하는데
P(x=1,y=1)= 1/3 이지만 
 P(x=1)* P(y=1)=(1/3)*(1/3 + 1/3)=2/9 이기 때문이다.

Posted by wishart
,