통계학을 공부할때 가끔 필요한 것이 샘플링이다.
샘플링은 샘플수에 따른 비용을 고려하여 여러가지 방법이 있는데 이런 복잡한 샘플링 방법을 명령어 몇 줄이면 SAS에서 가능하다. 여기서는 간단히 복원과 비복원 심플랜덤샘플링을 하는 법만 설명해둔다. 이것을 알면 혹시 북스트래핑할 때 아주 유용하게 이것을 이용할 수 있다. 프로그램밍이 시간이 많이 들어가니 기억해 두자.

1. 비복원  단순 랜덤 새플링 (Simple ramdom sampling without replacement )

method=srs 이라고 하면 method 옵션을 srs라고 준 것으로 비복원 심플랜덤샘플링을 하라고 하는 명령이다. 아래 명령어는 데이타 셋 Customers로 부터 100개의 샘플을 비복원으로 뽑아서 SampleSRS 에 저장하라는 말이 된다.

proc surveyselect data=Customers method=srs n=100 out=SampleSRS;
run;

2. 복원 단순 랜덤 샘플링  (Simple ramdom sampling witht replacement )

위의 명령어에서  method옵션을 urs ( unspecified random sampling)이라고 주면 간단히 복원랜덤추출법이 된다. 설명은 위와 같다.

proc surveyselect data=Customers method=urs n=100 out=SampleSRS;
run;

3. 층화추출 샘플링(Stratified Random Sampling)

층화추출을 층(stratum)간 분산은 크고(heterogeneous), 층(stratum)내 분산은 작을때(homogeneous)할때 사용하는 샘플링방법입니다. 이런 층화추출 샘플링을 사용하기 위해서는 반드시SAS에서는 starata에 대해서 sorting를 먼저하고 명령어를 사용해야 합니다.  아래 예제 프로그램은 state 와 type 변수에 따른 층화추출방법입니다.

   proc sort data=Customers;
      by State Type;
   run;

   proc surveyselect data=Customers method=srs n=15
         out=SampleStrata;
      strata State Type;
   run;

그리고  SAS에서는  좀더 고급의 샘플링 방법도 처리가 가능합니다.

• Proportional Allocation - 각각의 stratum(층)의 전체 모집단의 비율에 따라 각 stratum에 샘플수를 할당하는 방법

• Optimal Allocation- stratum sizes, stratum variances, stratum costs 을 고려한 샘플링

• Neyman Allocation - stratum sizes과 stratum variances 를 고려한 샘플링

따라서 옵션에 위에 필요한 변수들을 할당할 것을 SAS에서는 요구합니다.

자세한 것은 아래 링크를 참조하세요.
http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_surveyselect_sect011.htm

Posted by wishart
,

 
전체적으로 괜찮은 친구였다. 젊은 시절 스탠포드에서 공부할 시절 법대 다니는 와이프랑 번갈라 바쁘게 아기를 돌보며 살았다고 하면서 성공하기 위해서는 치열하게 사는 것을 당연시 생각하는 듯한 느낌이었다.
그러니깐 지금 이베이에 대표가 되지 않았나 하는 생각이 들었다.

 


존 도나호는 최근 비지니스의 키드렌드를 4가지로 요약하였다.
누구나 알 수 있는 것이지만 존도나호의 어조는 누구보다도 명쾌했다고 할까?

1. 모바일
2. 로컬
3. 소셜
4. 디지털 소비 - 아이패드, TV

이런 비지니스 트렌드는 분명히 유저의 행태를 바꿀 것이라는 것이 그의 생각이다.

그는 기업이 끊이 없이 혁신하지 않으면 역사속으로 사라질 것이라고 하면서 넷스케이프와 야후가 그랬고 이베이와 페이팔도 그런 경우가 될 수도 있고 구글도 요즘은 페이스에 밀리고 있는 것을 이야기 하면서 앞으로 3년후는 어떻게 바뀔지 아무도 모른다고 했다.
따라서 혁신을 해야 하는데 혁신은 다음의 3가지로 나눠볼 수 있다고 하였다.

1. 핵심사업의 혁신(Core Innovation) - 말그대로 현재 핵심비지니스의 혁신을 말한다.  그런데 새로운 고객은 변화를 원하지만 현재 고객은 익숙한 환경의 변화를 싫어한다. 따라서  현재 고객의 니즈에 맞추려고 하는 기업은 자연스럽게 혁신적인 변화를 피하게 되고 이게 바로 많은 성공한 회사가 혁신을 하기가 어려운 이유이다.  그는 이런 혁신을 "Least sexy stuff but most important" 라고 하였다.

2. 제이슨 이노베이션 (Social Innovation) - 모바일 커머스와 모바일 페이먼트 같은 것이 좋은 예가 될 것인데 이게 가장  쉬운 혁신이다. 왜냐면 기존의 사업의 인터페이스를 확장하는 것이기 때문이다. 급속히 이베이의 모바일 매출이 성장하고 있음을 언급하였다. 그런데 왜 이베이는 그루폰을 못만들었을까 의문이 드는 대목이 여기서였다.

3. 파괴적인 이노베이션(Distruptive Innovation) - 이것은 구글, 이베이, 페이팔, 페이스북 같은 회사가 거쳐왔던 혁신으로 성공확률로 이야기 하면  1/1000이라고 했고 큰 회사 입장에서는 인수합병을 통해서 즉 오픈 이노베이션을 통해서 주로 자기들은 한다고 이야길 하였다.  그래서 마일로를 인수했다고 하였다.

마지막으로 그는 페이팔이 앞으로 이베이의 매출을 뛰어 넘을 것이라는 것을 암시하였다.


그와의 CNBC와의 인터뷰를 보고 싶다면
http://www.cnbc.com/id/15840232?video=1314093048

Posted by wishart
,