표본분산(Sample variance)


관측된 표본의 산포를 측정하기 위한것임. 분산은 평균으로부터 편차제곱의 평균을 나타낸것. 다시 말해 모 집단의 평균값으로 부터 각 변수를 각각 빼준값에 제곱을 한후 n-1 로 나누면 표본분산을 구할수 있다. 제곱을 하는 이유는 각 평균의 차를 합하면 결국 값이 0 이 나오게 된다. 이를 방지하기 위해 각 평균의 차를 제곱하여 모든수를 양수로 만든후 합한다. 결국 표준편차를 구할때 루트를 씌우면 제곱과 함께 루트가 벗겨지므로 실제 편차를 구할수 있다??? 













표준편차(Standard deviation)


위의 식에 루트를 씌우면 표준편차임.... 하....Text Mining 을 위해서는 확률과 통계는 필수인거 같음 ㅠㅠ 아직은 초짜이지만...곧 화통, 미적, 마스터 해버리겠음....ㅡㅡ!!


저작자 표시
신고