확률변수의 평균

 

확률변수의 평균이란 흔히 알고 있는 평균과는 조금 다르다.  흔히 알고 있는 평균은 전체 원소의 합을 전체 원소의 개수로 나눈것 이다. 


(1)  수학적 평균

확률적 평균이란 확률변수 X 의 수학적 기대값 이라고 표현한다. 예를들어 두 개의 동전을 16번 던질 때 각 시행에서 나오는 앞면의 수를 확률변수 X 라고 하면, X가 취하게 되는 값은 0, 1, 2 이다.  0은 두개의 동전을 던졌을때 모두 뒷면이 나왔을 경우, 1은 하나의 동전에서만 앞면이 나왔을경우, 2는 두 개의 동전 모두 앞면이 나왔을때를 말한다. 16시행한 끝에 0의 경우가 총 4번 1의 경우가 7번, 2의 경우가 5번 나왔다고 했을때 앞면의 나오는 평균횟수는 

(2) 앞면이 나오는 평균 횟수

 다음과 같다. 이러한 앞면이 나오는 평균횟수를 확률변수 X의 평균 이라 말한다. 다시 설명하면 확률 변수 X 는 0, 1, 2 를 취할수 있으며, 각각 확률변수에 해당하는 확률 질량 함수f(x) 는 0 = 4/16, 1 = 7/16, 2 = 5/16 이다.  각각의 x에서 해당하는 f(x) 를 곱한후 다 더한 값을 확률에서의 평균이라고 한다.

(3) 이산형 확률변수 X의 평균



(4) 연속형 확률변수 X의 평균


1.06 이란 앞면이 나올 평균횟수는 시행이 16번이든 1000번 이든 같을 것이다. 모집단을 추정하기 위한 가장 기본이 바로 확률적 평균(혹은 기대값) 이다.  


예를 들어 주머니 안에 7개의 공이 들어 있는데 이중 4개는 빨간색 3개는 흰색이다. 3개의 공을 추출하였을때 빨간색이 나타날 평균을 구한다면 확률변수 X 는 추출된 공이 빨간색인 개수이다 x = 0, 1, 2, 3  X 의 확률분포는 다음과 같다.



따라서 f(0) = 1/35, f(1) = 12/35, f(2) = 18/35, f(3) = 4/35 의 확률분포를 가진다. 
빨간색공이 나타날 확률의 평균은 다음과 같다.





저작자 표시
신고


표본공간 - 통계적 실험에서 발생가능한 모든 결과들의 집합, S로 표시


예를 들어 주사위 두개를 던진다 가정하였을 경우, 주사위 두개로 나올수 있는 모든 경우의 수를 표본공간이라 부른다.



1/6 * 1/6 = 1/36


사상 -표본공간의 부분집합


표본 공간안에서 우리가 관심있는 부분은 특정 상태를 나타내는 event 일것이다. 만약 6을 뺀 나머지 숫자로 조합할수 있는 경우의 수가 특정 events라고 한다면 사상은 밑의 그림과 같다. 



저작자 표시
신고

표본분산(Sample variance)


관측된 표본의 산포를 측정하기 위한것임. 분산은 평균으로부터 편차제곱의 평균을 나타낸것. 다시 말해 모 집단의 평균값으로 부터 각 변수를 각각 빼준값에 제곱을 한후 n-1 로 나누면 표본분산을 구할수 있다. 제곱을 하는 이유는 각 평균의 차를 합하면 결국 값이 0 이 나오게 된다. 이를 방지하기 위해 각 평균의 차를 제곱하여 모든수를 양수로 만든후 합한다. 결국 표준편차를 구할때 루트를 씌우면 제곱과 함께 루트가 벗겨지므로 실제 편차를 구할수 있다??? 













표준편차(Standard deviation)


위의 식에 루트를 씌우면 표준편차임.... 하....Text Mining 을 위해서는 확률과 통계는 필수인거 같음 ㅠㅠ 아직은 초짜이지만...곧 화통, 미적, 마스터 해버리겠음....ㅡㅡ!!


저작자 표시
신고

티스토리 툴바