모수와 추정량
결국 모수를 구해야 한다. 모수를 추정해보자.
확률변수의 성질을 요약하는 척도들
확률변수의 평균과 분산을 알면 모집단 분포의 대략적인 생김새를 유추할 수 있게 됩니다. 이처럼 모집단의 특성을 나타내는 값들을 모수(parameter) 라고 합니다. 우리는 늘 모집단이 어떠한지 궁금합니다.
우리가 갖고 있는 것은 대부분 모집단으로부터 추출된 표본(sample) 입니다. 모집단으로부터 추출된 n개의 표본 x_1, x_2, x_3, ... x_n 을 이용해 표본평균과 표본 분산을 구할 수 있고, 이는 추정량(estimator) 이며 실제 값은 추정값(estimate) 라고 합니다.
우리는 표본으로부터 계산된 표본평균과 표본분산이 모평균과 모분산과 가까울 것으로 기대합니다.
하지만, 이는 기대할 수 있을 뿐 표본으로부터 계산된 추정량은 불확실성을 갖고 있습니다.
표본의 불확실성
핵심은 같은 모집단에서 추출한 표본이라고 하더라도, 새로운 표본은 다른 추정값을 얻을 것이다. 따라서 개별 표본은 모집단을 잘 설명할 가능성과 함께 그렇지 못할 위험성이 같이 존재하며 이를 표본의 불확실성 이라고 부를 수 있다.
실제로 모든 통계분석은 수집된 단 하나의 표본 을 이용한다는 점에서 항상 표본의 불확실성에 노출 되어 있다. (n의 크기의 상관없이 표본은 하나이다.)
통계학의 이론에서는 추정값이 모집단의 모수와 얼마나 다른지에 대한 불확실성 혹은 오차를 과학적인 방법을 통해 표현해준다.
Last updated
Was this helpful?