모수와 추정량

결국 모수를 구해야 한다. 모수를 추정해보자.

확률변수의 성질을 요약하는 척도들

​ 확률변수의 평균분산을 알면 모집단 분포의 대략적인 생김새를 유추할 수 있게 됩니다. 이처럼 모집단의 특성을 나타내는 값들을 모수(parameter) 라고 합니다. 우리는 늘 모집단이 어떠한지 궁금합니다.

​ 우리가 갖고 있는 것은 대부분 모집단으로부터 추출된 표본(sample) 입니다. 모집단으로부터 추출된 n개의 표본 x_1, x_2, x_3, ... x_n 을 이용해 표본평균표본 분산을 구할 수 있고, 이는 추정량(estimator) 이며 실제 값은 추정값(estimate) 라고 합니다.

​ 우리는 표본으로부터 계산된 표본평균과 표본분산이 모평균과 모분산과 가까울 것으로 기대합니다.

​ 하지만, 이는 기대할 수 있을 뿐 표본으로부터 계산된 추정량은 불확실성을 갖고 있습니다.

표본의 불확실성

​ 핵심은 같은 모집단에서 추출한 표본이라고 하더라도, 새로운 표본은 다른 추정값을 얻을 것이다. 따라서 개별 표본은 모집단을 잘 설명할 가능성과 함께 그렇지 못할 위험성이 같이 존재하며 이를 표본의 불확실성 이라고 부를 수 있다.

​ 실제로 모든 통계분석은 수집된 단 하나의 표본 을 이용한다는 점에서 항상 표본의 불확실성에 노출 되어 있다. (n의 크기의 상관없이 표본은 하나이다.)

​ 통계학의 이론에서는 추정값이 모집단의 모수와 얼마나 다른지에 대한 불확실성 혹은 오차를 과학적인 방법을 통해 표현해준다.

Last updated