신뢰구간이란 모수가 속하는 구간을 말한다.


"모수가 속할 확률이 95%이다."는 주장이 틀렸다고 다들 알고 있다.


왜 틀렸냐고 하냐면 어떤 특정 구간에 모수가 있거나 없거나 하는 경우는 딱 두 가지 경우 밖에 없기 때문이다.


즉 95%가 아니고 반반인 50%이다.


그러므로 "모수가 속할 확률 95%"는 틀린 것이다 라고 주장한다.


그런데 "모수가 속할 확률 95%"는 사실 맞는 말이다.


왜 그런지 알아보자


첫째

구간추정 발상이 점추정의 보완이기 때문이다.

즉, 점추정의 범위를 넓힌 것이 구간추정이다.

당연히 범위를 넓혔으므로 확률이 높아지는 것은 당연하다.

신뢰구간이 모수의 유무인 50%라면 굳이 신뢰구간을 따로 사용할 필요가 없다.

그냥 점추정만 하고 그 값이 "모수이거나 아니거나" 라고 주장하기만 하면 된다.

따라서 범위를 넓혔으므로 "95% 확률로 모수가 존재"한다는 주장이 맞다.


둘째

실제 실험을 하면 95%확률이 맞게 나온다.

가령, 교수가 100명의 학생에게 자기 사는 곳의 중력가속도를 측정한 신뢰구간을 제출하라고 과제를 냈다고 하자.

학생 95명은 공인된 중력가속도 9.8m/s가 포함된 신뢰구간을 제출할 것이고 나머지 5명은 9.8이 미포함된 신뢰구간을 제출할 것이다.

이처럼 여러 건의 결과를 종합하면 95%의 확률로 모수가 포함된다는 표현이 틀린 표현이 아니게 된다.


한편, 위 중력가속도의 95% 포함 확률은 다음 이미지처럼 표현할 수 있다.

각 업체의 신뢰구간이 0값을 포함하는지를 유심히 보라

여론조사의 0값을 중력가속도 9.8이라고 했을 때

참값을 포함하지 않는 업체는 34개 중 단 2개 이다.

이는 34*0.05=1.7 거의 일치한다.


단 하나의 신뢰구간을 따지는 것이 신뢰구간이 아니다.

전체 여러 건의 신뢰구간을 따지는 것이 신뢰구간 개념이다.

이것이 신뢰구간의 진정한 의미이다.


결론적으로,

신뢰구간을 단 하나만 보면 모수 포함 확률이 50%이지만, 여러 개의 신뢰구간을 따져야 하므로 "모수가 포함될 확률은 95%"도 맞는 설명이다.




7cea8476b78161f03fe798bf06d60403262022296e52768db4