극단값 뜻 : 평균에서 한참 떨어진 값


표본이 적으면 극단값이 자주 나타난다. 그로 인해 모집단 평균을 제대로 추정하지 못한다.


반대로,


표본이 많으면 극단값이 덜 나타난다. 그로 인해서 모집단 평균을 제대로 추정하게 된다.


표본을 적게 뽑으면 극단값을 참값으로 속단하는 오류가 생긴다.



증명 :


nCr을 이용한다. 주사위를 가지고 6C2와 6C5의 차이를 본다.


6C2의 경우의 수는 15개 이다.

6C5의 경우의 수는 6개 이다.


6C2의 평균들 목록은 다음과 같다.


눈1 눈2 평균
1 2 1.5
1 3 2
1 4 2.5
1 5 3
1 6 3.5
2 3 2.5
2 4 3
2 5 3.5
2 6 4
3 4 3.5
3 5 4
3 6 4.5
4 5 4.5
4 6 5
5 6 5.5


이것의 극단값은 1.5와 5.5 이다.









눈1 눈2 눈3 눈4 눈5 평균
1 2 3 4 5 3
1 2 3 4 6 3.2
1 2 3 5 6 3.4
1 2 4 5 6 3.6
1 3 4 5 6 3.8
2 3 4 5 6 4



이것의 극단값은 3과 4이다



증명 끝





 오류를 기저율오류 라고 한다.


기저율은 특정 사건이 전체에서 차지하는 비율을 말한다.


기저율 오류에는 로또 명당을 찾아가는 것도 오류이다.


해당 판매점에서 판매가 많이 되었기 때문에 1등이 자주 나온 것인데


그런 기저율을 무시해서 로또 명당을 찾는 것이다.


차라리 거기까지 가는 교통비로 (다른 번호) 한 장을 더 사는 게 낫다.