표본標本 이란 "근본"의 "겉"이라는 말이다.
근본은 데이터던 사물의 공식이던 우리가 알고자 하는 "참값"이다.
다시말해, 표본이란 참값의 겉값이다.
왜 참값을 직접 다루지 않고 겉값을 다루나?
그것은 참값은 켤고 알수도 없고 있는지 조차도 모르기 때문이다.
가령, 인간의 뇌속에 콩알만한 어떤 부분이 있어서 그 부분을 전자기로 알아 낼 수 있다고 치자.
그리고 내 앞에 방화 용의자가 있다고 치자.
뇌속에 콩알 같은 게 있다면 굳이 고문을 하거나 책상을 탕탕치면서 물어 볼 필요가 없다.
그 콩알만 딱 떼어서 블랙박스 풀듯이 보면 되기 때문이다.
안타깝게도 우리의 뇌 속에는 블랙박스가 없다.
그래서 용의자가 하는 말을 듣고 판단을 할 수 밖에 없다.
용의자의 말이 상식이나 자연법칙에 어긋나지 않으면 용의자가 말하는 알리바이(현장부재증명)는 "참"으로 간주가 된다.
반대로 용의자의 주장이 상식이나 자연법칙에 맞지 않으면 용의자는 범인으로 몰릴 가능성이 높아진다.
(가능성만 높은 것이지 100% 범인인지 아닌지는 아직 모른다)
표본조사도 참값을 알 수 없기에 하는 것이다.
참값을 알아내는 노벨상급 발명이 나오거나 블박같은 기능이 있다면 굳이 표본조사를 할 필요가 없다.
또한, 참값을 바로 알아내는 방법이 노벨상을 받게되면 통계학만 무너지는 것이 아니라 세상 모든 학문이 무너지게 된다.
학문이란 참값을 모르니까 참값을 추정하는 과정인데 참값을 다 아는데 조사할 이유가 없어지기 때문이다.
참값에 가까운 것을 얻어내는 길 외에는 뾰족한 수가 없다.
댓글 0