통계공부를 수학부터 하지 말아야 하는 EU


1. 사람이 지침 - 미적분학, 선형대수, 집합론, 정수론 이게 떼고 통계학 진입하면 그 때는 진이 다 빠지고 시간도 오래 걸려서 정작 통계의 목적을 상실함.

통계학은, 과거자료를 어떤 기막힌 방법(회귀분석, 분산분석 등등)으로 분석해서 주장하고자 하는 가설(내일 비가 올 것이다 등등)의 확률을 구한 다음 확률의 크기(0%, 25%, 50%, 75%, 95% 등등)에 따라 가설을 얼마나(가능성없음, 반반, 약간있음, 확실함 등등) 명제로 바꿀 것인가만 결정하는 학문임

알고보면 별거 없음


2. 수리통계학, SPSS, SAS를 먼저 시작 권장

수리통계학은 수학이 아님

일종의 통계학의 헌법전문 같은 역활을 하는 거임


SPSS와 SAS를 통알못한테도 먼저 접하라고 권하는 이유는

두 프로그램은 메뉴방식이라 메뉴만 봐도 통계 전체를 볼 수 있기 때문임

각 통계 기법(회귀분석, 분산분석, T테스트 등등)에 대해 집중적으로 들어가게 되면 초심자는 전체 숲을 못 봄


SPSS나 SAS는 학습자가 이해하던 못 하던 그건 상관없음

요지는 통계학의 범위가 얼마인지 가늠만 할 수 있으면 됌


3. R,퐈이선 같은 명령형 도구는 통계 공부 다 끝난 다음에 본격적으로 해도 늦지 않음

R, 퐈이선의 장점은 각각의 패키지가 하나의 거대 프로그램일 정도로 잘 만들어진 것인데

단점은 내부 계산을 알 수 없다는 점이라서 이 점은 초보가 원리 익히기에는 불리한 도구임


4. 엑셀을 권장, 엑셀은 표계산이라 표 안에 즉, 셀 안에 계산식이 바로 보여서 학습과 분석이 동시 가능


5. 통계학에서 제일 중요한 것은 계산법(회귀식, 분산분석, F검정 등등)이 아니라 측정(표본조사, 여론조사, 실험, 메타조사)임

계산은 사람이 하는게 아니라 컴이 하는 거임

사람은 엔터만 누르는 거임

그래서 결과가 뭔가 상식과 안 맞거나 하면 다시 다른 방법을 쓰면 됌


그런데 측정은 한번 잘못되면 슈퍼울트라캡송따봉노벨아인슈타인급 기법을 가져다 붙여도

결과가 잘못 나옴

문제는 그 잘못을 알아채기가 쉽지도 않고 알아챘어도 측정이란 걸 다시 하는데는 물리적 시간적 손실이 따르게 됨


뭔가를 측정할 때 그게 숫자로 측정되던 숫자가 아닌 것으로 측정되던(숫자가 아닌 측정값을 명목변수라고 함) 어떤 개념을 제대로 측정했느냐가 관건


측정을 제대로 하지 못 하면 결과가 무의미


가령, 인간의 사랑, 애정, 호감 같은 감정을 측정하는데 머리 속에 전극을 심을 수는 없는 노릇

행동으로 측정할 수 밖에 없는데

문자 주고 받는 빈도

두 눈을 마주치는 지속시간

동공의 크기

등이 있는데 이 때 엉뚱하게 주먹으로 상대를 치는 행동의 빈도를 측정한다면

결과는 어떻게 될 지 뻔함


또한, 통계기법 외에 다른 과목들에 대한 상식도 있어야 함


6. 통계학자가 쓴 통계학개론, 사회과학 쪽 통계학개론 등등 개론부터 먼저 팔 것, 특히 타분야에서 쓴 통계학개론을 자주 참조 할 것,

이유는 일단 설명이 쉬워서임