통계학은 통계 + 확률 + 가설(준명제, 후보명제)


세 부분으로 이루어짐


"내일 비가 올 것이다"


갈은 가설을 먼저 세움


가설은 앞으로 명제가 될 후보 임


명제란 참.거짓이 판단 가능한 문장인데


"내일 비가 올 것이다"라는 문장은 내일 일이라 명제가 되지 못 함


확률이란 가설이 명제가 될 가능성을 재는 거임


재는 방법은 과거 자료임


그런데 과거 자료로 미래를 예측하는 것은 에지웍스라는 사람이 제안한 것인데


과거 자료로 미래를 예측하는 것이 과학적인가 하는 고민은 필요 함


에지웍스 원서를 구하기 힘드므로 이것은 차츰차츰 생각


어쨌든 과거 자료를 분석하는 모든 방법이 바로 통계 임


인자분석, 군집분석, 딥러닝, 실험, 여론조사, 표본조사, 앙상블, 다변량분석, 데이터마이닝, 머신러닝, 품질경영 등등


정리하면


통계로 가설의 지지 확률을 구하고 확률에 따라 가설의 명제화를 판단하는 거임


확률이 1 이나 0 이면 가설은 확실한 명제가 되고


95% 이면 가능성 있는


75% 이면 가까운


50% 이면 반반


25% 이면 가능이 없는


등으로 부르게 됨