6개월 동안 수리통계학 도서만 24권 팠다.
결론은 나종화다.
호그니 나발이니 다 필요없다.
나종화 하나만 봐도 수리통계학은 땡이다.
수리통계학의 핵심은 여러 변수일 때 확률을 알아보는 "결합확률밀도" 함수 이거 하나다.
이거 하나 알려고 소쩍새는 그렇게 지루하게 울어 댔나 보다.
그럼 결합 밀도함수(이하 결합)는 왜 알아야 하나? 그것은 주변 밀도함수 때문이다.
그럼 주변 밀도함수(이하 주변)는 왜 알아야 하나? 그것은 조건부 밀도함수 때문이다.
그럼 조건부 밀도함수(이하 조건부)는 왜 알아야 하나? 그것은 베이즈 확률 때문이다.
그럼 베이즈 확률은 왜 알아야 하나?
그것은 결과를 보고 원인을 알고 싶기 때문이다.
수리통계 24권을 하나로 정리해 주마
여기, 컴퓨터라는 깡통이 있다고 치자
이 깡통한테 결과를 보고 원인을 추정하는 방법을 가르친다고 하자
당연히 컴퓨터라는 깡통은 퐈이썬이나 R 밖에 해독을 못 한다
코딩을 해야 한다는 것이다.
그런데 코딩에 산수식만 넣어 주면 간단히 구현된다.
코딩만 해 주면 컴퓨터라는 깡통은 일사불란, 신속정확, 적재적소에서 원인의 확률을 추론해 줄 것이다.
산수식은 다음 순서로 정해졌다.
먼저, 인간은 어떻게 추론하는지 고찰해 보자
수학자나 통계학자들이 밝혀낸 그 과정은 다음과 같다.
오랜 관찰을 통해서 적당한 규칙을 찾아낸다.
(이 부분은 컴퓨터가 못 하고 사람이 찾아야 한다)
예를 들면, 비가 올 확률을 예측한다고 치자
그리고 비가 오는 변수는 딱 두개만 있다고 치자
오랜 관찰을 통해서 두 변수의 식을 어떻게 해서라도 찾아 냈다고 치자.
찾아낸 식이 (x+y)/21 이라고 하자
변수의 범위는
x=1,2,3
y=1,2 라고 하자
x : 1=월,2=화,3=수
y : 1=1월, 2=2월
이라고 편의상 가정하자
이 찾아낸 식이 "결합" 이다.
이 식을 적분(연속시) 또는 합(이산시)하여 "주변"을 구한다.
y에 대해 합하면 그 결과는 (2x+3)/21 이다.
x에 대해 합하면 그 결과는 (3y+6)/21 이다.
식 (2x+3)/21 나온 과정은 다음과 같다.
(x+y)/21 식에 y를 1부터 2까지 대입한다.
그러면, (x+1)/21 + (x+2)/21
= (2x+3)/21 이 나온다.
마찬가지로 (3y+6)/21 도 (x+y)/21 식에 x를 1부터 3까지 대입한다.
그러면, (x+y)/21 + (x+y)/21 + (x+y)/21
= (1+y)/21 + (2+y)/21 + (3+y)/21
= (6+3y)/21 가 된다.
이렇게 구한 (2x+3)/21 와 (3y+6)/21 가 "주변" 이다.
이제 대망의~ "조건부"만 구하면 된다.
이것은 식은 죽 먹기이다.
분모에 "주변" (2x+3)/21 또는 (3y+6)/21을 넣고 분자에는 "결합" (x+y)/21를 넣으면 된다.
이게 전부다
그럼 다음과 같은 식이 나온다.
x에 관한 "조건부"는 (x+y)/(2x+3) 가 되고
y에 관한 "조건부"는 (x+y)/(3y+6) 가 된다.
이제 검산을 하여 보자.
y=1 즉, 오늘이 1월이고 x=월,화,수 각각 비올 확률은?
1월이고 월요일 비올 확률 : (x+y)/(3y+6) = (1+1)/(3*1+6) = 2/9
1월이고 화요일 비올 확률 : (x+y)/(3y+6) = (2+1)/(3*1+6) = 3/9
1월이고 수요일 비올 확률 : (x+y)/(3y+6) = (3+1)/(3*1+6) = 4/9
가 된다.
y=2 즉, 오늘이 2월이고 x=월,화,수 각각 비올 확률은?
2월이고 월요일 비올 확률 : (x+y)/(3y+6) = (1+2)/(3*2+6) = 3/12
2월이고 화요일 비올 확률 : (x+y)/(3y+6) = (2+2)/(3*2+6) = 4/12
2월이고 수요일 비올 확률 : (x+y)/(3y+6) = (3+2)/(3*2+6) = 5/12
가 된다.
그러니까, 오늘이 몇 월인지와 무슨 요일인지 같은 결과만 알아도 비 올 확률이라는 원인을 예측할 수 있다는 말씀이다.
이것이 수리통계학의 핵심이다.
나머지 신뢰구간이니 비모수니 가설검정이니는 이것보다 쉽다.
이제 위 계산 과정을 파이썬이나 R 같은 것으로 코딩해서 넣으면 컴퓨터는 알아서 확률을 예측해 줄 것이다.
요약:
1. 결합 밀도함수를 구한다.
2. 주변 밀도함수를 구한다.
3. 조건부 밀도함수를 구한다.
4. 조건부 식에 조건을 넣고 확률을 산출한다.
충북대 교수님말하는거지? 난대면강의들음 - dc App