6개월 동안 수리통계학 도서만 24권 팠다.

결론은 나종화다.

호그니 나발이니 다 필요없다.

나종화 하나만 봐도 수리통계학은 땡이다.


수리통계학의 핵심은 여러 변수일 때 확률을 알아보는 "결합확률밀도" 함수 이거 하나다.

이거 하나 알려고 소쩍새는 그렇게 지루하게 울어 댔나 보다.


그럼 결합 밀도함수(이하 결합)는 왜 알아야 하나? 그것은 주변 밀도함수 때문이다.

그럼 주변 밀도함수(이하 주변)는 왜 알아야 하나? 그것은 조건부 밀도함수 때문이다.

그럼 조건부 밀도함수(이하 조건부)는 왜 알아야 하나? 그것은 베이즈 확률 때문이다.

그럼 베이즈 확률은 왜 알아야 하나?

그것은 결과를 보고 원인을 알고 싶기 때문이다.


수리통계 24권을 하나로 정리해 주마


여기, 컴퓨터라는 깡통이 있다고 치자

이 깡통한테 결과를 보고 원인을 추정하는 방법을 가르친다고 하자

당연히 컴퓨터라는 깡통은 퐈이썬이나 R 밖에 해독을 못 한다

코딩을 해야 한다는 것이다.

그런데 코딩에 산수식만 넣어 주면 간단히 구현된다.

코딩만 해 주면 컴퓨터라는 깡통은 일사불란, 신속정확, 적재적소에서 원인의 확률을 추론해 줄 것이다.


산수식은 다음 순서로 정해졌다.

먼저, 인간은 어떻게 추론하는지 고찰해 보자

수학자나 통계학자들이 밝혀낸 그 과정은 다음과 같다.


오랜 관찰을 통해서 적당한 규칙을 찾아낸다.

(이 부분은 컴퓨터가 못 하고 사람이 찾아야 한다)

예를 들면, 비가 올 확률을 예측한다고 치자

그리고 비가 오는 변수는 딱 두개만 있다고 치자

오랜 관찰을 통해서 두 변수의 식을 어떻게 해서라도 찾아 냈다고 치자.

찾아낸 식이 (x+y)/21 이라고 하자


변수의 범위는

x=1,2,3

y=1,2 라고 하자

x : 1=월,2=화,3=수

y : 1=1월, 2=2월

이라고 편의상 가정하자


이 찾아낸 식이 "결합" 이다.

이 식을 적분(연속시) 또는 합(이산시)하여 "주변"을 구한다.

y에 대해 합하면 그 결과는 (2x+3)/21 이다.

x에 대해 합하면 그 결과는 (3y+6)/21 이다.


식 (2x+3)/21 나온 과정은 다음과 같다.

(x+y)/21 식에 y를 1부터 2까지 대입한다.

그러면, (x+1)/21 + (x+2)/21

 = (2x+3)/21 이 나온다.


마찬가지로 (3y+6)/21 도 (x+y)/21 식에 x를 1부터 3까지 대입한다.

그러면, (x+y)/21 + (x+y)/21 + (x+y)/21

= (1+y)/21 + (2+y)/21 + (3+y)/21

= (6+3y)/21 가 된다.


이렇게 구한 (2x+3)/21 와 (3y+6)/21 가 "주변" 이다.

이제 대망의~ "조건부"만 구하면 된다.

이것은 식은 죽 먹기이다.


분모에 "주변" (2x+3)/21 또는 (3y+6)/21을 넣고 분자에는 "결합" (x+y)/21를 넣으면 된다.

이게 전부다

그럼 다음과 같은 식이 나온다.

x에 관한 "조건부"는 (x+y)/(2x+3) 가 되고

y에 관한 "조건부"는 (x+y)/(3y+6) 가 된다.


이제 검산을 하여 보자.


y=1 즉, 오늘이 1월이고 x=월,화,수 각각 비올 확률은?

1월이고 월요일 비올 확률 : (x+y)/(3y+6) = (1+1)/(3*1+6) = 2/9

1월이고 화요일 비올 확률 : (x+y)/(3y+6) = (2+1)/(3*1+6) = 3/9

1월이고 수요일 비올 확률 : (x+y)/(3y+6) = (3+1)/(3*1+6) = 4/9

가 된다.


y=2 즉, 오늘이 2월이고 x=월,화,수 각각 비올 확률은?

2월이고 월요일 비올 확률 : (x+y)/(3y+6) = (1+2)/(3*2+6) = 3/12

2월이고 화요일 비올 확률 : (x+y)/(3y+6) = (2+2)/(3*2+6) = 4/12

2월이고 수요일 비올 확률 : (x+y)/(3y+6) = (3+2)/(3*2+6) = 5/12

가 된다.


그러니까, 오늘이 몇 월인지와 무슨 요일인지 같은 결과만 알아도 비 올 확률이라는 원인을 예측할 수 있다는 말씀이다.

이것이 수리통계학의 핵심이다.

나머지 신뢰구간이니 비모수니 가설검정이니는 이것보다 쉽다.


이제 위 계산 과정을 파이썬이나  R 같은 것으로 코딩해서 넣으면 컴퓨터는 알아서 확률을 예측해 줄 것이다.


요약:

1. 결합 밀도함수를 구한다.

2. 주변 밀도함수를 구한다.

3. 조건부 밀도함수를 구한다.

4. 조건부 식에 조건을 넣고 확률을 산출한다.