참고
http://infoso.kr/?p=4081
https://en.wikipedia.org/wiki/Conjugate_prior
https://jeff560.tripod.com/c.html
http://infoso.kr/?cat=35
1.
베이즈 공식인 "사후분포 = 사전분포 X 우도" 는 "새로운 과거 = 과거 X 현재"로 해석할 수 있다.
새로운 과거란 새롭게 밝혀진 원인을 말한다.
여기서 원인이란 현대과학에서 말하는 현상의 원인이 아니다.
"신"을 말한다.
새로운 과거란 모든 현상의 원인이 결국은 신이라는 것이다.
베이즈는 이 공식을 이용해서 신의 존재를 입증하려 했다.
베이즈가 계산한 신의 존재 확률은 49% 이다.
처음에는 50% 였다.
신이 있거나 없거나 단 두 개의 경우 밖에 없기 때문이다.
그러나, 신의 증거를 찾으면서 49%가 되었다.
아마도, 50%->49%가 되었기에 베이즈는 발표를 주저했을 것으로 추정된다.
그런데,
통계 신뢰구간 구하기에서 표본의 수가 단 두 개일 경우와 여러 개일 경우의 표준오차 SE가 다르다.
49가 50보다는 더 신뢰성이 있다.
50일 때의 신뢰구간은 -3.99 ~ 4.99 이나 49일 때의 신뢰구간은 0.40 ~ 0.59가 나온다.
만약, 베이즈가 신뢰구간 개념을 알았다면 50에서 49로 떨어졌어도 즉시 발표했을 것이다.
부록:신뢰구간 계산방법
50%일 때 표준오차 SE : sqrt(p*q/(n-1))
49%일 때 표준오차 SE : (N-n /N)*sqrt(p*q/(n-1)) 여기서 N은 우주전체의 미조사된 것, n은 조사된 표본, N은 큰 수 이므로 (N-n/N)=1에 수렴
50%일 때 95% 유의수준 : 12.706
49%일 때 95% 유의수준 : 1.96
50%일 때 신뢰구간 : 0.5 +- 12.706 * 0.353 = [-3.99, 4.99]
49%일 때 신뢰구간 : 0.5 +- 1.96 * 0.050 = [0.40, 0.59]
[-3.99, 4.99] 보다 [0.40, 0.59]의 신뢰구간 폭이 좁아서 베이즈가 추정한 49%가 더 신뢰성이 높다.
2.
Conjugate (발음:컨주게이트, 뜻:공액,켤레)
공액사전분포 또는 켤레사전분포는 사전과 사후가 같은 분포를 말하는 게 아니다.
우도와 같은 계열의 사전분포를 켤레사전분포라고 칭한다.
우도와 사전의 계열이 같은데 사후까지 같은 것은 우연이지 꼭 정해진 필연은 아니다.
우도와 사전의 계열이 같아도 사후의 계열은 다른 경우도 있다.
(이런 경우 MCMC나 깊스추출 방법을 사용한다)
사전과 사후가 같으면 켤레라고 하는 것은 잘못 알려진 지식이다.
3.
우도와 같은 계열의 사전분포를 설정하는 이유는
우도는 현재의 데이터이고 현재의 데이터는 과거와 같은 상황일 것이라는 상정때문이다.
상정이지 가정이 아니다.
그래서 사전분포는 과거가 된다.
그리고 계산 결과인 사후분포는 새로운과거(원인)가 되는 것이다.
댓글 0