베이즈에서 사후최대밀도 구간을 구하는 방법은 다음과 같다.
사후최대밀도 구간이란 시뮬레이션으로 생성한 난수값이 가장 많이 몰려 있는 구간을 말한다.
난수가 가장 많이 몰려 있는 구간의 범위를 95%, 50% 식으로 정할 수 있다.
난수가 가장 많이 몰려 있는 곳이 곧 예측하고자 하는 평균이 있는 곳이다.
빈도통계에서는 분위수로 구하는데 베이즈에서는 분위수로 구하지 않는다.
사후분포의 모양이 비대칭이라 분위수로 구하게 되면 엉뚱한 결과를 초래하기 때문
방법은 다음과 같다.
발생된 난수를 크기 순으로 정렬을 한다.
일정 구간의 길이를 여러 번 비교한다.
가장 작은 값의 위치(배열 인덱스)를 따낸다.
따낸 배열 인덱스가 구간의 시작이다.
구간의 끝은 시작인덱스-1+전체길이로 구한다.
다음 그림은 사후분포 각각의 최대사후밀도 구간이다.
사후분포의 모양이 비대칭이라 분위수로 구하게 되면 엉뚱한 결과를 초래한다.
예제 코드는 chatGPT에게 문의
오류수정 : 최대밀도 구간에 꼭 평균이 있는 게 아님, 비대칭일 경우 최빈값(최대 밀도 구간의 중심)에서 한 참 떨어진 곳에 평균이 있기도 함