베이지안이 수식적으로는 이해가 가는데 뭔가 와닿지 않은 느낌이랄까.. 시원하게 이해가 안되네요.. 

제가 이해한 걸 적어드릴테니 틀린 게 있거나 보충할 게 있으면 말해주십쇼..


주어진 데이터 x를 보고 theta(모수)를 추정하기 위해 베이즈 정리를 쓰는데, 베이즈 정리에 의하면 P(theta l  x) 는 P(x l theta) * P(theta) 와 비례하고

theta를 모수로 하는 확률분포에서 x_i가 iid 할 때는 P(x l theta) 는 단순히 P(x1)P(x2)...P(xn)으로서 구할 수 있으며


구한 P(theta l  x)는 새로운 사전 확률로써 P(theta)로 업데이트되고, argmax P(theta l x)을 찾을 때까지 반복한다


까지가 제가 이해한 내용입니다..