네트워크를 최적화할 때 MLE나 MAP를 사용하는데요. MLE고 가우시안을 따른다고 가정합니다.

그때 가우시안을 따른다고 하는게, MLP의 내부가 가우시안이라는게 아니라 MLP의 출력이 가우시안 분포를 따르도록 MLP의 파라미터가 조정된다는거죠?

MLP 파라미터에 대한 함수가 가우시안을 따른다고 하면... MLP대신 가우시안 쓰면 되는거라 생각해서 제 생각이 맞는 것 같긴 한데요. 확인차 질문드립니다.