reconstruction만 낮으면 commitment loss는 좀 높아도 상관없나요?
아니면 reconstruction 좀 못해도 commitment loss가 많이 낮은 게 낫나요
learning rate 따라서 loss가 완전 다르게 뜨네..
reconstruction만 낮으면 commitment loss는 좀 높아도 상관없나요?
아니면 reconstruction 좀 못해도 commitment loss가 많이 낮은 게 낫나요
learning rate 따라서 loss가 완전 다르게 뜨네..
목적이 뭔데? 왜 학습함? ar generation에 쓸라고? 아니면 그냥 공부임? 공부면 commit loss랑 recon loss 따라서 generation 성능을 찍어봐. generation이 목적이라고 해도 vqvae 디코더 그대로 쓰는게 아니라 파인튜닝해서 recon 품질 올리거나 아예 별개의 diffusion 디코더 학습해서 쓰는 선택도 흔함. 이런거 제껴둬도 보통은 recon 성능이 좋은게 좀 더 우선시되는 경향은 있음.