현재 그림그리는 인공지능들의 원리는 잘모르는데
보상모델로 그림그리는 모델을 학습시키면 안될까요?
보상모델에는 학습시킬 여러그림을 넣고 출력으로 긍정판단을 내리도록 훈련시키는거죠
그리고 그림그리는 모델이 어떤그림을 출력하면 보상모델이 그출력을 가지고 긍정판단을 내리면
그 그림을 그림그리는 모델에 학습시키는거에요
그러니까 강화학습으로? 하자는건지 잘모르겠지만..
이런방법은 안통하나요?
현재 그림그리는 인공지능들의 원리는 잘모르는데
보상모델로 그림그리는 모델을 학습시키면 안될까요?
보상모델에는 학습시킬 여러그림을 넣고 출력으로 긍정판단을 내리도록 훈련시키는거죠
그리고 그림그리는 모델이 어떤그림을 출력하면 보상모델이 그출력을 가지고 긍정판단을 내리면
그 그림을 그림그리는 모델에 학습시키는거에요
그러니까 강화학습으로? 하자는건지 잘모르겠지만..
이런방법은 안통하나요?
https://rl-diffusion.github.io
지금 그림그리는 인공지능들의 원리가 그건데
그 보상이 loss라고 생각하면 그게 원리임