안녕하세요


저는 인공지능에 대해 아는게 없고 그냥 다른갤에서 논문한개를 요약한걸 봤는데


거기서는 보상모델이라는걸로 훈련시키려는 모델을 훈련시키더라고요


밑에글에 이미 이게 그림그리는 모델의 원리라고 하셨는데 제가 좀더 생각한게 있는데


그걸 평가해주세요


-----------------------------------------------------------------------------------------------


1. 학습시키려는 그림에 노이즈를 가합니다


2. 노이즈가 심한 그림은 보상모델이 1점을 주도록 학습 시킵니다


3. 노이즈가 좀더 덜한 그림은 보상모델이 2점을 주도록 학습시킵니다


4. 노이즈가 줄어들수록 보상모델이 높은점수를 주도록 학습시킵니다


5. 이렇게 학습한 보상모델로 그림그리는 모델이 내놓는 값에 점수를 매깁니다


6. 점수를 높게받는 값을 그림그리는 모델이 학습합니다


7. 반복


--------------------------------------------------------------------------------------------------



이게 이미 있다는 말씀들이신가요?