[일반] 걍 장병탁교수님 레벨6중 3급 기술이란거임

익명(219.249) 2023-11-24 09:34:00 추천 1

08edf47ec08b68f523ef8ee3459c701ee3527e756fd5dd13d405ce68cb9cf7c7f924c9dab8f86c7a1f1b19ea2b0956e9e5b806c4

학습 데이터를 스스로 생성, 수집하고(gpt policy) 나온 데이터로 reward model 학습시키고 다시 그걸로 자기 모델 업데이트하는 방식

4단계는 아닌거같음 장병탁교수가 4단계는 목적함수를 스스로 정의하고 수정하는 레벨이라 함

- dc official App

댓글 3

해당 댓글은 삭제되었습니다.

해당 댓글은 삭제되었습니다. 2026-06-27 16:22:24.909053
답글
Gpt4 나오고 얼마 안 있어서 였던걸로 기억

익명(121.149) 2023-11-24 10:35:00
선

익명(1.239) 2023-11-24 09:45:00