훈련모델 A를 준비하고
A의
입력=이전상황
출력=다음상황
------------------------------------
보상모델 B를 준비
B의
입력=이전상황+다음상황
출력=예측이 맞으면 긍정, 예측이 틀리면 부정
-----------------------------------
A의 입력과 출력을 B에 넣고 판정을 받음
긍정 판정시 A의 입력과 출력을 A에 학습시킴
부정 판정시 다른예측을 내놓도록 시킴
왜하필 보상모델을 썼냐면
openai에서 썼기때문에..
범용지능 만드는법
NEMO(winner0962)
2024-09-19 14:39:00
추천 0
댓글 5
다른 게시글
-
진짜 요즘 수학 1번 이렇게 나오나요? ㄷㄷ.
[8]익명(1.249) | 24.09.19추천 20 -
과학적으로 용불용설은 틀렸다
[3]-썬더볼트-(kjyrpm3020) | 24.09.19추천 0 -
문과 ) AI 발전하면 리만 가설 풀 수 있음????
[2]저먼스플렉..(chocolatestarfish) | 24.09.19추천 0 -
수붕이 지금 하는짓...
예비수학교..(below7338) | 24.09.19추천 0 -
우주찬양
[4]아벨두두(rla15952) | 24.09.19추천 0 -
답임
익명(39.115) | 24.09.19추천 0 -
문제 풀어봐라
[6]익명(39.115) | 24.09.19추천 0 -
물리학 문제임
익명(39.115) | 24.09.19추천 0 -
수갤 1년봤는데 고닉들 궁금한거
[4]익명(physics7418) | 24.09.19추천 0 -
이거 풀어봐라
익명(39.115) | 24.09.19추천 0
trivia 는 ai 어떻게 보냐?
ai에 대한 생각을 말씀하시는거라면 매우 유능한 천사를 만들고싶다는게 목표입니다
언제쯤 어느정도까지 발전할거라고 짐작함
나도 아는게 없어서 예측은 힘들지
ㅇㅋ