트랜스포머기반으로 학습시킨걸 물리법칙 어색한영상에서 잘못된부분을 잘찾아내는데 리워드주는식으로 튜닝하는방법은 없나
[일반] 트랜스포머랑 강화학습이랑 같은모델에 붙일수잇음?
익명(211.168)
2024-12-19 15:17:00
추천 0
댓글 3
다른 게시글
-
미국이 AGI 낼동안 한국은 소파문제 풀었다고 열광하노
[5][일반] 익명(interval0056) | 24.12.19추천 0 -
AGI는 조용히 올것이다 vs OPEN AI 발표처럼 정식발표로 나올것이
[8][일반] 고양이망나..(wood8799) | 24.12.19추천 0 -
근데 o1 이 gpt5가 못되는 이유는 다른게 아니라
[1][일반] 익명(175.199) | 24.12.19추천 0 -
o1 개수제한 사라짐?
[일반] 래머(cramer) | 24.12.19추천 0 -
알트만이 천만 토큰 몇개월내로 된다는데
[4][일반] 익명(sky0204) | 24.12.19추천 1 -
o1 pro mod 수능 윤사 문제
[9][일반] 익명(121.134) | 24.12.19추천 1 -
당장 노동대체 시작되면
[일반] 익명(ghdzhdqkswja0410) | 24.12.19추천 0 -
라마는 출시할때 조용하게 출시하던데
[3][일반] 익명(175.199) | 24.12.19추천 1 -
전 oai 직원 "o1은 gpt-5다"
[3][일반] 익명(convince8762) | 24.12.19추천 1 -
지금 o1 pro mod 결제해서 사용 중인데
[6][일반] 익명(59.10) | 24.12.19추천 1
해당 댓글은 삭제되었습니다.
RLHF가 내가 생각한거랑 비슷하네
ㅇㅇ 웬만한 상용LLM들은 이미 다 활용하고있는방법이구나