작동 방식이 완전히 바뀌었고 (CoT가 마치 mdp처럼 진행되는거같음. 최적 CoT 트라젝토리를 RL로 찾았나봐!) 그게 되게 의미있는 방향이라는건 알겠는데 실성능은 솔직히 잘 모르겠음. 여전히 틀린말도 잘하고... 다른 딥부이들은 어때? - dc official App
Unet Encoder에 맞게 decoder 짜달라 했는데 20번 물어봐도 못하던데
다음달 정식버전으로 재시도 ㄱㄱ
테스트용으로 넣어본거라 물어볼거 생기면 담에 물어봐야지
Cusor에 o1미니랑 프리뷰로 db 최적화 코드 하는 데 잘 되긴 하더라 ㅇㅇ 다음달에 정식 버전 나오면 어느정도일지 기대되긴 함 정식버전 벤치마크는 미친 수준이더라
난 이번 iclr에 제출할 논문에 실은 이론을 재미삼아 풀어보라했는데 65초만에 풀긴한거 보고 개인적으로 정말 놀랐음