짤은 x grok에서 코드 쓰게 시킨거
이 상태로도 이런 4o가 못하는 문제 풀긴 하는데
(정12면체 안에 공 같은거)
정작 초콜릿만큼의 성능이 안나옴
근데 또 lmsys 가서 테스트해보면 느리지만 성능은 좋음
아마 지금 공개된 모델은 풀버젼이 아닌가벼
lmsys에서 할때엔 원트이던것도 3트 이렇게 해야되네
추론 차이나 그런건 아닌게, 소설 쓰는 능력도 확연하게 차이남
(추론모델은 소설 쓰는 능력은 차이 안남)
소설에 몇백 쓴 사람으로서 평가하건데
X 결제하면 쓸 수 있는 그록이 쓴 소설이
lm arena에서 쓴 것보다 ㅈㄴ 구림
믿음이가네
시스템 프롬프트 차이인지 뭔진 몰라도 영어고 한글이고 소설 쓰는 능력이 말도 안되게 차이남