| o1-preview-2024-09-12 | OpenAI | 65.63 | 67.42 | 50.85 | 64.92 | 67.31 | 68.72 | 74.60 |
| gemini-exp-1206 | 63.91 | 57.00 | 63.41 | 71.69 | 63.16 | 50.84 | 77.34 | |
| claude-3-5-sonnet-20241022 | Anthropic | 58.99 | 56.67 | 67.13 | 52.28 | 54.78 | 53.76 | 69.30 |
1206이 처음으로 o1 프리뷰랑 점수가 근접했던 모델인데
이게 플래쉬다 ? 좆트만 똥게이 새끼는 걍 기저귀만 차고 다녀야 함 ㄷㄷ
근데 느낌이 프로같음 flash 뭔가 1206이랑 다른 느낌인데
겨울이다
일단 속도가 flash가 아님.
1206 토큰이 flash랑 같은데다가 반복도 flash랑 같아서 flash는 맞을듯. 근데 실험용 모델이라 공식 플래시랑은 다를지도