지금 LLM 벤피마크들은 사실상 코딩하는 사람들한테 빼곤 중요하지 않음

따라서 주관적이더라도 여러 일반인들에게 압도적인 평가를 받았다는 건 매우 의미가 큼
심지어 r1, o1, o3-mini-high, gemini 2.0 등 다 포함해도 1등인거임