머숨 미러

1ebec223e0dc2bae61ab96e74683707027f14afe881bb76f595a8cdb26326c10731023909dca83b48bfe26

1ebec223e0dc2bae61ab96e74683707027f14aff821bb66a595e8adc26326c10302e49d310fb2cdce0d4e200

1ebec223e0dc2bae61ab96e74683707027f14aff821bb66a595d8edf26326c10db93046dc27c94d17ef55fab

1ebec223e0dc2bae61ab96e74683707027f14aff821bb66a595d8cd826326c1023a97e1a6013b4d2ea0e07c9

1ebec223e0dc2bae61ab96e74683707027f14aff821bb66a595d8bdb26326c102533f40089f217b729d1360e

갤질하다가 트윗에서 양동이로 성능시험하던거 보고 따라해봤었음

그림을 못그려서 성능확인하기 좀 애매한 것 같긴 한데, 나름 의미는 있을 것 같았음

o1이랑 4o는 틀렸었고, 1206은 맞췄었음

그래서 flash한테도 살짝 기대가지고 질문해봤는데, 이건 ㅅㅂ 비전이나 추론을 테스트할 상황이 아니네

무슨 듣보잡 gpt 사칭사이트에서 질문한 줄 알았다

무료모델은 다 이따위인가 싶어서 4o mini한테도 질문해봤는데, 뭐가 문제인지 얘는 최소한 4o mini보다 훨씬 처참한 것 같다

4o mini는 제대로 틀리긴 했는데 질문 하나 걸러서 건망증이 오지는 않던데

[일반] 2.0 flash한테 질문 좀 해봤는데