갤질하다가 트윗에서 양동이로 성능시험하던거 보고 따라해봤었음
그림을 못그려서 성능확인하기 좀 애매한 것 같긴 한데, 나름 의미는 있을 것 같았음
o1이랑 4o는 틀렸었고, 1206은 맞췄었음
그래서 flash한테도 살짝 기대가지고 질문해봤는데, 이건 ㅅㅂ 비전이나 추론을 테스트할 상황이 아니네
무슨 듣보잡 gpt 사칭사이트에서 질문한 줄 알았다
무료모델은 다 이따위인가 싶어서 4o mini한테도 질문해봤는데, 뭐가 문제인지 얘는 최소한 4o mini보다 훨씬 처참한 것 같다
4o mini는 제대로 틀리긴 했는데 질문 하나 걸러서 건망증이 오지는 않던데
댓글 0