https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=673243&search_head=100&page=1


LLM에게 뇌풀기 문제 시켜보기 (feat. 문제적남자)

심심해서 LLM 모델별로 뇌 풀기 문제 풀이를 시켜봄출처 : https://www.youtube.com/watch?v=s8wFBy7LeCA&t=430s문제적 남자 69회 (챔피언십 2탄)님들도 한 번 풀어보고정

gall.dcinside.com



7cea8474b6846bfe3aeb98a213d3341d5b62b8b082ca91292524


저번에 풀게 했던 문제


당시 결과는


완전히 오답 : o3-mini-high, Sonnet 3.7 thinking, Grok3 thinking, Gemini 2.0 flash tkinking


답은 맞았으나 풀이가 틀림 : o1


풀이도 답도 완벽함 : o1 pro


2.5 pro는 과연?



a04424ad2c06782ab47e5a67ee91766dc28ef1ecd0acc7cfbf13d2c75cd4d121846233968cf10f81442cc013b254


2.0 flash와 달리 다르게 숫자를 분해하며 접근하는 데까지는 성공했지만


a04424ad2c06782ab47e5a67ee91766dc28ef1ecd0acc7cfbf13d2c753d0d52112be07e6c3c6fce9a71da237217cb0





이후에는 핵심을 파악하지 못하고


2.0 flash와 동일하게 25라는 오답을 내놓음


흠...