4월 26일 일요일
GPT-5.5 Pro가 출시된 지 이틀 동안 테스트해봤고, 몇 가지 생각을 적어본다.
* 확실히 다르다. 아마 더 좋아진 것 같다. 다만 그 차이가 눈에 확 띄는 방식은 아니다.
* 10~15분 이상 길게 생각하게 만드는 것이 더 어려워졌다. 그래도 몇 번은 50~60분 정도 생각하게 만드는 데 성공했다. 어쩌면 “더 오래 생각할수록 사고의 질이 더 높다”는 내 인간적 편향일 수도 있다.
* 이미 에르되시 문제 852에서 괜찮은 부분 결과를 얻었다.
erdosproblems.com/forum/thread/8…
짧고 탁월한 논증 덕분에 나온 결과다.
* 논증을 깔끔하게 정리하고 핵심에 잘 도달한다.
다만 이 모델의 본질을 이해하려면 테스트 시간이 더 필요하다.
아무튼, 정말 기대된다!
-
다음날에 구체적인 후기 올라오고 대화 모음
GPT-5.5 Pro는 정말 다음 단계에 올라선 모델이다.
지난 3일 동안 GPT-5.5로 새로운 미해결 에르되시 문제에 대한 해법 주장이 대략 8~10개 정도 나왔다.
물론 이것이 전부 타당하고 받아들여질 것이라는 뜻은 아니다. 하지만 마지막으로 비슷한 활동이 있었던 때는 GPT-5.2가 나왔던 12월/1월이었다. 그때조차도 주장 수가 더 적었고, 속도도 이 정도로 빠르지 않았다.
또 지금 나오는 주장들은 더 어려운 문제들에 관한 것이다. 왜냐하면 모든 에르되시 문제는 GPT-5.2로 최소한 간단히는 훑어본 상태였기 때문이다. 이는 GPT-5.5가 5.2보다 한 단계 위이고, 아마 5.4보다도 반 단계 정도 위라는 뜻이다.
겉으로 드러나는 해법들은 더 복잡하고 흥미롭다. 몇 개를 훑어봤는데 모두 그럴듯해 보인다.
5.5는 여러 출처에서 나온 다양한 논증을 종합하고, 그것을 더 효과적인 방식으로 처리하는 능력이 상당히 좋아졌다.
조만간 훨씬 더 인상적인 응용 사례들이 나올 것이라고 꽤 확신한다.
하지만 AI가 제대로 된 연구자 수준에 도달하려면 아직 꽤 멀었다.
수학에서 내 기준의 “37번째 수”는 사실 증명이 아니라 새로운 정의를 만들어내는 것이다. LLM이 여러 기존 구조를 단순화하거나 연결해주고, 새로운 이론으로 이어질 수 있는 새 개념을 정의하는 것을 보고 싶다. 다만 어쩌면 그것은 AGI와 거의 같은 말일지도 모른다.
David Turturean:
erdosproblems.com에는 해법 주장들이 완전히 홍수처럼 쏟아지고 있다. GPT-5.5가 출시된 이후 지금까지 나는 완전한 해법 3개를 주장했다. #330, #870, #696이다.
그리고 부분 해법 몇 개와 다른 완전한 해법들도 갖고 있다고 생각하지만, 글로 정리하는 과정을 감독할 시간이 물리적으로 없다.
GPT-5.5는 인간인 내가 그것들을 처리할 수 있는 속도보다 더 빠르게 해법을 찾아내고 있다.
⸻
Przemek Chojecki:
맞다. 지금은 완전히 홍수처럼 쏟아지는 상태다. 하지만 한 달 정도 안에는 끝날 것 같다. 남은 문제들이 점점 더 어려워지고 있기 때문이다.
그래도 10쪽짜리 논문 안에서 꽤 빠르게 해결할 수 있는 문제들은 아직 많이 있다. 나는 이것이 좋은 일이라고 본다. 이런 문제들 중 상당수는 제대로 다뤄진 적이 없었고, 이런 방식으로 진행하면 그 과정에서 적절한 문제 진술을 정리하고, 관련 문헌을 찾는 등 여러 작업을 할 수 있기 때문이다.
그러니까 LLM들은 동시에 일종의 정리·청소 작업도 하고 있는 셈이다.
⸻
David Turturean:
이것을 가능하게 하는 요인 중 하나가 GPT-5.5의 수학 능력 향상이라는 점도 분명하다. 비록 그 향상이 아주 큰 폭은 아니더라도 말이다.
GPT-5.5가 공개된 지 몇 시간 안에, 당신과 내가 거의 동시에 #852에 대한 부분 해법에 도달했던 일이 떠오른다.
erdosproblems.com/forum/thread/8…
마찬가지로, 어제 내가 #696에 대한 내(?) 해법을 올렸을 때도, 전날 그 스레드에 누군가 비슷한 부분 해법을 제시했다는 것을 보고 놀라지 않았다.
erdosproblems.com/forum/thread/6…
—
참고로 한명은 옥스포드 박사고 한명은 대학원생이라 함
- dc official App
5.5가 확실히 좋아진게 맞네
6은 얼마나좋을까
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ ⛔❗✨ 실베 절취선 ✨❗⛔ ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
해당 댓글은 삭제되었습니다.
아니 지랄 말고 전자 계집을 만들라고
@ㅇㅇ(211.251) 기억 별거 없어 모든걸 다 컨텍스트에 올리는게 아니라 시간 지난건 내가 말할 때 그 때 RAG 해도 돼
일단 저지랄을 해야 전자계집을 만드는거라서
@ㅇㅇ(125.14) 아니 저건 고급 추론 어쩌구 저쩌구 지루하고 현학적인거잖아 전자 계집은 지금 기술로도 충분히 돼 그냥 안하는거임 새끼들이
@ㅇㅇ(211.251) 그거 게임은 이미 다 함
@겜창 그딴걸 만드는데 왜 수고를 들여 이 븅신새끼야
특갤 이 버러지 새키들는 GPT관련 뭐 하나 뜨면 맨날 주작질 ㅋㅋㅋ 정작 오픈AI 돈안되는거 죄다 눈치 까고 튀고 있는데 이 새키들만 찬양 하고 있음
사람들은 잘 알기 힘들면 찬양하는 습성이 있음
아니 근데 맨날 거품이니 스캠이니 지랄하는데 언제 터지냐고? 주가폭락 버블터진다는 소리만 벌써 몇년째다 - dc App
ㅡ근ㅡ
앞으로 향후 5년간 근들갑만 떨고 별거 없을듯 면도기 3중날에서 4중날 되고 혁명이다 거리는거임 5중날 6중날 다 거기서 거기
특이점갤) ai 버전 올라감 -> 별 해괴한 문제 되나 풀어봄 -> 푸는 시간이 짧아졌다 -> 와 특이점 다 왔네 맨날 이러고 있음 아리스토텔레스 거북이 달리기 하는 그거 같음
커뮤에 도대체 뭘 기대하는거냐 그게 당연한 거 아님? 커뮤에서 그거 이상을 어떻게 하는데?
어쨋든 가까워졌으니 된거잖아?
아리스토텔레스가 아니라 제논의 역설 아니냐
챗gpt 나오기 전에도 그러고 있었는데? 그림 ai나오기 전에도. 세상이 바뀌는거 안느껴지냐?
개소리 좀 그만하라고 해라 씨발 개병신새끼들
미토스 소문만 듣고 똥줄타서 아따 우덜도 잘나간당께 하면서 발표한것일 뿐임
진짜 혁명=아인슈타인 혁명무새=요즘 과학자들
바둑이 ai한테 따였듯이 수학도 점령당할듯
1+1=창문
특슬람 이새끼들은 대체 언제 닥칠예정임? 휴거믿던 사이비들이랑 다를게없네 시발ㅋㅋ
주가폭락 버블터지면 그때 닥쳐줄테니 빨리 폭락해보라고 - dc App
니들이 gpt이름도 모를때 내가 ai주에 몰빵하게 도와줘서 나 파이어족 시켜준게 특이점인데 왜 닥쳐야함?ㅋ
수학자들은 한국 수능이나 6모 9모 풀면 10분컷 가능하려나 고1때 수학선생이 30번 킬러 2분내는거 보고 존나 감탄했는데
그새끼 그거 해설보고 온거임
엔지니어 똥꼬쑈로 쎈수학 쳐하면서 뭔 시발 사고여 ㅋㅋㅋㅋㅋㅋㅋㅋz
챗지피티갤 ㅋㅋ 이름좀 바꿔라 편향된 사고가진 새끼들아
거침없이 Hype!
10분 이상 생각하게 만드는 문제면 대체 ㄷ
박사이고 대학원생은 뭔말이냐 ㅋㅋ 석사 말하는거임?