7ee48374c3f01ef523e680e4409c706965a3ed373c3eb806260020b71f54e131d9608c147e04615efbdf227780d0b5680fb46516

4월 26일 일요일 

GPT-5.5 Pro가 출시된 지 이틀 동안 테스트해봤고, 몇 가지 생각을 적어본다.

* 확실히 다르다. 아마 더 좋아진 것 같다. 다만 그 차이가 눈에 확 띄는 방식은 아니다.
* 10~15분 이상 길게 생각하게 만드는 것이 더 어려워졌다. 그래도 몇 번은 50~60분 정도 생각하게 만드는 데 성공했다. 어쩌면 “더 오래 생각할수록 사고의 질이 더 높다”는 내 인간적 편향일 수도 있다.
* 이미 에르되시 문제 852에서 괜찮은 부분 결과를 얻었다.
    erdosproblems.com/forum/thread/8…
    짧고 탁월한 논증 덕분에 나온 결과다.
* 논증을 깔끔하게 정리하고 핵심에 잘 도달한다.

다만 이 모델의 본질을 이해하려면 테스트 시간이 더 필요하다.

아무튼, 정말 기대된다!

-
다음날에 구체적인 후기 올라오고 대화 모음

0eeb8471b7836af5239d8297359c7018f9335283d10e540a40310c1fb389f452c261b3d896633a3cfc96ca3aeb43ee080e92dd89

7eecf177c7f11a8223ef82e6309c706fb15c612d48771269e97f78e672cc3ee7f13d70d43a27bb196442ff2abe0ad69029644026

GPT-5.5 Pro는 정말 다음 단계에 올라선 모델이다.

지난 3일 동안 GPT-5.5로 새로운 미해결 에르되시 문제에 대한 해법 주장이 대략 8~10개 정도 나왔다.

물론 이것이 전부 타당하고 받아들여질 것이라는 뜻은 아니다. 하지만 마지막으로 비슷한 활동이 있었던 때는 GPT-5.2가 나왔던 12월/1월이었다. 그때조차도 주장 수가 더 적었고, 속도도 이 정도로 빠르지 않았다.

또 지금 나오는 주장들은 더 어려운 문제들에 관한 것이다. 왜냐하면 모든 에르되시 문제는 GPT-5.2로 최소한 간단히는 훑어본 상태였기 때문이다. 이는 GPT-5.5가 5.2보다 한 단계 위이고, 아마 5.4보다도 반 단계 정도 위라는 뜻이다.

겉으로 드러나는 해법들은 더 복잡하고 흥미롭다. 몇 개를 훑어봤는데 모두 그럴듯해 보인다.

5.5는 여러 출처에서 나온 다양한 논증을 종합하고, 그것을 더 효과적인 방식으로 처리하는 능력이 상당히 좋아졌다.

조만간 훨씬 더 인상적인 응용 사례들이 나올 것이라고 꽤 확신한다.

하지만 AI가 제대로 된 연구자 수준에 도달하려면 아직 꽤 멀었다.

수학에서 내 기준의 “37번째 수”는 사실 증명이 아니라 새로운 정의를 만들어내는 것이다. LLM이 여러 기존 구조를 단순화하거나 연결해주고, 새로운 이론으로 이어질 수 있는 새 개념을 정의하는 것을 보고 싶다. 다만 어쩌면 그것은 AGI와 거의 같은 말일지도 모른다.

08988004c3851ef123ec83e74e9c701e3f400ecd2ab12bae104a12604b697768bf10e70a4b29a4766b61357704864af5e3e46a49

0eeb8103c08b6bf723e98093459c706e9489cf024d1d3abad245f3f3c7283e96285bded85d4684b238ab50a2185aac75fdce7fe1

David Turturean:

erdosproblems.com에는 해법 주장들이 완전히 홍수처럼 쏟아지고 있다. GPT-5.5가 출시된 이후 지금까지 나는 완전한 해법 3개를 주장했다. #330, #870, #696이다.


그리고 부분 해법 몇 개와 다른 완전한 해법들도 갖고 있다고 생각하지만, 글로 정리하는 과정을 감독할 시간이 물리적으로 없다.

GPT-5.5는 인간인 내가 그것들을 처리할 수 있는 속도보다 더 빠르게 해법을 찾아내고 있다.


Przemek Chojecki:

맞다. 지금은 완전히 홍수처럼 쏟아지는 상태다. 하지만 한 달 정도 안에는 끝날 것 같다. 남은 문제들이 점점 더 어려워지고 있기 때문이다.

그래도 10쪽짜리 논문 안에서 꽤 빠르게 해결할 수 있는 문제들은 아직 많이 있다. 나는 이것이 좋은 일이라고 본다. 이런 문제들 중 상당수는 제대로 다뤄진 적이 없었고, 이런 방식으로 진행하면 그 과정에서 적절한 문제 진술을 정리하고, 관련 문헌을 찾는 등 여러 작업을 할 수 있기 때문이다.

그러니까 LLM들은 동시에 일종의 정리·청소 작업도 하고 있는 셈이다.


David Turturean:

이것을 가능하게 하는 요인 중 하나가 GPT-5.5의 수학 능력 향상이라는 점도 분명하다. 비록 그 향상이 아주 큰 폭은 아니더라도 말이다.

GPT-5.5가 공개된 지 몇 시간 안에, 당신과 내가 거의 동시에 #852에 대한 부분 해법에 도달했던 일이 떠오른다.

erdosproblems.com/forum/thread/8…

마찬가지로, 어제 내가 #696에 대한 내(?) 해법을 올렸을 때도, 전날 그 스레드에 누군가 비슷한 부분 해법을 제시했다는 것을 보고 놀라지 않았다.

erdosproblems.com/forum/thread/6…

참고로 한명은 옥스포드 박사고 한명은 대학원생이라 함 

- dc official App