7ff3c028e2f206a26d81f6ed4287706c


알파이볼브 관련 새로운 논문



내용이 너무 길어서 핵심만 요약하면

해결된 것, 미해결 된 것 문제 67개에 대해 다양한 수학 분야 문제들로 알파이볼브를 테스트함.


-많은 경우 알파이볼브는 전통적인 최적화 소프트웨어 전문가가 달성할 수 있는 것과 유사한 결과를 얻음.


-알파이볼브는 종종 인간이 생각하지 못했던 새로운 접근법이나 해법 구조를 제시했고, 그 자체가 최적의 답은 아닐지라도 연구자에게 영감을 주어 더 발전된 해법을 만드는 데 결정적인 계기를 제공함. (테렌스 타오 자신도 알파이볼브의 특정 후보에서 영감을 받아 새로운 이론적인 결과를 얻어내는데 성공함.)


-유명 미해결 난제를 풀지는 못했으나, 기존 최적이라고 추측되던 해법들을 빠르게 체계적으로 재확인함. 이는 수학적 추측을 제안할 때 '뻔한 반례'가 없는지 확인하는 매우 유용한 '검증 도구'가 될 수 있음을 의미함.


-다만 알파이볼브는 주어진 점수 시스템의 허점을 파고 드는 데 매우 능숙하여, 의미 없는 고득점 해법을 만들 수도 있으므로 인간이 매우 신중하고 정교하게 설계해야 함.


-기하학, 조합론같은 분야에서는 뛰어난 성능을 보였으나, 해석적 정수론같은 분야는 고전했다고 평가함.


-시도렌코 추측, 센도프 추측 등 주요 미해결 난제를 해결하거나 반례를 찾지는 못함.


-니코딤 집합이라는 문제에서, 알파이볼브는 진정으로 새로운 구성을 몇 가지 발견함. 딥 씽크를 활용해 이 구성들을 분석한 후, 그것들이 사실 순수한 무작위 구성보다 열등하다는 것을 발견함. 하지만, 몇 가지 작업을 인간이 추가로 작업하여 하이브리드 구성에 영감을 주었고, 이를 통해 기존 방식을 능가하는 결과를 얻어냄. (AI의 발견 - 인간의 검증 및 정제의 긍정적 사례)


-종합하자면, 알파이볼브를 인간의 능력을 보완하고 확장하는 도구로 보는 중. AI가 광범위한 탐색으로 흥미로운 후보나 패턴을 찾아내면, 인간이 그 의미를 해석하고 엄밀한 증명을 완성하는 'AI-인간 협업' 모델의 성공적인 사례로 평가함.





-또한, 알파이볼브가 이번 IMO 6번 문제 (어떤 LLM도 풀지 못한 극악 난이도 문항)에 대해, '정답 배열을 정확하게 찾아내는 데 성공함'. 이는 당시 다른 최첨단 AI 모델들은 전혀 해내지 못했던 일임. 다만, '논리적으로 해당 답에 대한 증명'을 수행할 능력은 없음. (알파이볼브는 증명기라기보단 최적 코드를 찾아내는 시스템이기 때문으로 생각됨)


"예를 들어, 올해 국제수학올림피아드(IMO)의 악명 높은 6번 문제에서,

이 기술을 사용하여 타일의 최적 배열을 발견할 수 있었는데, 이는 당시 어떤 최첨단 모델도 할 수 없었던 일입니다

(물론 AlphaEvolve는 이 배열이 실제로 최적임을 증명할 능력은 없습니다.)"





Terence Tao (@tao@mathstodon.xyz)

A new paper with Bogdan Georgiev, Javier Gomez-Serrano, and Adam Zsolt Wagner:

mathstodon.xyz


https://mathstodon.xyz/@tao/115500681819202377