머숨 미러

7ff3c028e2f206a26d81f6ed4287706c

알파이볼브 관련 새로운 논문

내용이 너무 길어서 핵심만 요약하면

해결된 것, 미해결 된 것 문제 67개에 대해 다양한 수학 분야 문제들로 알파이볼브를 테스트함.

-많은 경우 알파이볼브는 전통적인 최적화 소프트웨어 전문가가 달성할 수 있는 것과 유사한 결과를 얻음.

-알파이볼브는 종종 인간이 생각하지 못했던 새로운 접근법이나 해법 구조를 제시했고, 그 자체가 최적의 답은 아닐지라도 연구자에게 영감을 주어 더 발전된 해법을 만드는 데 결정적인 계기를 제공함. (테렌스 타오 자신도 알파이볼브의 특정 후보에서 영감을 받아 새로운 이론적인 결과를 얻어내는데 성공함.)

-유명 미해결 난제를 풀지는 못했으나, 기존 최적이라고 추측되던 해법들을 빠르게 체계적으로 재확인함. 이는 수학적 추측을 제안할 때 '뻔한 반례'가 없는지 확인하는 매우 유용한 '검증 도구'가 될 수 있음을 의미함.

-다만 알파이볼브는 주어진 점수 시스템의 허점을 파고 드는 데 매우 능숙하여, 의미 없는 고득점 해법을 만들 수도 있으므로 인간이 매우 신중하고 정교하게 설계해야 함.

-기하학, 조합론같은 분야에서는 뛰어난 성능을 보였으나, 해석적 정수론같은 분야는 고전했다고 평가함.

-시도렌코 추측, 센도프 추측 등 주요 미해결 난제를 해결하거나 반례를 찾지는 못함.

-니코딤 집합이라는 문제에서, 알파이볼브는 진정으로 새로운 구성을 몇 가지 발견함. 딥 씽크를 활용해 이 구성들을 분석한 후, 그것들이 사실 순수한 무작위 구성보다 열등하다는 것을 발견함. 하지만, 몇 가지 작업을 인간이 추가로 작업하여 하이브리드 구성에 영감을 주었고, 이를 통해 기존 방식을 능가하는 결과를 얻어냄. (AI의 발견 - 인간의 검증 및 정제의 긍정적 사례)

-종합하자면, 알파이볼브를 인간의 능력을 보완하고 확장하는 도구로 보는 중. AI가 광범위한 탐색으로 흥미로운 후보나 패턴을 찾아내면, 인간이 그 의미를 해석하고 엄밀한 증명을 완성하는 'AI-인간 협업' 모델의 성공적인 사례로 평가함.

-또한, 알파이볼브가 이번 IMO 6번 문제 (어떤 LLM도 풀지 못한 극악 난이도 문항)에 대해, '정답 배열을 정확하게 찾아내는 데 성공함'. 이는 당시 다른 최첨단 AI 모델들은 전혀 해내지 못했던 일임. 다만, '논리적으로 해당 답에 대한 증명'을 수행할 능력은 없음. (알파이볼브는 증명기라기보단 최적 코드를 찾아내는 시스템이기 때문으로 생각됨)

"예를 들어, 올해 국제수학올림피아드(IMO)의 악명 높은 6번 문제에서,

이 기술을 사용하여 타일의 최적 배열을 발견할 수 있었는데, 이는 당시 어떤 최첨단 모델도 할 수 없었던 일입니다

(물론 AlphaEvolve는 이 배열이 실제로 최적임을 증명할 능력은 없습니다.)"

Terence Tao (@tao@mathstodon.xyz)

A new paper with Bogdan Georgiev, Javier Gomez-Serrano, and Adam Zsolt Wagner:

mathstodon.xyz

https://mathstodon.xyz/@tao/115500681819202377

행복한천국으로(adjust7431) 2025-11-06 16:31:00

익명(bam9398) 2025-11-06 16:32:00

연구 보조 측면으로는 지금도 충분히 괜찮나보네. 혼자서 다 해줬으면 좋겠다만 ㅋㅋ

이세이미야케(jkwarawara) 2025-11-06 16:33:00

머랄까 이제 ㅈㄴ 똑똑한 조수정도는 되는듯

익명(sleep9291) 2025-11-06 16:33:00

젬2.0으로 저정도면 젬3 업뎃하면 어느정도일지 궁금하네

ㅇㅇ 1(115.21) 2025-11-06 16:33:00

대학원생은 대체되었다

익명1(grocery8445) 2025-11-06 16:35:00

Weisser_Adler(adler1) 2025-11-06 16:40:00

현재 알파이볼브 베이스가 2.5플래시일텐데 3.0은 얼마나 좋아질까

ㅇㅇ 2(210.97) 2025-11-06 16:44:00

답글

2.0에서 2.5 플래시로 업뎃했음? 특갤에선 못본거 같은데 링크좀 줄수있음?

ㅇㅇ 1(115.21) 2025-11-06 16:48:00

답글

올해 2분기라 찾기 힘든데..

ㅇㅇ 2(210.97) 2025-11-06 16:49:00

답글

일단 이번 새 논문에서는 알파이볼브 베이스 모델이 뭔지 밝히지 않아놨음. 사실 2.5 flash 같은 공개된 모델이면 그냥 깠을 것 같은데, 특별히 제공한 내부 모델일 가능성이 꽤 있다고 생각됨.

글쓴 ㅇㅇ(121.178) 2025-11-06 17:01:00

답글

@글쓴 ㅇㅇ(121.178) 딥마인드 알파이볼브 공식문서로는 언어모델 flash+pro 조합으로 제공함 버전은 공개 딱히 안했는데 최초공개때는 2.0기반이였음 그당시 연구가 2.5나오기전 연구들이라

ㅇㅇ 2(210.97) 2025-11-06 17:05:00

낭만적특이점(next1842) 2025-11-06 16:44:00

잼3 알파이볼브면 시박 캬~ - 2025 AGI

초존도초(htr3c654r6ft) 2025-11-06 16:50:00

타오면 중국인인가 타오바오 들어본거 같은데

익명(sldoal991) 2025-11-06 16:51:00

답글

부모님이 홍콩. 결혼 후 호주 이민, 그리고 테렌스 타오가 태어남.

ㅇㅇ 4(121.158) 2025-11-07 01:34:00

테사기

익명(germany1595) 2025-11-06 16:52:00

천사다천사(jjtheman999) 2025-11-06 16:53:00

빛소별(agent0678) 2025-11-06 16:53:00

인간계 최고지능도 지능증폭기로 ai 쓰네 이제

익명(french2864) 2025-11-06 16:56:00

Moonchild(resolve0716) 2025-11-06 16:57:00

결국 아직도 Lean 이랑 융합은 갈길이 먼거네... - dc App

ㄴㄴ(rate8046) 2025-11-06 17:09:00

결국 현재로서는 유용한 도구 정도 수준인건가

익명(junk0781) 2025-11-06 17:24:00

연구 보조 역할만 해줘도 과학자들이 더 수준 높고 창의적인 일에 몰두할 수 있으니 가속화에 큰 도움

익명(both6480) 2025-11-06 17:31:00

fewweekslater(slim4567) 2025-11-06 17:36:00

답글

익명(junk0781) 2025-11-06 17:45:00

타오 레벨에겐 도구 이상은 못되나본데

익명(sguyff) 2025-11-06 18:03:00

asi2026(dart5404) 2025-11-06 18:07:00

타오 ai 겁내 좋아하는듯

ㅇㅇ 3(124.53) 2025-11-06 18:16:00

박사과정생까진 갔다..!!

익명(wanted7407) 2025-11-06 20:18:00

얘가 지금 지구에서 수학 1황이예요?

만창(donnie0) 2025-11-07 03:30:00

답글

맞음

익명(amazonia) 2025-11-07 12:48:00

[📪정보] 테렌스 타오, 'AlphaEvolve로 문제 푼 논문 공개'

댓글 32

[📪정보] 테렌스 타오, 'AlphaEvolve로 문제 푼 논문 공개'

댓글 32

다른 게시글

GPT5 인스턴트는 지능이 GPT3급인듯

테렌스 타오 'LLM, 연구 수준 작업 가속화 도달'

머스크 그로키피디아 입갤ㅋㅋㅋㅋㅋ

그래도 작년보다는 올해가 더 수확 많지 않냐?

지금이랑 2028년 11월이랑 모델들 성능차이 많이날까??

엄청나게 작은 전자장치를 이용해서 뇌를 '직접'치료할 수 있는 기술!

의외로 다들 몰랐던 사실

Gemini3 가 gpt5 high보다나을까?

2025wagmi가 온다...

MIT연구원들이 종양이 자폭하게 만드는 기술을 개발하다(ㄷㄷ)