5일 전 레딧 feltsteam 댓글(deepl 번역):


정확히 무엇이 출시되는지 전혀 몰랐지만 9 월 출시를 예측했습니다. 하지만 GPT-5는 2024년 중반, 아마도 2024년 3분기 초에 출시될 것이며, 알트만의 "양자 중력 해결"에 대한 정의에 따르면 AGI는 아니지만 여러 분야에서 전문가 수준이 될 것입니다. 환각은 더 이상 문제가되지 않을 것이며 곧 CL 덕분에 컨텍스트 길이가 중요하지 않을 것입니다 (GPT-5에 CL이있을까요, 그렇게 생각하지만 100 % 확실하지는 않지만 Jimmy Apples 2024는 CL, 자율 에이전트 (OAI가 1 년 이상 작업 해 왔음) 및 확장 될 것이라는 데 확실히 동의합니다) 그리고 그 기사가 나오기 전에 고비에 대해 이야기하고 있었는데 사람들이 제가 지미 애플스라고 말할 때까지 지미 애플스가 존재한다는 사실을 전혀 몰랐어요 ㅋㅋ. (아라키스를 GPT-5로 출시할지 확신할 수 없어 그냥 고비를 사용할 수도 있지만 그렇지 않다면 매우 실망할 것이고, 지미 애플스가 2024년에 125T 파라미터 모델을 출시할 예정이라고 하니 희망적입니다.


OpenAI가 작업하고 있는 두 가지 프로젝트가 있는데(물론 다른 프로젝트도 있지만 제가 알고 있는 것은 이 두 가지입니다), 고비와 아라키스(Arrakis)입니다. 고비는 멀티모달리티에 훨씬 더 중점을 둔 모델이고, 아라키스는 기본적으로 GPT-5이며 지미가 언급한 125T 매개변수 모델입니다. 하지만 아라키스는 단순한 단일 모델이 아니라 시스템에 가깝습니다. 세계 최고의 ML 엔지니어 100명을 모아 몇 달 동안 거의 독점적으로 개념을 개선하고 확장하는 작업을 수행하도록 한 다음, 그 프레임워크를 활용하는 작업으로 채워진 학습 배포를 통해 AI 모델을 처음부터 학습시키고 그 프레임워크에서 작동하도록 한다면 BabyAGI는 어떤 모습일지 상상해 보세요.


하지만 저는 그저 무작위 리디렉터일 뿐이므로 제가 하는 모든 말을 소금 한 알로 받아들이세요. 내가 말하고 싶은 것은 나를 전혀 믿지 말고 우리가 현재 어디에 있는지 또는 1 년 전 OAI가 어디에 있었는지 생각할 가능성이 있다고 생각하십시오. 또한 OAI가 2022년 10월에 125T 매개변수를 달성할 수 있었던 것은 원시 컴퓨팅이 아닌 훨씬 향상된 컴퓨팅 효율성 덕분이라고 말씀드리고 싶습니다.


먼저 알트만이 자신의 정의를 바로잡아 주셨으면 합니다. 그는 "양자 중력을 해결하지 못할 것"이기 때문에 GPT-5와 GPT-6가 AGI가 될 수 없다고 말했습니다(물론 저도 동의하지만, 그런 종류의 문제를 해결할 수 있을지 의문입니다. GPT-5는 아라키스를 사용한다면 인간의 전문가 능력에 근접할 것이지만 그 이상은 아닐 것입니다. GPT-6의 능력은 어떨지 모르겠습니다. 그리고 제가 아는 한 고비는 멀티 모달리티에 훨씬 더 집중하고 있고 제미니에 대응하여 출시 할 수 있기 때문에 GPT-4보다 더 나아지지 않을 것이라고 생각하지 않습니다. GPT-5 수준의 개선이 아니라 GPT-4보다 낫지 않을 것이라는 의미는 아닙니다. 그러나 인간 전문가가 양자 중력을 알아낼 수 없지만 미래의 시스템이 가능하다고 가정하면 시스템 능력이 후암 전문가를 넘어선다고 주장 할 것이며 그 시스템을 초 지능이라고 부를 것입니다.


0f89ef74fd811b8f479ef7b01df434734ea209c4b01ce9b8211900f443a254fb5b01249c5816ac8045c6


작년 10월에 125조개 파라미터 훈련 완료는 좀 놀랍네..


고비는 제미니 대응 모델 gpt4-v 보다는 좋지만 gpt5 만큼은 아님