ㅇㅇ 확실한 건 없는데 gpt 3 에서 파라미터 수 늘렸더니 유의미한 결과가 있어서 - dc App
익명(125.128)2021-08-11 18:04:00
모델이 커지고 학습량이 늘어나면 스케일링 법칙에 의해 오차가 계속 떨어지게 되는데 오차가 특정 수준에 도달하려면 모델이 인간의 상식이나 추론능력을 획득해야 하는 것으로 보임
대략 이러한 이유로 초거대모델에 멀티모달 데이터로 때려박으면 인간 이성을 AI에서 구현할 수 있을거라 보는거임
익명(125.191)2021-08-11 18:15:00
그걸로 AGI개발한다고 말한 사람은 없음. 그냥 멀티모달 초거대 모델 만들다보면 내부적으로 어떤 과정을 거치든, 그 과정이 진짜 지능적이든 아니든, 다목적으로 높은 성능을 내는 AI를 만들 수 있을 거 같으니 AI를 세부조율할 고도의 기술력이 없는 기업들 입장에서는 이미 나와있는 오픈소스 아키텍처랑, 구할 수 있는 데이터랑, 돈 쏟아부어서 구축할 수 있는 컴퓨터 시스템이랑 합치면 만들 수 있는 것이니 도전해보는거겠지.
익명(1.239)2021-08-11 18:17:00
답글
스케일링 이론은 규모를 키우면 질적인 성장도 있고, 그 이론적 상한선이 현재로써는 보이지 않는다는 거고, 꼭 딥러닝 뿐만 아니라 다른 거대 복잡계에서도 발견되는 특성임. 근데 과연 그 추세가 AGI라는 목적을 달성하는데 충분한지, 아니면 속도, 성능, 품질, 다목적성 등이 증가하기는 하지만 여전히 허점이 많은, 구멍 숭숭 뚫린 거대 시스템일 뿐인지는 알 수 없지. 질적 향상 = 범용성 달성은 아니니까.
ㅇㅇ 확실한 건 없는데 gpt 3 에서 파라미터 수 늘렸더니 유의미한 결과가 있어서 - dc App
모델이 커지고 학습량이 늘어나면 스케일링 법칙에 의해 오차가 계속 떨어지게 되는데 오차가 특정 수준에 도달하려면 모델이 인간의 상식이나 추론능력을 획득해야 하는 것으로 보임 대략 이러한 이유로 초거대모델에 멀티모달 데이터로 때려박으면 인간 이성을 AI에서 구현할 수 있을거라 보는거임
그걸로 AGI개발한다고 말한 사람은 없음. 그냥 멀티모달 초거대 모델 만들다보면 내부적으로 어떤 과정을 거치든, 그 과정이 진짜 지능적이든 아니든, 다목적으로 높은 성능을 내는 AI를 만들 수 있을 거 같으니 AI를 세부조율할 고도의 기술력이 없는 기업들 입장에서는 이미 나와있는 오픈소스 아키텍처랑, 구할 수 있는 데이터랑, 돈 쏟아부어서 구축할 수 있는 컴퓨터 시스템이랑 합치면 만들 수 있는 것이니 도전해보는거겠지.
스케일링 이론은 규모를 키우면 질적인 성장도 있고, 그 이론적 상한선이 현재로써는 보이지 않는다는 거고, 꼭 딥러닝 뿐만 아니라 다른 거대 복잡계에서도 발견되는 특성임. 근데 과연 그 추세가 AGI라는 목적을 달성하는데 충분한지, 아니면 속도, 성능, 품질, 다목적성 등이 증가하기는 하지만 여전히 허점이 많은, 구멍 숭숭 뚫린 거대 시스템일 뿐인지는 알 수 없지. 질적 향상 = 범용성 달성은 아니니까.