사람은 고양이를 구분해내기 위해서
고양이 사진을 수만개를 보면서 패턴을 찾아내는
식으로 학습하지 않는다.
게다가 사람은 기본적인 개념을 본것만으로도 좀 더
복잡한 상황에 그걸 응용하는게 가능하다
그게 기존 알고리즘의 한계였다면 이젠 새로운
메타 학습 알고리즘을 통해 인공지능이 스스로의
가치체계를 만들어내 인간과 좀 더 흡사한 학습 방법을
가지게 되도록 발전한것이다.
보상을 극대화한다는 목적.
그걸 위해 사물과 접촉하며 스스로의 가치체계를 만들어나간다.
"배우는 방법을 스스로 배운다. "
그러다보니 그저 실험적인 2D환경에서
도형 몇개와 접촉해본 경험밖에 없는 이 AI를
곧바로 훨씬 더 복잡한 환경인 아타리 게임 14개에
에 곧바로 투입해도 얼마 지나지 않아
스스로 룰을 발견해내고 곧 초인간적인 게임 실력에 도달한것이다
아직 초기단계지만 잘만 발전하면 응용폭이 넓어보인다
알고리즘 자체를 만드느라 수년 소비하기보단
그냥 훈련하기 적합한 환경이 되도록 최적화에 집중하면 되니까
https://singularityhub.com/2020/07/26/deepminds-newest-ai-programs-itself-to-make-all-the-right-decisions/
역시 오늘날 살아있는 인류중 가장 강인공지능에 근접한 데미스 하사비스 ㄷㄷ
오우쉣더뻑 - dc App
이거지