viewimage.php?no=24b0d769e1d32ca73ded8ffa11d028313550f9fb3f9dac8b24082c81c9525a425dd9f897b5e397910adbf6d2f625664471e94b15a4a2fd1df125b6de51fff3f509b124a2be12ebe2dc1b2ef4d0ecdcf66c1ff0bb














사람은 고양이를 구분해내기 위해서

고양이 사진을 수만개를 보면서 패턴을 찾아내는

식으로 학습하지 않는다.

게다가 사람은 기본적인 개념을 본것만으로도 좀 더

복잡한 상황에 그걸 응용하는게 가능하다



그게 기존 알고리즘의 한계였다면 이젠 새로운

메타 학습 알고리즘을 통해 인공지능이 스스로의

가치체계를 만들어내 인간과 좀 더 흡사한 학습 방법을

가지게 되도록 발전한것이다.


보상을 극대화한다는 목적.

그걸 위해 사물과 접촉하며 스스로의 가치체계를 만들어나간다.

"배우는 방법을 스스로 배운다. "


그러다보니 그저 실험적인 2D환경에서

도형 몇개와 접촉해본 경험밖에 없는 이 AI를

곧바로 훨씬 더 복잡한 환경인 아타리 게임 14개에

에 곧바로 투입해도 얼마 지나지 않아

스스로 룰을 발견해내고 곧 초인간적인 게임 실력에 도달한것이다


아직 초기단계지만 잘만 발전하면 응용폭이 넓어보인다

알고리즘 자체를 만드느라 수년 소비하기보단

그냥 훈련하기 적합한 환경이 되도록 최적화에 집중하면 되니까