진화알고리즘은 적합도 점수가 높은 개체를 선택하고
강화학습은 보상점수합이 높은 행동을 선택하잖아요
둘다 점수를 최대화하는걸 선택한다는 점이 같지않나요?
그리고
진화가 적합도 점수가 높은 개체를 선택하면, 그렇게 선택된 개체들은
점수를 최대화하려는 경향을 가지고있는 개체들이 선택되는데
이러면 진화가 강화학습개체를 만들어낸다는 결론이 나는거 같아요
진화알고리즘은 적합도 점수가 높은 개체를 선택하고
강화학습은 보상점수합이 높은 행동을 선택하잖아요
둘다 점수를 최대화하는걸 선택한다는 점이 같지않나요?
그리고
진화가 적합도 점수가 높은 개체를 선택하면, 그렇게 선택된 개체들은
점수를 최대화하려는 경향을 가지고있는 개체들이 선택되는데
이러면 진화가 강화학습개체를 만들어낸다는 결론이 나는거 같아요
그렇게 따지면 모든 학습 알고리즘의 목표는 다 똑같음. 방법론이 바뀌면 장단점이 다르고 적용분야도 갈리는데 어떻게 본질적으로 같겠어 - dc App
효율성면에서 차이가 크지않을까싶네요 탐색공간을 처음엔 랜덤하게 돌면서 좀더 유리한 방향으로 계속 확률값을 조정해나간다는 것에서 같지요 하지만 이건 최적화문제를 브루트포스로 푸는 기본적인 방법이라 공통적이라는게 크게 의미가 있지않아요. 마치 곱셈 그거 덧셈이랑 같잖아라고 하는 거죠...
모든 생물은 세포다 정도의 이야기인거 같아요
학습측면에서는 유전 알고리즘이 경사하강법들 보다 표현할 수 있는 범위는 큰 대신에 수렴속도가 늦어요
뜬금없지만 모든 생물은 세포로 구성되는건 맞음
같은 논리로 모든 알고리즘은 FFN이랑 다를 바가 없겠죠?
ffn이 뭐죠 - dc App
순전파 신경망이요.
다를바가 없는게 틀렸나요? - dc App
틀린 건 아니지만 너무 당연한 말 같아서요. 마치 '내일 비 올 확률은 0%에서 100% 사이입니다' 같이요.
접근법에서 유사하긴 한데, 강화학습은 가치평가를 한다는 점에서 차이가 있음.