처음부터 강화학습으로 뭘 해내겠다 이런게 아니라


알고리즘 만들고 아키텍처 만들고나서 쥐어짜내서 조금이라도 더 업글시키겠다 이럴 때에만 강화학습 쓰는데



강화학습이라는 아이디어 자체는 유용하지만 강화학습 대표 알고리즘 자체가 유용한지는 잘 모르겠음