액션값 이산화시켜서 단순하게 하고, PPO 버리고 DQN 쓰니까 성능 조금 더 나아지긴 하네
[일반] DQN이 PPO보다 성능 더 좋게 나올 수도 있냐?
익명(125.251)
2025-05-05 20:09:00
추천 0
댓글 2
다른 게시글
-
RAG 플로우 개발하고 있는데 BGE-M3 요즘 쓰냐?
[5][일반] 익명(125.251) | 25.05.05추천 0 -
에이다 러브레이스 걍 1800년대 특갤러 아님?ㅋㅋ
[5][일반] 익명(121.128) | 25.05.05추천 0 -
추론모델 1세대가 O1, 2세대가 O3, 잼2.5라고 하면
[1][일반] 익명(shore1232) | 25.05.05추천 0 -
허스키한 목소리로 해달라하면
[일반] 익명(famous0561) | 25.05.05추천 0 -
그록 3.5 오늘 안에는 나오냐?
[1][일반] -불나방-(ufo417) | 25.05.05추천 0 -
Gpt, 젬민이, 로컬 등 활용
[일반] 454Radio(112.165) | 25.05.05추천 0 -
OAI CPO, '오픈소스 모델은 한 세대 이전 수준'
[6][📪정보] 익명(121.178) | 25.05.05추천 15 -
에이다 러브레이스는 AI업계에서 존중받냐 욕먹냐
[5][일반] 익명(upside2932) | 25.05.05추천 0 -
Agi몇단계부터 체감됌??
[7][일반] 익명(a0xqw9eifhl5) | 25.05.05추천 0 -
코딩 1황 2.5pro 아닌가
[4][일반] 젬황(disabled0781) | 25.05.05추천 0
dqn, ppo 각 알고리즘이 어느 분야에 적용하느냐에 따라 장단점이 있다곤 알고있음
ㅇㅇ 여러가지 해보는게 좋음