https://github.com/lucidrains/llama-qrlhf
GitHub - lucidrains/llama-qrlhf: Implementation of the Llama architecture with RLHF Q-learning
Implementation of the Llama architecture with RLHF + Q-learning - GitHub - lucidrains/llama-qrlhf: Implementation of the Llama architecture with RLHF + Q-learning
github.com
딥러닝 관련 새로운 기술이나 논문 나오면 ㅈㄴ빠른속도로 구현하는걸로 유명한 사람인데
이번에 Q스타 루머보고 LLaMA에 Q러닝 붙여서 구현하고있나봄 ㅋㅋㅋ
ㄷㄷ 지리누
오 이거 근들갑으로 안끝났으면 좋겠네 로컬도 시스템적 발전이 필요한 상황이긴했어 - dc App
read me만 작성했는데 61 스타 받노ㅋㅋㅋㅋ
ㄷㄷ 당장읽어;;
이게 오픈소스의 힘이냐?
Qstar가 QLearning이 맞는지조차 모르고 맞다 해도 구체적 방법론을 전혀 모르는데 대체 뭘 구현한다는건지..
근데 만약에 이렇게 해서 되면, 진짜 open 소스로 풀지 않고 개발하는 게 안전을 위한다는 당위가 성립되는 것 같음.
큐러닝 자체는 쌉고전 강화학습 알고리즘인데
이 사람도 뭐 기반 논문이 있어야 구현 가능하지 않나
잔디깔린거보소 ㅋㅋㅋ
오픈소스가 고맙긴한데 이젠 좀 위험한거 같음
나도 저거 복붙하면 만들수있냐
ㄷㄷㄷ
이 사람 대단하지