머숨 미러

https://github.com/lucidrains/llama-qrlhf

GitHub - lucidrains/llama-qrlhf: Implementation of the Llama architecture with RLHF Q-learning

Implementation of the Llama architecture with RLHF + Q-learning - GitHub - lucidrains/llama-qrlhf: Implementation of the Llama architecture with RLHF + Q-learning

github.com

딥러닝 관련 새로운 기술이나 논문 나오면 ㅈㄴ빠른속도로 구현하는걸로 유명한 사람인데

이번에 Q스타 루머보고 LLaMA에 Q러닝 붙여서 구현하고있나봄 ㅋㅋㅋ

ㄷㄷ 지리누

dd(rladmstn78) 2023-11-24 16:04:00

오 이거 근들갑으로 안끝났으면 좋겠네 로컬도 시스템적 발전이 필요한 상황이긴했어 - dc App

익명(180.71) 2023-11-24 16:05:00

read me만 작성했는데 61 스타 받노ㅋㅋㅋㅋ

익명(180.65) 2023-11-24 16:05:00

답글

ㄷㄷ 당장읽어;;

dd(rladmstn78) 2023-11-24 16:07:00

이게 오픈소스의 힘이냐?

익명(59.9) 2023-11-24 16:42:00

Qstar가 QLearning이 맞는지조차 모르고 맞다 해도 구체적 방법론을 전혀 모르는데 대체 뭘 구현한다는건지..

익명(175.113) 2023-11-24 16:49:00

근데 만약에 이렇게 해서 되면, 진짜 open 소스로 풀지 않고 개발하는 게 안전을 위한다는 당위가 성립되는 것 같음.

익명(175.206) 2023-11-24 17:02:00

큐러닝 자체는 쌉고전 강화학습 알고리즘인데

blockswan(221.167) 2023-11-24 18:01:00

이 사람도 뭐 기반 논문이 있어야 구현 가능하지 않나

익명(175.194) 2023-11-24 18:09:00

잔디깔린거보소 ㅋㅋㅋ

익명(211.109) 2023-11-24 18:14:00

오픈소스가 고맙긴한데 이젠 좀 위험한거 같음

익명(211.248) 2023-11-24 19:31:00

나도 저거 복붙하면 만들수있냐

익명(124.58) 2023-11-24 19:52:00

ㄷㄷㄷ

익명(211.222) 2023-11-24 19:55:00

이 사람 대단하지

초존도초(htr3c654r6ft) 2023-11-24 23:08:00

[일반] lucidrain 깃허브에 RLHF +Q러닝 올라옴 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

댓글 14

[일반] lucidrain 깃허브에 RLHF +Q러닝 올라옴 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

댓글 14

다른 게시글

나쁜색기

그록 써본애들 있냐?

AGI 떡밥으로 흥분되는 와중에도 절대 잊으면 안될 분

특붕이들아 너네 국민연금 내냐?

gpt 개그 못하는게 제일 아쉽다

데이터백업하니까 약간 속은거같은 기분이야 ㅋㅋㅋㅋ

지금 나오는 Q스타 딥마인드 뮤제로랑은 아예 다른거?

이젠 나만의 작은 특갤은 사라졌네

agi 올때까지 생존하면 돼는거지??

알트만,지미애플:gemini나오면 뒤진다