황회장이 그록5 매개변수 7조개라고 생각한다 함
그리고 딥시크++라는 모델은 10조개의 매개변수라 함
딥시크 ++은 뭐임?
잘모르겠음
루빈 때려박아도 7T 그대로 서비스하면 일론 파산할듯
콜로서스2로 돌리면 가능하긴함
에게? 제 예상보단 적네요. 신형 gpu들은 10배씩 좋아지는데 왜 매개변수는 찔끔씩 늘어나는거죠??
이미 oai에서는 23년에 175조개 파라미터모델 아라키스를 개발했음 근데 전성비가 ㅈ구려서 폐기함 그냥 지금처럼 추론컴퓨팅에 자원배분하는게 훨씬 더 전성비가 좋아서 매개변수 올리는 것보다는 추론모델 개발에 더 힘쓰는 거임
@메론맛콜라가먹고싶어 지금 hbm이고 데센이고 전력부터 생산해야 되는구나..
저번에 머스크가 직접 6조개인가 7조개라 한거 보면 맞는듯?
머스크재산보단작네
딥시크 ++은 뭐임?
잘모르겠음
루빈 때려박아도 7T 그대로 서비스하면 일론 파산할듯
콜로서스2로 돌리면 가능하긴함
에게? 제 예상보단 적네요. 신형 gpu들은 10배씩 좋아지는데 왜 매개변수는 찔끔씩 늘어나는거죠??
이미 oai에서는 23년에 175조개 파라미터모델 아라키스를 개발했음 근데 전성비가 ㅈ구려서 폐기함 그냥 지금처럼 추론컴퓨팅에 자원배분하는게 훨씬 더 전성비가 좋아서 매개변수 올리는 것보다는 추론모델 개발에 더 힘쓰는 거임
@메론맛콜라가먹고싶어 지금 hbm이고 데센이고 전력부터 생산해야 되는구나..
저번에 머스크가 직접 6조개인가 7조개라 한거 보면 맞는듯?
머스크재산보단작네