개빠르네
[일반] 나노gpt 세계기록 <- 왤케 잘줄어드냐 ㄷㄷㄷ
귀가있는로봇의..(function8845)
2026-01-08 13:51:00
추천 1
댓글 9
다른 게시글
-
ai 파쿠리 해명은 업스테이지 만큼은 보여줘야 해명아닐까
[일반] 익명(211.195) | 01.08추천 1 -
아키텍처는 가져다 쓰는건 별문제아님
[6][일반] Azurespace(azurespace) | 01.08추천 2 -
임상 실험 지표가 개선될 때까지 재작성하는 에이전트
[12][📪정보] 행복한천국..(adjust7431) | 01.08추천 25 -
한국 망한다며 출산율 고령화 타령하는 애들은 뭐냐
[16][일반] OpenAl(skirt8272) | 01.08추천 0 -
한국은 agi나오면 어떻게 될지 그냥 생각해봤는데
[2][일반] 익명(14.56) | 01.08추천 0 -
재미나이 인성 이상함
[6][일반] 운암산끝말..(8897ekdldi) | 01.08추천 0 -
업무용으로 AI 쓰고있는데 각 AI별 장단점 명확히 파악함
[9][일반] 익명(49.168) | 01.08추천 1 -
아니 코덱스 5.2 언제주냐고
[4][일반] harin(clever0810) | 01.08추천 0 -
근데 kai가 약간 사업방향성은 맞는데 너무 성급하지않냐
[2][일반] POKUDONS(allow4383) | 01.08추천 0 -
미국이 진짜 무서운게
[일반] 익명(121.161) | 01.08추천 2
여기 레포 ㄹㅇ 재밌더라 실험적인 거 많이하고
별 기묘한 구조로 시간 줄이던데 ㅋㅋ 이런거 100개 발견하면 1개는 큰 모델에도 도움되겠지 ㅋㅋ
이거 보고있으면 아이디어 기발하다 싶은거도 많고 커널 로우레벨에서 최적화하는거 ㄹㅇ 고수들 많음 ㅋㅋㅋ
@Azurespace 커널 로우레벨 건드리려면 C ㅈ고수들인건가?
@ㅇㅇ GPU 커널 최적화에서 C/C++는 가장 쉬운 부분이고.. GPU의 내부 구조와 Collective Communication과 Model Optimizer(Adam, Muon)을 다 꿰고 있어야 함.
@Azurespace 오우 ㄷㄷㄷ 저 정도 레벨들은 수학부터 컴퓨터 구조도 다 꿰고있어야하는구나 ㄹㅇ 종합인재네 알려줘서 ㄱㅅㄱㅅ
초소형 gpt 만들기 같은건가
정해진 사양의 서버에서 특정 크기의 gpt 가장 빠르게 학습시키기 챌린지 같은거야
@귀가있는로봇의노래 오 ㄱㅅㄱㅅ