티처 모델보다 크기가 35%작은 스튜던트 모델에 지식 정제하고, 8비트 양자화하는데 성능이 1~2% 더 올라갔다는거 보고 아무리 생각해봐도 쉽게 이해되지 않는데 왜그런거임?
[일반] 지식 정제 + 양자화하는데 왜 성능이 더 높아질 수 있는거임?
딥부이(220.86)
2024-11-19 21:37:00
추천 0
댓글 1
다른 게시글
-
lwm은 비전 확장(공간지능) 아니면 lmm의 확장임??
[2][일반] 익명(223.39) | 24.11.19추천 0 -
선생님들 내년 30살 대학입학하려고하는데..
[11][일반] 딥부이(112.149) | 24.11.19추천 0 -
진짜로 이 정도로 공부하면 뭘 할 수 있으려나..?
[13][일반] 딥부이(182.228) | 24.11.19추천 0 -
다들 GAN 뭐라고 부름?
[5][일반] 딥부이(223.39) | 24.11.19추천 0 -
학부연구생 시작했는데
[3][일반] 익명(59.25) | 24.11.19추천 0 -
o1 preview 나오고 난 후 질의응답한거중에 재밌었던거
[일반] 익명(vital7966) | 24.11.18추천 0 -
뽕취해서 뉴립스 오랄부터 하지말고
[8][일반] 양금(compete7627) | 24.11.18추천 0 -
이거는 중요한 논문 아님?
[14][❓질문] 익명(vital7966) | 24.11.18추천 0 -
갤 1주일동안 질문글 보니
[1][일반] 양금(compete7627) | 24.11.18추천 0 -
딥러닝 개초보자들 질문전에
[6][일반] 양금(compete7627) | 24.11.18추천 0
오버피팅완화