[일반] 지식 정제 + 양자화하는데 왜 성능이 더 높아질 수 있는거임?

딥부이(220.86) 2024-11-19 21:37:00 추천 0

티처 모델보다 크기가 35%작은 스튜던트 모델에 지식 정제하고, 8비트 양자화하는데 성능이 1~2% 더 올라갔다는거 보고 아무리 생각해봐도 쉽게 이해되지 않는데 왜그런거임?