모델 클래스 설계자란 직군은 처음 듣네


그리고 cuda다루는 거랑 모델...? 아마 모델 아키텍쳐 얘긴가?


cuda는 저수준 연산이고 모델 아키텍쳐 짜는 건 pytorch에서 해준대로 고수준에서 짜는 건데


모델 클래스 설계자라면서 cuda에 대해 엄청 잘 아는 것처럼 얘기하는 건 뭐임?


난 아키텍쳐 200개 넘게 구현해봤는데 cuda 하나도 모르는데?


글고 요즘은 락칩도 트랜스포머 디코딩까지 지원해줘서 최신 락칩 NPU로 트랜스포머도 돌릴 수 있어


또, 맥도 퀀타이즈 안하고 학습 돌리면 10배까진 차이 안나고 3~5배 정도임


실험 많이하는 사람 아니면 맥 정도로도 충분하지 사실