CPU : AMD Ryzen 5950X/ GPU : GeForce RTX 3090
Pytorch
Dataset : 16열 3M행 (sample 수로 하면 data는 3M개)→ csv 파일사이즈로 700MB
DATALODAER worker 16 pin memory true
network: LSTM 2 layer + FCNET 16[input]→32→16→3
batch 64
1epoch에 10분 필요한데 이거 정상인가요?
CPU : AMD Ryzen 5950X/ GPU : GeForce RTX 3090
Pytorch
Dataset : 16열 3M행 (sample 수로 하면 data는 3M개)→ csv 파일사이즈로 700MB
DATALODAER worker 16 pin memory true
network: LSTM 2 layer + FCNET 16[input]→32→16→3
batch 64
1epoch에 10분 필요한데 이거 정상인가요?
GPU 사용량은 50~60 밖에 안나옵니다;;
배치 사이즈 늘려보세요
gpu사용량은 정상인것 같고 더 많은 사용량을 원하면 배치 사이즈 늘리면 아마 더 빨리 될것 같네요.
그렇긴한데 일반화 성능이 떨어져서.. 이게 정상이라면 어쩔 수 없네요 감사합니다
distributed parallel ㄱㄱ
GPU가 하나입니다!
배치늘려도될걸 저거24gb짜리gpu자너 얼마사용하는지 보고 늘려봐
한 에폭 당 스텝 수가 3m / 64 = 약 4.7만에 모델도 LSTM이라 그 안에서도 이터레이트를 돌아야 해서 에폭 당 로그 찍으면 그렇게 걸리는 거임. 에폭이 아니라 일정 스텝마다 로그 찍게 하던지 아니면 배치를 늘리셈.