Batch Normalization: Accelerating Deep Network Training by
Reducing Internal Covariate Shift
위 논문 리뷰했는데 배치 정규화가 드롭아웃의 필요성을 줄일수 있다고언급하는데
어떤 원리로 배치 정규화가 과적합 문제에 기여하는지 혹시 아는 사람있음?