이거 순서 뒤집어서 컨볼루션-렐루-배치로 바꾸니까 오히려 성능이 올라가던데 이론적인 근거 같은게 있음? 하이퍼파라미터랑 데이터셋 바꿔가면서 확인해봐도 뒤짚은 쪽이 일관적으로 높게 나오던데 원래 이런거임??- dc official App
수학적으로 생각하면 당연한거임 - dc App
평균 이하가 렐루땜에 날라가서 글케 되는거임? - dc App
배치놈이면 베타때문에 평균이 0은 아닐텐데
같은 내용으로 이미 논문 있었던거 같은데 - dc App
논문은 아니었고 github.com/ducha-aiki/caffenet-benchmark/blob/master/batchnorm.md - dc App
ㄱㅅㄱㅅ - dc App
님 A대 다니죠