당장 책이나 인터넷 강의같은 곳에서 backpropagation을 다루는건 mlp나 logistic regression 예시 밖에 못봤는데 실제 모델에서 사용되는 cnn이나 transformer의 backpropagation은 굳이 알 필요 없음? 예전부터 공부하다가 궁금한걸 답을 찾지 못하고 넘어갔었는데 계속해서 cnn의 backpropagation은 어떻게 되는지 궁금증이 생기네...
그냥 너무 디테일하게 들어가지말고 수치미분 대신 계산그래프로 신경망을 훈련하는구나 하고 넘어가면 되는건가?
그냥 너무 디테일하게 들어가지말고 수치미분 대신 계산그래프로 신경망을 훈련하는구나 하고 넘어가면 되는건가?
알아봤자 득될게 없을듯
cnn도 일종의 sparse한 mlp임
https://deeplearning.cs.cmu.edu/F21/document/recitation/Recitation5/CNN_Backprop_Recitation_5_F21.pdf
대충 검색하면 나오는데
역전파가 뭔지만 알면 되는데