39afd128f6d437b463bac48a05c536287316b23d7ab49ccccc96e2228463f80dcd101dcc892aa622790c858e416d

RNN, LSTM까지는 별로 알아야 하는 지식도 없고 그냥 구조 그대로 받아들이면 됐는데

transformer를 공부하려고 하니 attention과 거기에 딸린 이해해야 할 개념이 너무 많은 것 같아..


꽤나 전 부터 Attention in all you need를 읽으려고 했는데 며칠 붙잡고 있어도 도무지 이해가 되질 않아서

Seq2Seq 부터 공부해서 이제야 Cheng et al., 2016 읽는 중임 ㅋ