숨터

018ee40bcb9c28a8699fe8b115ef046bfee0847b

기존의 NMT with attention 논문에서는 encoder와 decoder 사이에서의 attention을 구했다면 LSTMN에서는 encoder 내에서의 attention을 구하고 이를 LSTM에서 cell state를 보관하는 배열을 만들어서 저장하는 방식으로 구현했네

이 내용 보자마자 바로 의자 밀치고 일어나서 공중제비 세 바퀴 돌았다

이런 구조는 직관으로 떠올리는건지 아니면 철저한 hidden state나 activation 또는 output의 분석을 통해서 일어나는 건지 궁금하다...

직관만으로 이런 구조를 떠올렸다면.. ㅎㄷㄷ

[일반] LSTMN 아이디어 개쩐다

댓글 0

[일반] LSTMN 아이디어 개쩐다

댓글 0

다른 게시글

딥러닝 논문 학습을 위한 유용한 자료 1

Transformer 엄청 어렵다..

이런씨빨 글카 존나 비싸노

스타트업에서 BERT 하는거 의미있어?

힌트 가능합니까?

C++말고 C로 된 가이드는 없냐?

파이토치에서 import keyboard 에러 해결법 아는분??

시발시발

딥러닙 개쌉쌉초보임 형님들 굽신굽신 알려주세요

bert나 albert vocab 만들때 질문