실제로 여러 데이터셋에 쓸만한거임???


아니 결국 읽어보면 스코어 계산 띡 해서 멀티헤드 어쩌구 이거구만..


스코어 계산하는거도 행렬곱에 소프트맥스면서...