우선 트랜스포머니 RNN이니 이런건 잘모르겠구요
그냥 신경망하나를 가져오고
소설을 일정한 길이의 블록으로 나눠요 왜냐하면 신경망의 입력층의 크기에 한계가 있기 때문이죠
그리고 그 블록들중
블록1이 있다면
신경망에 블록1을 입력시키고 정답으로서의 출력에 블록2를 넣고 역전파로 학습시키는거에요
이렇게 반복하면 어떻게되나요?
우선 트랜스포머니 RNN이니 이런건 잘모르겠구요
그냥 신경망하나를 가져오고
소설을 일정한 길이의 블록으로 나눠요 왜냐하면 신경망의 입력층의 크기에 한계가 있기 때문이죠
그리고 그 블록들중
블록1이 있다면
신경망에 블록1을 입력시키고 정답으로서의 출력에 블록2를 넣고 역전파로 학습시키는거에요
이렇게 반복하면 어떻게되나요?
어그로가 수준급
뭐가 어그로?
rnn 으로 쓰면 병목현상 일어나서 소설 자체를 제대로 학습을 못하는데 왜...트포를 하십셔 허깅페이스에 좋은 모델 차고 넘치니깐 모델 가져와서 파인튜닝이나 하세요
RNN 뭔지모른다고했는데요
챗지피티에물어보세요.
네, 그 방법은 신경망을 사용해 소설책을 학습시키는 기본적인 접근 방식입니다. 요약하면 다음과 같습니다:소설을 블록으로 나누기: 소설을 일정 길이의 텍스트 블록으로 나눕니다. 이렇게 하는 이유는 신경망의 입력 크기에 제한이 있기 때문입니다.입력과 출력 설정: 각 블록을 신경망의 입력으로 넣고, 그 다음 블록을 정답(출력)으로 설정합니다.역전파 학습: 신경망이 입력 블록을 보고 예측한 결과와 실제 출력 블록을 비교하여 오차를 계산하고, 이 오차를 바탕으로 가중치를 조정합니다. 이 과정을 반복합니다.이렇게 반복하면 신경망은 주어진 블록을 보고 다음에 어떤 블록이 올지 예측하도록 학습됩니다.결과적으로 신경망은 소설의 흐름과 패턴을 이해하게 되어, 소설의 다음 부분을 예측하거나 유사한 스타일로 새
로운 텍스트를 생성하는 데 능숙해질 수 있습니다.