이전문장을 입력하면 다음단어를 예측한다고 알고있는데
만약 멀티모달이라면
이전상황을 입력하면 다음상황을 예측하게 되는거 아닌가요?
이런 상황예측능력이 지능의 본질 아닌가요?
그럼 상황예측만으로 AGI달성가능할까요?
아는거 좆도없는 고졸백수입니다
이전문장을 입력하면 다음단어를 예측한다고 알고있는데
만약 멀티모달이라면
이전상황을 입력하면 다음상황을 예측하게 되는거 아닌가요?
이런 상황예측능력이 지능의 본질 아닌가요?
그럼 상황예측만으로 AGI달성가능할까요?
아는거 좆도없는 고졸백수입니다
그거 가지고는 AGI 도달까진 아직 갈 길이 멀다고 생각함
정확히 말하면 다음에 올 토큰을 예측하는거임. 근데 그 토큰이 텍스트이기만 하면 일반적인 언어모델이고 이미지일수도 있으면 멀티모달이 되는거고