1. 구글 인피니 어텐션 ( i/o 에서 보여주었던 컨텍스트 캐싱과 똑같은 기술인듯)
2. 한텔 파이먼 경로적분
https://arxiv.org/abs/2405.04620
나도 2022년도 부터 계속 생각했던 접근법 이었는데 it공돌이 들이 이과적인 방법으로 구현해 줘서 고맙긴함
간단하게 설명하자면
현재 장기기억을 유지하는 기술인 컨텍스트 요약 기술은 입력 토큰 공간내에서 연산을 하는 한계성 때문애 아무리 요약이 함축되어있다고 한들 결국은 한계가 올 수 밖에 없음
하지만 이 두가지 기술은 이전의 정보들이 담겨있는 이전 어텐션 정보들을 버리지 않고 '압축 메모리' 에 통합하게됨 여기서 '압축 메모리' 는 컨텍스트 요약 을 담고 있는 토큰 공간을 의미하는 것이 아니라 인풋된 정보들을 처리하는 어텐션 계층구조내의 학습데이터에 인풋할때 마다 정보값들을 업데이트 하며 저장한다는 개념이 맞는듯 (어떻게 보면 원시적인 실시간 학습의 형태를 띄고있음)
이 말이 사실이라면 컨텍스트 길이를 연산리소스만 충당된다면 무한정 늘이는 것이 가능하게 됨
다만 한계점은 끊임없는 지속학습에 필요한 재학습에서 발생 되어지는 연산비용이 커지는것이 단점일 듯
가정으로 보급되기엔 하드웨어적 한계가 있고 대규모 정보를 한꺼번에 처리해야 되는 기업에 먼저 큰 비용의 지불관계를 거치고 제공될 듯?
저걸 인간 뇌에 적용하면 초천재 되는거 쌉가능? - dc App
인간 뇌는 저거보다 더 효율적이다
큰 정보값들에서 발생되어지는 특정한 패턴을 찾아내고 그것을 공식화하고 장기기억에 저장함으로서 필요없는 쓰레기 데이터들을 선별하고 필터링 해냄
그렇게 뛰어나다면서 정작 내 뇌 성능은 이따구임? ㅠ - dc App
같은 인간사회에서의 상대적인 비교때문애 너가 그렇게 느끼는 거임 원숭이랑 비교해보셈
ㄴ 뭔가 상처받을 것 같은데 ㅋㅋ
ㄴㄴ이 나쁜놈앗! - dc App
개추인데
정보글 개추
이런 글 좋다... 앞으로 이런 글들 더 많아졌으면
두번째는 지금 클라우드 방식으론 안되는거 아녀?
2에 논문 트위터에서 아무 관심도 없던데... 흠.. - dc App
저게 결국은 구글에서 말하는 인피니 어텐션과 동일한 맥락의 공식을 가지고 있기 때문임 그것이 우연히 파이먼 경로적분의 공식과 일치성을 띄고 있을뿐
며칠전부터 이 논문 홍보하는 사람있던데 ㅋㅋ - dc App
본인임? - dc App
이 논문 저자가 둘다 한국인이네
제미나이 1.5 프로도 손실률 작은 1M 토큰이라는 측면에서는 확실히 보여줬었는데 저 인피니티 어텐션이란 기술도 지엽적이나마 혈을 뚫어주는 기술이었으면 좋겠음
이 '압축 메모리' 라는 것이 너무 추상적으로 느껴지는게 문제인데 어텐션 공간내에서의 또 다른 연산공간을 구현해낸 거라면 이미 장기기억의 혈은 완벽하게 뚫린 상태라고 봐도 무방할듯
찾아보니깐 한텔이 아니라 하인텔이노
압축메모리는 로컬ai에 쓰기에는 부적합하겠네 확실히..