머숨 미러

1. 구글 인피니 어텐션 ( i/o 에서 보여주었던 컨텍스트 캐싱과 똑같은 기술인듯)

7cea8173b2846ef43bef98a518d604031391539b456d6c389dfb

2. 한텔 파이먼 경로적분

https://arxiv.org/abs/2405.04620

나도 2022년도 부터 계속 생각했던 접근법 이었는데 it공돌이 들이 이과적인 방법으로 구현해 줘서 고맙긴함

간단하게 설명하자면

현재 장기기억을 유지하는 기술인 컨텍스트 요약 기술은 입력 토큰 공간내에서 연산을 하는 한계성 때문애 아무리 요약이 함축되어있다고 한들 결국은 한계가 올 수 밖에 없음

하지만 이 두가지 기술은 이전의 정보들이 담겨있는 이전 어텐션 정보들을 버리지 않고 '압축 메모리' 에 통합하게됨 여기서 '압축 메모리' 는 컨텍스트 요약 을 담고 있는 토큰 공간을 의미하는 것이 아니라 인풋된 정보들을 처리하는 어텐션 계층구조내의 학습데이터에 인풋할때 마다 정보값들을 업데이트 하며 저장한다는 개념이 맞는듯 (어떻게 보면 원시적인 실시간 학습의 형태를 띄고있음)

이 말이 사실이라면 컨텍스트 길이를 연산리소스만 충당된다면 무한정 늘이는 것이 가능하게 됨

다만 한계점은 끊임없는 지속학습에 필요한 재학습에서 발생 되어지는 연산비용이 커지는것이 단점일 듯

가정으로 보급되기엔 하드웨어적 한계가 있고 대규모 정보를 한꺼번에 처리해야 되는 기업에 먼저 큰 비용의 지불관계를 거치고 제공될 듯?

저걸 인간 뇌에 적용하면 초천재 되는거 쌉가능? - dc App

나그네(cc48wy6awalz) 2024-05-15 19:02:00

답글

인간 뇌는 저거보다 더 효율적이다

익명(125.134) 2024-05-15 19:02:00

답글

큰 정보값들에서 발생되어지는 특정한 패턴을 찾아내고 그것을 공식화하고 장기기억에 저장함으로서 필요없는 쓰레기 데이터들을 선별하고 필터링 해냄

익명(125.134) 2024-05-15 19:03:00

답글

그렇게 뛰어나다면서 정작 내 뇌 성능은 이따구임? ㅠ - dc App

나그네(cc48wy6awalz) 2024-05-15 19:04:00

답글

같은 인간사회에서의 상대적인 비교때문애 너가 그렇게 느끼는 거임 원숭이랑 비교해보셈

익명(125.134) 2024-05-15 19:06:00

답글

ㄴ 뭔가 상처받을 것 같은데 ㅋㅋ

익명(103.237) 2024-05-15 19:09:00

답글

ㄴㄴ이 나쁜놈앗! - dc App

나그네(cc48wy6awalz) 2024-05-15 19:09:00

개추인데

부패하는유전자!!!(sansss2015) 2024-05-15 19:03:00

정보글 개추

익명(211.109) 2024-05-15 19:03:00

이런 글 좋다... 앞으로 이런 글들 더 많아졌으면

익명(103.237) 2024-05-15 19:05:00

두번째는 지금 클라우드 방식으론 안되는거 아녀?

익명(googlegay5) 2024-05-15 19:06:00

2에 논문 트위터에서 아무 관심도 없던데... 흠.. - dc App

indie(indie98) 2024-05-15 19:08:00

답글

저게 결국은 구글에서 말하는 인피니 어텐션과 동일한 맥락의 공식을 가지고 있기 때문임 그것이 우연히 파이먼 경로적분의 공식과 일치성을 띄고 있을뿐

익명(125.134) 2024-05-15 19:08:00

답글

며칠전부터 이 논문 홍보하는 사람있던데 ㅋㅋ - dc App

indie(indie98) 2024-05-15 19:09:00

답글

본인임? - dc App

indie(indie98) 2024-05-15 19:09:00

답글

이 논문 저자가 둘다 한국인이네

익명(211.46) 2024-05-15 19:35:00

제미나이 1.5 프로도 손실률 작은 1M 토큰이라는 측면에서는 확실히 보여줬었는데 저 인피니티 어텐션이란 기술도 지엽적이나마 혈을 뚫어주는 기술이었으면 좋겠음

익명(222.120) 2024-05-15 19:09:00

답글

이 '압축 메모리' 라는 것이 너무 추상적으로 느껴지는게 문제인데 어텐션 공간내에서의 또 다른 연산공간을 구현해낸 거라면 이미 장기기억의 혈은 완벽하게 뚫린 상태라고 봐도 무방할듯

익명(125.134) 2024-05-15 19:11:00

찾아보니깐 한텔이 아니라 하인텔이노

익명(h1r5enpsrrsq) 2024-05-15 19:14:00

압축메모리는 로컬ai에 쓰기에는 부적합하겠네 확실히..

익명(january5714) 2024-05-15 19:16:00

MoonChild(aowlr2001) 2024-05-15 19:33:00

천사다천사(jjtheman999) 2024-05-15 20:48:00

[일반] 장기기억 해결에 현재 가장 근접한 기술들

댓글 22

[일반] 장기기억 해결에 현재 가장 근접한 기술들

댓글 22

다른 게시글

제미나이랑 라마 좋다는 얘들은 이해라도하지

요즘 루게릭병이 존나무서워서 맨날 정보 찾아봤는데

구글 프로젝트 아스트라 노주작 외부인 대상 실제 시연영상

네이버 하이퍼클로바x 나쁘지 않은데?

일리야 향후 진로가 전혀 중요하지 않은 이유

OAI는 사실 적자보는 회사는 아니라고 생각함

아까 누가 클로드4 올해 10월이라 그랬는데

이번 구글 발표에서 주목할만한 기능 컨텍스트 캐싱

일리야 4o 발표 다음날 퇴사한게 무슨 의미일까?

Gpt-4o 영상을 her 실사화로 만들어보았습니다...