1. 로컬 AI 에이전트 -> 요즘 CPU 체급 ㅈㄴ 좋아서 암거나 사라 내장그래픽으로도 돌아간다
말 그대로 걍 대답만 해주는 챗봇 같은거 말하는거다
어차피 추론용들은 속도 신경 안쓰기 때문에 max len 적당히 주면 vram 6기가 정도면 떡을 친다
근데 내가 막 이상한 프롬프트에 빠져서 max len을 1024 이렇게 하면 터지긴함
근디 보통 이미지 생성 같은걸 난 많이 써~ 하면 그냥 vram 빵빵한걸로 사라 안그럼 터진다.
그리고 어차피 추론은 속도 얼마안먹기도 해서 솔직히 큰 신경쓰지마라 ㅇㅇ.
==
Vram 6~12 정도
이미지 생성하려면 vram 12정도가 넉넉
2. 자기가 lola 같은 파인튜닝을 좀 하고싶다 -> 최소 vram 12기가다 노트북으론 체급이 안된다.
데탑으로 가는게 맞다.
아니면 rtx 5080탑재된거 쓰던가
그리고 제일 중요한게 메모리 대역폭인데 이게 학습 속도 엄청나게 차이난다 잘 보고 사라.
참고로 로라는 기존 가중치 동결하기 때문에 완전 처음 돌리는거 아니면 많이 차지안함 물온 기본 베이스 모델이 애초부터 존나게 크면 좀 다른얘기긴 하고
얘도 속도 크게 신경 쓸필요없으니 vram 넉넉한걸로 사라
==
Vram 12~24gb
3. 난 미래에 ai를 직접 만들고 싶어! 그러니 하드한 모델 클래스 처음부터 학습해야된다고!
예시 )
Llm class
Vision language action class
Diffusion transformer
- Text to image
- Text to video
보통 이런거는 클래스 공개 잘 안하고 하더라도 묘하게 뭔가 빠져서 제대로 안돌아가는 모델을 낚여봐라 ㅋㅋ 하고 올린게 대부분이라 자기가 직접 짜야되는데 뭐 그건 제쳐두고 이거 돌릴려면
답 없다 1024x1024 이미지만 하더라도 latent화 해서 배치 10만 줘도 vram 40gb 이상 터진다
그래서 둘중하나다
1. Rtx6000 pro 워크스테이션 사던가 (1600만원 ㅋㅋ)
2. Colab 써라
그리고 학습용은 무조건 nvidia gpu 탑재된거로 사라 애초에 얘네 칩 자체를 행렬연산 기준으로 설계한거라(hbm ㅇㅇ) 그냥 학습 속도가 너무차이난다.
특히 cuda 생태계가 너무 심하다 칩안에있는 cuda 코어가 너무 심함 그냥 여기는 nvidia가 지배했다보면됨
이전 세대인 a100 기준으로도 맥북 최신 코어랑 10배 남게난다 보면됨 그냥 규모 자체가 다름
rtx 프로 ㅈㄴ 비쌈ㅋㅋㅋ
개인이 큰 모델 제대로 학습 돌리기엔 코랩말곤 선택지가 없군