2bbcde32e4c1219960bac1e75b83746f75e1e6eadedd607b1da36b8ca6152df3b0485c686ac4b9fec4d2cb158bbb3da1322383a5ec1f71

(짤은 내장 그래픽이랑 쥐꼬리만한 npu로 실시간 음성인식 + 번역 돌리는 거)


ㄹㅇ 1년 전만 해도 1b 4b짜리 초소형 모델들은 10줄 넘어가면 무한 반복 걸려서 출력 망가지고 그랬는데,

이제 1.8b 짜리 모델도 번역 같은 건 곧잘 하고, 27b 짜리 모델은 1년 전 유료 모델 급 성능이 나오는데다

llama.cpp조차 안 깔고 걍 폰이나 브라우저에서도 자기 하드웨어에서 ai 성능이 얼마나 나올지 딸깍할 수 있는...

- 이상한 누나