https://www.aitimes.com/news/articleView.html?idxno=207448
알리바바는 2일(현지시간) 새로운 오픈소스 모델군 ‘큐원 3.5 스몰(Qwen3.5 Small)’을 공개했다. 이는 지난달 16일 ‘큐원3.5-397B-A17B’와 24일 ‘큐원 3.5 미디엄’ 제품군 출시에 이은 것이다.
이번 시리즈는 8억부터 90억 매개변수 규모까지 총 4종으로 구성되며, 모두 아파치 2.0 라이선스로 가중치가 공개됐다. 기업은 물론 상업적 제품에도 로열티 없이 자유롭게 통합·수정·재배포할 수 있다.
이번에 공개된 모델 중 '큐원3.5-0.8B'와 '큐원3.5-2B'는 초소형·고속 추론에 최적화된 경량 모델이다. 배터리 효율이 중요한 엣지 디바이스와 모바일 환경을 주요 타깃으로 설계돼, 제한된 연산 자원에서도 빠르고 안정적인 성능을 제공하는 데 초점을 맞췄다.
'큐원3.5-4B'는 26만2144 토큰 컨텍스트를 지원하는 경량 멀티모달 에이전트 베이스 모델이다. 텍스트뿐 아니라 다양한 입력을 처리할 수 있도록 설계돼, 에이전트 기반 응용 서비스의 기반 모델로 활용될 수 있다.
'큐원3.5-9B'는 고급 추론에 특화된 상위 모델로, 복잡한 문제 해결과 정교한 추론이 요구되는 영역에서 강점을 보이는 것이 특징이다.
특히 9B 모델은 오픈AI의 오픈모델 ‘gpt-oss-120B’를 다국어 지식·대학원급 추론 벤치마크에서 앞섰다. 매개변수 수는 13배 이상 차이가 나지만, 효율성 면에서 우위를 보였다는 설명이다.
이처럼 이번에 출시된 모델은 대규모 데이터센터가 아닌 개인 기기와 로컬 서버를 목표로 개발됐다. 개발자 커뮤니티에서는 “M1 맥북 에어에서도 로컬로 무료 실행 가능하다”라는 반응이 나오는 등 접근성에 대한 호평이 이어지고 있다.
스몰 시리즈의 기술적 핵심은 기존 트랜스포머 구조에서 벗어난 ‘효율적 하이브리드 아키텍처’다.
알리바바는 선형 어텐션 계열인 게이티드 델타 네트웍스(Gated Delta Networks)와 희소 전문가 혼합(MoE)을 결합해, 필요한 부분만 활성화하는 구조를 채택했다. 이를 통해 소형 모델의 한계로 지적되던 ‘메모리 월(memory wall)’ 문제를 완화하고, 추론 지연을 크게 낮췄다고 설명했다.
또 텍스트 모델에 비전 인코더를 덧붙이는 방식이 아니라, 초기 학습 단계부터 멀티모달 토큰을 조기 융합 방식으로 훈련했다. 그 결과 4B·9B 모델은 UI 요소 읽기, 영상 속 객체 수 세기 등 과거에는 10배 이상 큰 모델이 필요했던 시각 이해 작업을 수행할 수 있다.
쩐다.
하지만 난 글카가 구리다! 슬프다!
3.5 버전만 몇개여... 한 10개 되는거 같은데. api 무료로 사용가능해서 스몰 버전 쓸 이유가 없는데...
로컬 + 무검열
헐 api 무료임? 로컬로 안깔고 api만 연결해서 써두댐? - dc App
@ㅇㅇ 짱개모델은 쌀먹 찾아다니면 무료 많음
@ㅇㅇ 보통 어디서 찾음? 오픈라우터? - dc App
0.8b 폰에서도 잘돈대 ㄷㄷ - dc App
돌려봤는데 저가형 안드폰에서 2b가 막돌아 ㄷㄷ - dc App