배치 처리 능력은 GPU가 더 뛰어나니 단일 요청을 엄청 빠르게 대답하는 용도로 쓰일텐데...
더 비싸지만 빠른 요금제를 출시하거나, 에이전트를 위해 쓸지도
Azurespace(azurespace)2026-01-15 09:20:00
답글
지금딱떠오르는건 보이스모델인데 흠
노암브라운(contend3854)2026-01-15 09:23:00
답글
전용칩들 보통 오픈웨이트 모델 서빙할때 컨텍스트 윈도우 최대 스펙까지 못 쓰고, 공식 API보다 성능 떨어진다는 불만이 많았는데, 오픈AI가 어떻게 써먹을지 궁금하긴 함
혹시라도 세레브라스 인프라에 GPT-5.2 띵킹 성능 동등하게끔 돌아가게 만들고 개빠르다면 엄청나긴 할텐데 될까 모르겠네
익명(compact5711)2026-01-15 09:24:00
답글
그것보단 미니급 올려서 무료 유저들 쓰게 만들고 에이전트 돌아갈때 잡일 시키게 할거 같긴 함
익명(compact5711)2026-01-15 09:25:00
답글
@노암브라운
뉴스 뜨자마자 분석완료하고 주문넣는 그런 에이전트들을 위해 고빈도거래시장 타겟으로 API 티어링같은거 할수도 있을듯
배치 처리 능력은 GPU가 더 뛰어나니 단일 요청을 엄청 빠르게 대답하는 용도로 쓰일텐데... 더 비싸지만 빠른 요금제를 출시하거나, 에이전트를 위해 쓸지도
지금딱떠오르는건 보이스모델인데 흠
전용칩들 보통 오픈웨이트 모델 서빙할때 컨텍스트 윈도우 최대 스펙까지 못 쓰고, 공식 API보다 성능 떨어진다는 불만이 많았는데, 오픈AI가 어떻게 써먹을지 궁금하긴 함 혹시라도 세레브라스 인프라에 GPT-5.2 띵킹 성능 동등하게끔 돌아가게 만들고 개빠르다면 엄청나긴 할텐데 될까 모르겠네
그것보단 미니급 올려서 무료 유저들 쓰게 만들고 에이전트 돌아갈때 잡일 시키게 할거 같긴 함
@노암브라운 뉴스 뜨자마자 분석완료하고 주문넣는 그런 에이전트들을 위해 고빈도거래시장 타겟으로 API 티어링같은거 할수도 있을듯