갑자기 고급 보이스 까는 글들 일제히 올라오네
STS 기반으로 텍스트 모델이랑 비슷한 성능 내려면 합성 데이터 준비하는 게 훨씬 빡세서 그런가
보이스는 4o 미니 쓴거라 그럼
더 큰 모델은 추론 속도가 못따라감
아 그렇겠네
아웃풋 속도로 봐서 상당한 경량화모델일지도
보이스는 4o 미니 쓴거라 그럼
더 큰 모델은 추론 속도가 못따라감
아 그렇겠네
아웃풋 속도로 봐서 상당한 경량화모델일지도