갑자기 고급 보이스 까는 글들 일제히 올라오네


STS 기반으로 텍스트 모델이랑 비슷한 성능 내려면 합성 데이터 준비하는 게 훨씬 빡세서 그런가