어우 이거 pdf 에서 텍스트 뽑아내는거가 엄청 일이네


솔직히 데이터만 확보되면 청킹 임베딩 retrieval chat app 구축 까지는 존나 후루룩 넘어갈거같은데


pdf 에 있는걸 잘 구조화된 텍스트로 뽑아내는게 생각보다 개어려움