1) paperswithcode 뒤적이기 2) 기존 알려진 다른 데이터 수정해서 써먹기 3) 학습에 쓸 데이터가 없는거면 llm한테 라벨링시키기
깃헙 정부공공데이터
캐글 같은데서 그런 대회를 한적 있는지 찾는것도 방법. 대회에 활용한 데이터. 다만 개인적 용도 아니면 활용은 불가인 경우가 많음.
데이터팀에 의뢰함
aihub huggingface datasets google 도메인 전용 오픈소스 데이터셋 저장소 불법 수집
ML 잘 돌리는 것중에 데이터 수집 능력도 굉장히 중요한듯
1) paperswithcode 뒤적이기 2) 기존 알려진 다른 데이터 수정해서 써먹기 3) 학습에 쓸 데이터가 없는거면 llm한테 라벨링시키기
깃헙 정부공공데이터
캐글 같은데서 그런 대회를 한적 있는지 찾는것도 방법. 대회에 활용한 데이터. 다만 개인적 용도 아니면 활용은 불가인 경우가 많음.
데이터팀에 의뢰함
aihub huggingface datasets google 도메인 전용 오픈소스 데이터셋 저장소 불법 수집
ML 잘 돌리는 것중에 데이터 수집 능력도 굉장히 중요한듯