저는 데이터 불균형 문제 처리하기 위해 DATA AUGMENTATION을 해서 1:1 비율을 training set 에 맞춰주었습니다. 그런데 불균형을 다루는 다른 방법으로 클래스 가중치도 있다고 알고 있는데 이게 이미 데이터 augmentation을 통해 비율 1:1 맞춰준 경우에는 class 가중치 도입할 필요 없다는 제 생각이 맞나요?
[❓질문] 데이터 불균형 처리할때
환상적이구만(180.224)
2024-09-14 21:23
추천 0
댓글 6
다른 게시글
-
o1-preview 자꾸 2023년 10월 이후의 지식은 없다고 뜨네
[1][일반] 익명(222.100) | 24.09.14추천 0 -
o1 보는데, 진짜 몇년뒤에는 연구직도 따이는거이님?
[4][일반] 익명(211.234) | 24.09.14추천 1 -
o1 어떻게 생각함?
[15][일반] 익명(118.235) | 24.09.14추천 1 -
AI로 노래 2차 창작 저작권 질문
[2][❓질문] 익명(112.166) | 24.09.14추천 0 -
hyperparameter 어떻게들 정하냐 Bayesian opt 씀?
[11][일반] 익명(39.115) | 24.09.14추천 1 -
근데 사람은 추론하는 거 맞냐?
[1][일반] 익명(174.239) | 24.09.14추천 0 -
속도도 안돼 메모리도 많이먹어 성능도 안좋아
[3][일반] 땔감(gcp24685) | 24.09.14추천 0 -
mnist 원래 잘나와야하지?
[일반] 땔감(gcp24685) | 24.09.14추천 0 -
르쿤이형 패배선언 기대되면 개추 ㅋㅋㅋㅋㅋ
[일반] 익명(118.235) | 24.09.13추천 7 -
오토 인코더랑 lstm 사용해서
[3][일반] 익명(211.179) | 24.09.13추천 0
1:1 비율을 훈련셋에 맞췄다는게 뭔소리지
아 제가 제일 중요한 얘기를 뺴먹었네요.. classification task이며 예를 들어 training set의 class 0 데이터 개수가 100개, class 1 데이터 개수가 200개였다면 class 0 에 대해서만 데이터 증강을 해서 class0과 class 1 모두 200개가 되도록 맞춰주었다는 얘기입니다
모름; 데이터 봐야 앎 1. data augmentation 으로 class 0 / class 1 을 대표하는 데이터들이 이상적으로 뽑힌거면 가중치 도입할 필요없는게 맞음 2. data aug랑 class weight 는 다른 솔루션임. 둘다 unbalance를 다루는건 맞지만 A를 썼으니까 B를 안써도 된다, B를 쓸꺼니까 A를 안써도 된다고 결정내릴 문제는 아님
감사합니다. 그런데 data augmentation으로 class 비율 1:1 로 맞춰줄 경우에 class 가중치를 도입하더라도 의미가 없게 되는데(데이터 수의 비율에 따라 가중치를 도입한다면) 이에 대한 생각은 어떠신가요?
데이터 봐야 안다고;; 단순히 200/200 이라고 데이터 분산이나 이런거에 따라서 단순 SVM 만 써도 어디에 선이 그일지 모르고 니가 원하는 모델이 뭔지 모르는데 그건 니가 대가리 박아서 해봐야 아는 문제임
감사합니다. 제가 가중치를 도입할때 클래스 비율에 따라서만 역으로 값을 설정한다고 잘못 생각하고 있어서 생긴 문제네요. 일단 데이터 증강을 한 뒤에 학습 결과에 따라 클래스 가중치를 직접 수동으로 조절하는 방법도 생각해봐야겠습니다.