원본질문 : 통계고수행님들 질문이여 - 통계 마이너 갤러리 (dcinside.com)
- 결측값은 정보가 없는 것이 아니며, 대체는 데이터를 손상시킬 수 있음
- 로지스틱 회귀는 통계적 추론 능력 때문에 자주 선호되지만, (a) 올바른 모델 지정이 필요함 (결측값이 없는 경우에도) (b) 무작위 결측(MAR) 가정은 검증되거나 정당화될 수 없음 © 결측값 대체 후의 추론에 대한 이론이 없음 (d) Y 값을 사용하여 X 값을 대체해야 하는지 여부가 불명확함
- GUIDE 모델은 이러한 문제가 없음 (a) 비모수 모델이 점근적으로 일관됨 (Chaudhuri et al., 1994) — 모델 지정 오류 문제 없음 (b) 예측 변수에 대해 MAR 가정이 필요하지 않음, 대체가 없기 때문 © GUIDE는 한 변수의 응답 확률(성향 점수)이 다른 변수의 결측 지표에 의존할 수 있도록 허용함 (d) GUIDE는 결측값의 경로를 보여주는 유일한 트리 방법임 (e) 부트스트랩 보정을 통한 통계적 추론이 가능함 (Loh et al., 2016)
댓글 0