투약 전에는 7년을 생존했는데 투약 후에는 3년+1년 만에 사망은 약에 문제가 있다고 보는 심슨의 역설을 감안해야함

데이터가 모였다고 데이터만 분석하는 게 통계의 다가 아님


이중맹검을 실시했는지

애초에 오진단은 아닌지

약자체가 사망을 가속한 건 아닌지

실험을 재현할 수 있는지

대립가설이 맞을 때 까지 실험을 반복하는 건 아닌지

등등 데이터 수집 이전의 상태를 잘 봐야 함


유의성하고 약효능의 확률하고 동일시 하면 안됨

p값은 귀무가설을 지지할 확률일 뿐 0.05가 특별한 의미가 있는 게 아님

p값이 0.01가 나왔다고 신약의 효과가 99%가 아님



생존분석이란 어떤 조치 후 생존시간을 분석하는 것

생존분석이 통상적인 자료와 다른 이유는 중도절단 자료이기 때문

관심사가 환자가 일정 시간 이상 생존할 확률 = 생존함수

관심사가 환자가 일정 시간 까지는 생존했다가 일정 시점 바로 직후에 사망하게 되는 순간위험률 = 위험함수



비모수적을 사용하는 이유는 데이터가 무작위 랜덤 표본추출(정규분포)이 아니어서 특정 분포를 가정하지 않는게 더 타당하다고 보기 때문