7ceb877eb48560f73beb98bf06d60403ab57a468a51435571a

지금 기재부 말단 직원이 등장했다.

내부 데이터로 수동이 전체 몇퍼센트 구매되는지 그 외 잡다한 자료도 당연히 있는 것으로 보인다.


기재부 직원은 지금 이걸 지적하는 것이다.


왜 수동 구매가 상당히 많은데 마치 자동 구매만 있는 것처럼 모집단이 무작위로 구성 된 것처럼 다뤘느냐?

현실적이지 않다.


이 얘기다.


반박한다.


로또는 전체 구매가 곧 모집단이다.

그래서 샘플링을 고려할 필요가 없는데

앞서 지적한 것처럼

로또는 복권의 구성이 특이하다.


그래서 이렇게 생각할 수 있다.

로또의 모든 경우의 수는 8,145,060 의 수를 갖는데

이 로또 조합을 구매하는 행위를 일종의 무작위 샘플링을 행하는 것으로 생각할 수 있다.


따라서 이번 건의 경우 총 8,145,060 의 조합을

112,523,887 번 샘플링을 진행한 것으로 생각할 수 있다.


이 경우 비록 모든 샘플링이 무작위적으로 행해지지 않고 작위적으로 행해졌다 하더라도

1. 시행 횟수가 매우 크고

2. 모든 조합이 뽑힐 확률이 1/8,145,060 으로 동일하기 때문에


일부 작위적 샘플링이 편향성을 가지더라도


예를 들어

어떤 집단은 숫자간 간격이 띄엄띄엄인 조합을 선호하고

어떤 집단은 숫자가 짝수인 조합을 선호하고

또 어떤 집단은 숫자가 연번인 조합을 선호하며

다른 집단은 숫자가 앞으로 몰리거나 뒤로 몰리는 조합을 선호한다고 하더라도


이런 편향성을 갖더라도

시행횟수가 매우 크다면

그런 편향성이 서로 상쇄되어 평균으로 회귀하는 일종의 Smoothing 현상이 발생해서

무작위 샘플링과 비슷한 가정을 통해 분석하더라도 문제가 없다.



따라서 저러한 지적은 샘플링에 대해 무지한 자가 한 발언이며

그것이 아니라면 다른 의도가 있겠지.



자.

기재부 말단.


빨리 가서 보고 해.

퇴근 시간인데 미안해.