The Way

로또 확률 및 검증 본문

잡정보

로또 확률 및 검증

Jeonggyun 2019. 5. 6. 01:09

친구가 로또에 당첨된 기념으로(5등..) 일확천금의 대명사 로또를 수학적으로 계산해보자.



로또 당첨 확률


홈페이지에 나와있는 로또 당첨 확률은 다음과 같다.

1등: 1 / 8,145,060

2등: 1 / 1,357,510

3등: 1/ 35,724

4등: 1 / 733

5등: 1 / 45


사실 이건 정수가 되도록 소숫점 첫째 자리에서 반올림한 것이다. 진짜 확률을 계산해보자.


로또의 총 경우의 수는 $_{45}C_{6} = 8145060$이다.


각 등수에 해당하는 경우의 수가 몇 개인지만 세면 아주 간단하게 확률을 계산할 수 있다.


1등

전체 번호 중 단 한가지 경우.

확률이 $1 / 8145060$임은 자명하다.


2등

5개 번호가 일치하고, 보너스 번호가 일치해야 한다.

자신이 뽑은 6개의 숫자 중 하나는 보너스 번호와 일치하고,

남은 5개의 숫자 중 하는 당첨 번호 6개에 포함되어야 하므로

경우의 수는 $_6 C _5 = 6$가지.

당첨 확률은 $6 / 8145060 = 1 / 1357510$


3등

5개 번호가 일치해야 한다.

당첨 번호 6개 중 5개가 포함되는 경우의 수 $_6 C _5$.

나머지 숫자 하나는 당첨 번호, 보너스 번호가 아닌(만약 보너스 번호이면 2등이 되어버린다) 38개 숫자 중 아무거나 나오면 된다.

따라서 총 경우의 수는 $_6 C _5 \times 38 = 228$가지.

당첨 확률은 $228 / 8145060 = 1 / 35723.95$


4등

4개 번호가 일치해야 한다.

당첨 번호 6개 중 4개가 포함되는 경우의 수 $_6 C _4$.

나머지 숫자 2개는 당첨 번호가 아닌(이제부터는 보너스 번호가 나와도 상관 없다) 39개 숫자 중 아무거나 나오면 된다.

따라서 총 경우의 수는 $_6 C _4 \times _{39} C _2 = 11115$가지.

당첨 확률은 $11115 / 8145060 = 1 / 732.80$


5등

3개 번호가 일치해야 한다.

당첨 번호 6개 중 3개가 포함되는 경우의 수 $_6 C _3$.

나머지 숫자 3개는 당첨 번호가 아닌 39개 숫자 중 아무거나 나오면 된다.

따라서 총 경우의 수는 $_6 C _3 \times _{39} C _3 = 182780$가지.

당첨 확률은 $182780 / 8145060 = 1 / 44.56$



고등학교에서 배운 수학으로 쉽게 계산 가능하다.


이제 당첨 확률을 알았으니, 당첨자 수가 우리가 계산한 확률과 얼마나 비슷하게 나오는지 계산해보자.


가장 최근의 두 회차만 간단하게 살펴보자.

회차 밑의 빨간 색 숫자는 판매량이다. 비율은 1, 2등은 워낙 편차가 심해 그냥 뺐다.

857회차에서는 대체로 기댓값보다 많은 인원이 당첨된 반면, 856회차에서는 기댓값에 턱없이 부족한 인원이 당첨되었다. 이것이 가능할까?


고등학교에서 배운 것을 복기해보자.


이항 분포는 n이 커지면 정규 분포로 근사할 수 있다고 하였고, 그 식은 다음과 같았다.

$B(n, p) \sim N(np, npq)$

이 식을 통해 856회차의 5등을 근사해보면 다음과 같다.

$B(80496424, 182780 / 8145060) \sim N(1806388, 1765851) \simeq N(1806388, 1329^2)$


그리고 우리는 신뢰구간도 배웠다. 정규분포에서 신뢰도 99%의 신뢰구간은 $\pm 2.57\sigma$였다.


이 공식에 따르면 당첨자 수는 신뢰구간 99%에서 1,802,959~1,809,816명 사이에서 존재해야한다.

실제로 python의 random 모듈을 사용해서 계산해 보아도 이 구간 안의 숫자가 나온다.


그런데, 실제 수는 1,700,369명이다. 무려 $-79.77 \sigma$에 해당하는 값으로, 이항 분포에서 이런 값이 나올 확률은 10^-300보다도 작다. 혹시 조작의 증거를 발견할 것일까?

그렇지 않다. 왜냐하면 로또는 수동의 존재 때문에, 완전한 이항분포가 아니기 때문이다.


보통 사람들이 잘 뽑지 않는 번호들이 있으며, 당첨번호가 이런 번호와 비슷하게 나올수록 당첨자 수는 급감하게 된다.


856회 당첨번호를 살펴보면, 납득할 수 있을 것이다.

당첨번호에 40, 41, 43, 44이 한번에 들어가서 많은 사람들이 욕을 했다.

복권기금에서는 정해진 비율(50%)만 가져가니, 이런 상황이 오면 당첨자만 얼씨구나 좋다 노래를 부를 것이다.


"로또는 수학을 모르는 사람들에게 부과하는 세금이다"라는 말이 있다.

로또 한 장의 기댓값은 500원, 즉 사는 순간 돈의 50% 정도가 날아가는 셈인 것이다.


하지만 로또를 사면 1주일을 기대감 속에서 기분 좋게 살 수 있으니 완전 돈낭비라고 하기는 힘들 것 같다. 로또는 돈을 주고 기대감을 사는 것이다.


다르게 생각하면 오히려 로또를 사는 것이 더 합리적인 선택일 수도 있다. 예를 들어 월급이 200만 원이면 평생 살며 10억이라는 돈을 벌기가 사실상 불가능한데, 이 경우 다음과 같은 결과가 나온다.


<10억 원 대 부자가 될 확률>

로또를 산다(5000원): 0.0000614%

로또를 사지 않는다: 0%


0%에서 확률이 조금이나마 올라가니 어찌보면 합리적인 선택이라고 해야하나..

Comments