뽑기에 숨겨진 수학 ━ 큰 수의 법칙과 도박사의 오류

세상을 살아가면서 접하는 가장 흔한 종류의 확률에 대하여.

뽑기에 숨겨진 수학 ━ 큰 수의 법칙과 도박사의 오류
출처: unspalsh.com

우리는 세상을 살아가면서 수많은 확률을 접한다. 예를 들면 학교에서 제비뽑기를 통해 자리를 정한다거나, 로또를 뽑는다거나, 게임에서 아이템 강화 내지는 확률성 아이템을 얻는 경우 등등 여러가지가 있을 것이다. 이처럼 우리 삶 속에는 다양한 확률이 숨어있다. 특히 게임에서 만나는 확률이 크게 체감이 되는 편이다. 분명 강화 확률이 10%가 넘어감에도 우리는 빈번히 강화에 실패한다. 심지어는 강화를 10번을 해도 모조리 실패하는 경우도 있다. 이런 경우에는 명시된 확률을 의심하기 마련이다. 왜 나는 10%의 확률에 당첨되지 않는 것인가. 그러다 문득, "확률이 고정적일 수 있는가?"에 대해 궁금해졌고, 이에 대해 나름대로 공부, 연구해본 걸 설명하고자 한다.

확률은 수렴한다.

확률은 절대적이지 않다. 그 대신, 평균일 뿐이다. 무슨 말이냐면, 무언가의 성공 확률이 10% 라고 해서 무조건 10번 안에 성공하는 것이 아니라는 것이다. 동전 던지기를 예시로 들어보자. 동전에는 앞면과 뒷면이 있고, 우리는 앞면 또는 뒷면이 나올 확률이 각각 50%라는 것을 알고 있다. 하지만 이것은 평균 확률일 뿐이고, 실제로 동전 던지기를 몇 번 수행했을 때, 확률이 정확히 50%으로 떨어지는 경우는 드물다. 동전을 10번을 던져 앞면이 더 나올 수도 있고, 뒷면이 더 나올 수도 있다. 하지만 시행횟수를 늘이면 늘일 수록, 확률은 50%로 가까워지고, 우리는 이것을 "수렴한다" 라고 표현한다.

이번에는 조금 더 확률이 쪼개져있는 주사위를 예시로 들어보자. 우리는 주사위에서 특정 수가 나올 확률이 $\frac{1}{6}≈0.16$, 약 16% 임을 알고있다. 이 경우 또한 시행횟수를 늘이면 늘일수록 $16.66⋯$% 로 수렴할 것이다.

이 가설을 실험적으로 증명해보자.

let one = 0;

for (var i = 1; i > 0; i++){
  var probability = Math.ceil((Math.random() * 6));
  if(probability == 1) one++

  console.log(`시행횟수: ${i}회 | 1일 확률: ${(one / (i) * 100).toFixed(10)}%`) 
}

다음과 같은 코드를 이용하여 반복 연산을 할 것이다. 1부터 6까지의 난수를 생성하여 소수점 자리는 올림 처리하고 for 문을 이용해 반복 처리하였다. 난수가 1일 때에만(=주사위의 눈이 1일 때) 카운트하고, 전체로 나누어 백분율을 구한다. 이 과정을 10만번 정도 굴려보니 예상했던 대로, 가설과 같이 16.666에 근사한 수치를 보여주었다.

10만번째 시행에서 주사위 눈이 1일 확률은 $16.6589999⋯$%이다.

큰 수의 법칙

큰 수의 법칙(law of large numbers) 또는 대수의 법칙, 라플라스의 정리는 큰 모집단에서 무작위로 뽑은 표본의 평균이 전체 모집단의 평균과 가까울 가능성이 높다는 확률과 통계 분야의 기본 개념이다.1

1) (약한 큰 수의 법칙) 임의의 $\epsilon>0$에 대하여:$$\displaystyle\lim_{n\rightarrow\infty} \operatorname{P}\left(\left| \frac{1}{n}\sum_{k=1}^{n}X_k -\mu \right| <\epsilon \right)=1$$
2) (강한 큰 수의 법칙) $$\displaystyle \operatorname{P} \left( \lim_{n\rightarrow\infty} \frac{1}{n}\sum_{k=1}^{n}X_k = \mu \right)=1$$

수식으로만 보니 뭐가 뭔지 전혀 모르겠다.. 쉽게 말하자면 "시행 횟수가 늘어날 수록 실제로 측정한 확률이 수학적으로 예측된 확률에 수렴할 확률이 1에 수렴한다" 라는 것이다.

도박사의 오류

큰 수의 법칙의 연장선상에 있는 이론이다. 사전적 의미로는

서로 독립적으로 일어나는 확률적 사건이 서로 확률에 영향을 미친다는 착각에서 기인한 논리적 오류

이다. 예를 들어서, 동전 던지기를 10번 했을때 모두 앞면이 나올 확률은 수학적으로 예측하였을 때 $(\frac{1}{2})^{10}$인 $\frac{1}{1024}$ 이지만, 확률이 이보다 낮을 것이라고 착각하는 것이다. 이 오류는 "모든 사건은 앞에서 일어난 사건과 독립적으로 일어난다"라는 확률 이론의 가정을 받아들이지 않기 때문에 발생하는 논리적 오류이다. 동전 던지기에서 10번 모두 앞면이 나왔어도 11번째 동전 던지기에서 뒷면이 나올 확률은 앞의 결과에 상관하지 않고, 50%이라는 것이다. 이는 일종의 보상 심리라고도 할 수 있다. 결국 독립사건을 종속사건이라고 해석함에 따라 발생하는 논리적 오류이다.