23 명. 23 명의 방에서 적어도 두 사람이 같은 생일을 가질 확률은 50-50입니다. 75 명의 방에서 적어도 두 사람이 일치 할 확률은 99.9 %입니다.
계산기와 갈퀴를 내려 놓고, 저는 이단을 말하지 않습니다. 생일 역설은 이상하고 직관에 반하며 완전히 사실입니다. 우리의 두뇌는 지수의 복리 력을 처리 할 수 없기 때문에 “역설”일뿐입니다. 확률은 선형적일 것으로 예상하고 우리가 관련된 시나리오 만 고려합니다 (두 가지 모두 잘못된 가정).
역설이 발생하는 이유와 작동 방식을 살펴 보겠습니다.
문제 1 : 지수가 직관적이지 않습니다.
우리는 스스로 수학과 통계를 배웠지 만 스스로를 놀리지 말자. 자연스럽지 않습니다.
예를 들어 보겠습니다. 동전을 던질 때 연속으로 앞면 10 개를 얻을 확률은 얼마입니까? 훈련받지 않은 두뇌는 생각할 수 있습니다. 다음과 같이 :
“음, 머리 하나를 얻는 것은 50 %의 기회입니다. 앞면 두 개를 얻는 것은 두 배나 어렵 기 때문에 25 %의 확률입니다. 머리 10 개를 얻는 것은 아마도 10 배 더 어려울 것입니다. 약 50 % / 10 또는 5 % 확률입니다.”
그리고 거기에 우리는 깔개에 벌레처럼 앉아 있습니다. 주사위를 던지지 않습니다.
하지만 훈련 후에도 다시 잡 힙니다. 5 % 이자율에서 우리는 “예상”20 년이 아니라 14 년 안에 돈을 두 배로 늘릴 것입니다. 이자율에 대해 배울 때 당연히 72의 법칙을 추론 했습니까? 아마도 그렇지 않습니다. 선형 두뇌로 복합 지수 성장을 이해하는 것은 어렵습니다.
문제 2 : 인간은 약간 이기적입니다.
뉴스를 살펴보세요. 부정적인 뉴스가 타인을 고려하지 않고 행동 한 결과 얼마나 많은지 주목하세요. 낙천주의 자이고 인류에 대한 희망이 있습니다. 그러나 그것은 별도의 논의입니다. :).
23 인실에서 당신의 생일이 다른 사람의 생일과 비교되는 22 개의 비교를 생각하십니까? p>
당신이 아닌 사람이 당신이 아닌 다른 사람과 비교되는 231 건의 비교를 생각하십니까? 너무 많다는 것을 알고 있습니까? 아마도 그렇지 않을 것입니다.
그 사실 우리를 포함하지 않는 10 배의 비교를 무시하면 “역설”이 발생하는 이유를 알 수 있습니다.
좋아요, 인간은 끔찍합니다. 수학을 보여주세요!
Q uestion : 23 인 그룹에서 두 사람이 생일을 공유 할 가능성은 얼마나됩니까?
물론, 쌍을 나열하고 일치 할 수있는 모든 방법을 계산할 수 있습니다. 그러나 그것은 어렵습니다. 1, 2, 3 또는 23 경기가있을 수 있습니다!
이것은 마치 “23 번의 동전 던지기에서 하나 이상의 앞면이 나올 확률은 얼마입니까?”라고 묻는 것과 같습니다. 너무 많은 가능성이 있습니다. 첫 번째 던지기, 세 번째, 마지막, 첫 번째와 세 번째, 두 번째와 21 번째 등의 앞면이 있습니다.
코인 문제를 어떻게 해결합니까? 뒤집기 (Get it? Get it?). 앞면을 얻기 위해 모든 방법을 세는 대신 “문제 시나리오”인 모든 꼬리를 얻을 수있는 기회를 찾으십시오.
1 % 가능성이있는 경우 모든 꼬리 (.5 ^ 23과 비슷하지만 여기서 나와 함께 일함)는 적어도 하나의 머리를 가질 확률이 99 %입니다. 머리가 1 개인 지 2 개인 지 15 개인 지 23 개인 지 모르겠습니다. 앞면이 있고 그게 중요합니다. 문제 시나리오의 가능성을 1에서 빼면 좋은 시나리오의 가능성이 남습니다.
생일에도 동일한 원칙이 적용됩니다. 우리가 일치하는 모든 방법을 찾는 대신 모든 사람이 다를 가능성이있는 “문제 시나리오”를 찾으십시오. 그런 다음 반대 확률을 사용하여 일치 할 기회를 얻습니다. 1 일, 2, 20 일 수 있지만 일치하는 사람이 있습니다.
설명 : 쌍 계산 (대략적인 공식)
23 명과 함께 253 쌍이 있습니다.
(원하는 경우 조합 및 순열에 대해 서두르세요).
두 사람이 서로 다른 생일을 가질 확률은 다음과 같습니다.
이치에 맞습니까? 한 사람의 생일을 다른 사람과 비교할 때 365 개 시나리오 중 364 개에서 일치하지 않습니다. .
그러나 253 개의 비교를하고 그것들을 모두 다르게하는 것은 머리를 253 번 연속해서 얻는 것과 같습니다. 매번 “꼬리”를 피해야했습니다. 생일 비교를 가장하여 대략적인 해결책을 찾아 보겠습니다. 동전 던지기와 같습니다. (정확한 계산은 부록 A를 참조하세요.)
확률을 찾기 위해 지수를 사용합니다.
한 번의 미스를 얻을 확률은 상당히 높지만 (99.7260 %), 그 기회를 수백 번 잡으면 그 연속을 유지할 확률은 떨어집니다. 빠릅니다.
일치하는 항목을 찾을 수있는 확률은 1 – 49.95 % = 50.05 % 또는 절반 이상입니다! 어떤 수의 사람들에 대해서도 일치 확률을 찾으려면 공식은 다음과 같습니다.
대화 형 예
23 명이 필요하다고 생각하지 않았습니다. 수학은 잘되지만 진짜인가요?
그럴 겁니다.아래 예를 시도해보십시오. 항목 수 (365 명), 여러 명 (23 명)을 선택하고 몇 번의 시도를 실행하십시오. 시험을 실행하면 이론적 일치와 실제 일치가 표시됩니다. 계속해서 버튼을 클릭하십시오 (또는 전체 페이지를보십시오).
시련을 더 많이 실행하면 (계속 클릭하십시오!) 실제 확률은 이론적 확률에 가까워 야합니다.
예 및 요약
다음은 생일 역설에서 얻은 몇 가지 교훈입니다.
- $ \ sqrt {n} $는 대략 50 %의 확률로 n 개의 항목과 일치합니다. $ \ sqrt {365} $는 약 20입니다. 이것은 생일 공격을위한 암호화에서 사용됩니다.
- 2128 (1e38) GUID가 있지만 이전에는 264 (1e19) 만 사용할 수 있습니다. 충돌 확률이 50 %입니다. 그리고 50 %는 정말, 정말 높습니다.
- 알파벳을 고르는 사람은 13 명만 있으면 일치 확률이 95 %입니다. 위에서 시도해보세요 (사람 = 13, 항목 = 26).
- 기하 급수적 인 성장은 고유 한 항목을 선택할 가능성을 빠르게 감소시킵니다 (일명 일치 가능성을 높임). 기억하세요 : 지수는 직관적이지 않고 인간은 이기적입니다!
생일에 대해 많이 생각 해보니 마침내 생일 역설이 저와 함께 클릭합니다. 하지만 확인하기 위해 대화식 예제를 계속 확인합니다.
부록 A : 반복 곱셈 설명 (정확한 공식)
생일이 독립적이라고 가정했던 방법을 기억하십니까? 음, 그렇지 않습니다.
사람 A와 사람 B가 일치하고 사람 B와 C가 일치하면 A와 C도 일치해야한다는 것을 알고 있습니다. A와 C를 일치시키는 결과는 B를 사용한 결과에 따라 달라 지므로 확률은 독립적이지 않습니다. (정말로 독립적 인 경우 A와 C는 일치 확률이 1/365이지만 “100 % 보장 된 일치”라는 것을 알고 있습니다.)
쌍을 계산할 때 생일 일치를 동전 던지기, 곱하기 동일한 확률을 반복합니다.이 가정은 엄격하게 사실이 아니지만 표본 크기 (365)에 비해 소수 (23 명)에게 충분합니다. 여러 사람이 일치하고 독립성을 망칠 가능성이 낮습니다. 좋은 근사치입니다.
가능성은 낮지 만 일어날 수 있습니다. 각 사람이 다른 숫자를 선택할 실제 가능성을 알아 봅시다.
곱하기가 매우 추악 해 보입니다.
하지만 우리가 취할 수있는 지름길이 있습니다. x가 0에 가까울 때 $ e ^ x에 대한 대략적인 1 차 Taylor 근사치 $는 :
그래서
간편한 단축키를 사용하여 큰 방정식을 다음과 같이 다시 작성할 수 있습니다.
1에서 22를 더하면 (22 * 23) / 2이므로 다음과 같이됩니다.
휴. 이 근사치는 매우 가깝습니다. 아래에 자신의 숫자를 입력하세요.
그들이 말하는 것처럼 정부 업무에 충분합니다. 수식을 약간 단순화하고 n을 23으로 바꾸면 다음과 같은 결과를 얻을 수 있습니다.
및
부록 B : 생일 축하 공식
365 개 대신 총 T 항목에서 n 명을 선택하는 공식을 일반화하겠습니다. :
일치 확률 50 %와 같은 확률을 선택하고 n을 구한다면 :
Voila! $ \ sqrt {T} $ 항목을 가져 가면 (선택하기를 원하면 17 % 더) 매치를 얻을 확률이 약 50-50입니다. 다른 숫자를 연결하면 다른 확률을 풀 수 있습니다.
m은 원하는 일치 확률 ( 혼동되기 쉽습니다. 생일을 맞출 확률 90 %를 원한다면 m = 90 % 및 T = 365를 방정식에 대입하고 41 명이 필요하다는 것을 확인하십시오.
위키피디아는 내면의 괴짜를 만족시킬 더 많은 세부 정보를 제공합니다. 계속해서 즐기십시오.
이 시리즈의 다른 게시물
- 확률에 대한 간략한 소개 & 통계
- 베이 즈 정리에 대한 직관적 (짧은) 설명
- 비율로 베이 즈 정리 이해
- 몬티 홀 문제 이해
- 평균
- 생일 역설 이해