Înțelegerea paradoxului zilei de naștere

23 de persoane. Într-o cameră de doar 23 de persoane există 50-50 de șanse ca cel puțin două persoane să aibă aceeași zi de naștere. Într-o cameră de 75 de persoane există 99,9% șanse ca cel puțin două persoane să se potrivească.

Puneți calculatorul și furculița, nu vorbesc erezie. Paradoxul zilei de naștere este ciudat, contra-intuitiv și complet adevărat. Este doar un „paradox”, deoarece creierul nostru nu poate face față puterii de compunere a exponenților. Ne așteptăm ca probabilitățile să fie liniare și luăm în considerare doar scenariile în care suntem implicați (apropo, ambele ipoteze defecte).

Să vedem de ce se întâmplă paradoxul și cum funcționează.

Problema 1: Exponenții nu sunt intuitivi

Ne-am învățat matematică și statistici, dar să nu ne îndrăgostim: nu este firesc.

Iată un exemplu: Care este șansa de a obține 10 capete la rând atunci când aruncați monede? Creierul neinstruit ar putea gândi așa:

„Ei bine, obținerea unui cap este o șansă de 50%. A obține două capete este de două ori mai greu, deci o șansă de 25%. A obține zece capete este probabil de 10 ori mai greu … deci aproximativ 50% / 10 sau o șansă de 5%. ”

Și acolo ne așezăm, umflați ca un bug pe un covor. Fără zaruri.

Dar chiar și după antrenament, suntem prinși din nou. Cu o dobândă de 5%, ne vom dubla banii în 14 ani, mai degrabă decât „așteptatul” 20. Ai dedus în mod natural regula 72 când ai aflat despre ratele dobânzii? Probabil că nu. Înțelegerea creșterii exponențiale compuse cu creierele noastre liniare este dificilă.

Problema 2: Oamenii sunt cam egoisti

Aruncă o privire asupra știrilor. Observă cât de multe dintre știrile negative sunt rezultatul acțiunii fără a-i lua în considerare pe alții. optimist și aveți speranță pentru omenire, dar asta este o discuție separată :).

Într-o sală de 23, vă gândiți la cele 22 de comparații în care ziua dvs. de naștere este comparată cu cea a altcuiva? Probabil.

Vă gândiți la cele 231 de comparații în care cineva care nu este dvs. este comparat cu altcineva care nu sunteți dvs.? Vă dați seama că sunt atât de mulți? Probabil că nu.

Faptul că neglijăm de 10 ori mai multe comparații care nu ne includ, ne ajută să vedem de ce se poate întâmpla „paradoxul”.

Ok, bine, oamenii sunt îngrozitori: Arată-mi matematica!

q întrebare: Care sunt șansele ca două persoane să împărtășească ziua de naștere într-un grup de 23 de persoane?

Sigur, am putea enumera perechile și vom număra toate modurile în care s-ar putea potrivi. Dar este greu: ar putea exista 1, 2, 3 sau chiar 23 de meciuri!

Este ca și cum ai întreba „Care este șansa de a obține unul sau mai multe capete în 23 de monede?” Există atât de multe posibilități: capete la prima aruncare, sau a 3-a, sau ultima, sau prima și a 3-a, a 2-a și a 21-a și așa mai departe.

Cum rezolvăm problema monedei? Întoarceți-l (Obțineți-l? Obțineți-l?). În loc să numărați toate modalitățile de a obține capete, găsiți șansa de a obține toate cozile, „scenariul nostru de probleme”.

Dacă există o șansă de 1% de a obține toate cozile (mai mult ca .5 ^ 23, dar lucrați cu mine aici), există șanse de 99% să aveți cel puțin un cap. Nu știu dacă este 1 cap, sau 2, sau 15 sau 23: avem capete și asta contează. Dacă scădem șansa unui scenariu de problemă de la 1, rămânem cu probabilitatea unui scenariu bun.

Același principiu se aplică și pentru zilele de naștere. În loc să găsiți toate modurile în care ne potrivim, găsiți șansa ca toată lumea să fie diferită, „scenariul problemei”. Luăm apoi probabilitatea opusă și avem șansa unui meci. Poate fi 1 meci, sau 2, sau 20, dar cineva s-a potrivit, ceea ce trebuie să găsim.

Explicație: Numărarea perechilor (Formula aproximativă)

Cu 23 de persoane avem 253 de perechi:

(Alegeți combinațiile și permutările, dacă doriți).

Șansa ca 2 persoane să aibă zile de naștere diferite este:

Are sens, nu? Când comparați ziua de naștere a unei persoane cu alta, în 364 din 365 de scenarii nu au câștigat. .

Dar a face 253 de comparații și a le face pe toate să fie diferite este ca și cum ai obține capetele de 253 de ori la rând – trebuia să eviți „cozile” de fiecare dată. Să obținem o soluție aproximativă pretinzând comparații de ziua de naștere sunt ca niște monede. (A se vedea Anexa A pentru calculul exact.)

Folosim exponenți pentru a găsi probabilitatea:

Șansele noastre de a obține o singură ratare sunt destul de mari (99,7260%), dar atunci când aveți această șansă de sute de ori, șansele de a menține acea serie scad. Rapid.

Șansa să găsim o potrivire este: 1 – 49,95% = 50,05%, sau puțin peste jumătate! Dacă doriți să găsiți probabilitatea unei potriviri pentru orice număr de persoane n formula este:

Exemplu interactiv

Nu credeam că avem nevoie doar de 23 de persoane. Matematica funcționează, dar este reală?

Pari.Încercați exemplul de mai jos: alegeți un număr de articole (365), un număr de persoane (23) și rulați câteva încercări. Veți vedea meciul teoretic și meciul real în timp ce vă derulați probele. Continuați, faceți clic pe buton (sau vedeți pagina completă).

Pe măsură ce rulați din ce în ce mai multe probe (continuați să faceți clic!), Probabilitatea reală ar trebui să se apropie de cea teoretică.

Exemple și Takeaways

Iată câteva lecții din paradoxul zilei de naștere:

  • $ \ sqrt {n} $ este aproximativ numărul de care aveți nevoie pentru a avea o șansă de 50% se potrivesc cu n elemente. $ \ sqrt {365} $ este de aproximativ 20. Acest lucru intră în joc în criptografie pentru atacul de ziua de naștere.
  • Chiar dacă există 2128 (1e38) GUID-uri, avem doar 264 (1e19) de utilizat înainte o șansă de coliziune de 50%. Și 50% este foarte, foarte mare.
  • Ai nevoie de doar 13 persoane care aleg literele alfabetului pentru a avea 95% șanse să se potrivească. Încercați mai sus (oameni = 13, obiecte = 26).
  • Creșterea exponențială scade rapid șansa de a alege obiecte unice (de asemenea, crește șansele unui meci). Amintiți-vă: exponenții sunt non-intuitivi, iar oamenii sunt egoiști!

După ce m-am gândit mult la asta, paradoxul zilei de naștere dă clic în cele din urmă cu mine. Dar verific în continuare exemplul interactiv doar pentru a mă asigura.

Anexa A: Explicația multiplicării repetate (Formula exactă)

Vă amintiți cum am presupus că zilele de naștere sunt independente? Ei bine, nu sunt.

Dacă Persoana A și Persoana B se potrivesc și Persoana B și C se potrivesc, știm că și A și C trebuie să se potrivească. Rezultatul potrivirii A și C depinde de rezultatele lor cu B, deci probabilitățile nu sunt independente. (Dacă sunt cu adevărat independenți, A și C ar avea 1/365 șanse de potrivire, dar știm că este o potrivire 100% garantată.)

Atunci când numărăm perechi, am tratat meciurile de ziua de naștere ca monedele, înmulțind aceeași probabilitate. Această presupunere nu este strict adevărată, dar este suficient de bună pentru un număr mic de persoane (23) în comparație cu dimensiunea eșantionului (365). Este puțin probabil ca mai multe persoane să se potrivească și să înșele independența, deci este o aproximare bună.

Este puțin probabil, dar se poate întâmpla. Să ne dăm seama de șansele reale ca fiecare persoană să aleagă un număr diferit:

Înmulțirea pare destul de urâtă:

Dar există o comandă rapidă pe care o putem lua. Când x este aproape de 0, o aproximare grosieră de Taylor de ordinul întâi pentru $ e ^ x $ este:

deci

Folosind comanda rapidă, putem rescrie ecuația mare la:

Adăugarea de la 1 la 22 este (22 * 23) / 2, astfel încât să obținem:

Phew. Această aproximare este foarte apropiată, conectați propriile numere de mai jos:

Suficient de bun pentru munca guvernamentală, așa cum se spune. Dacă simplificați puțin formula și schimbați n pentru 23, veți obține:

și

Anexa B: Formula generală pentru ziua de naștere

Să generalizăm formula pentru a alege n persoane din totalul articolelor T (în loc de 365) :

Dacă alegem o probabilitate (cum ar fi șansa de 50% pentru o potrivire) și rezolvăm pentru n:

Voila! Dacă luați $ \ sqrt {T} $ articole (cu 17% mai mult dacă doriți să fiți pretențioși) atunci aveți aproximativ 50-50 șanse să obțineți un meci. Dacă introduceți alte numere, puteți rezolva alte probabilități:

Amintiți-vă că m este șansa dorită pentru o potrivire ( e ușor să te încurci, am făcut-o eu însumi). Dacă doriți 90% șanse de potrivire a zilelor de naștere, conectați m = 90% și T = 365 în ecuație și vedeți că aveți nevoie de 41 de persoane.

Wikipedia are și mai multe detalii pentru a vă satisface tocilarul interior. Mergeți mai departe și bucurați-vă.

Alte postări din această serie

  1. O scurtă introducere a probabilității & Statistici
  2. O explicație intuitivă (și scurtă) a teoremei „Bayes”
  3. Înțelegerea teoremei lui Bayes cu rapoarte
  4. Înțelegerea problemei Monty Hall
  5. Cum să analizăm datele folosind Media
  6. Înțelegerea paradoxului zilei de naștere

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *