23 persone. In una stanza di sole 23 persone cè una probabilità del 50-50 che almeno due persone abbiano lo stesso compleanno. In una stanza di 75 persone cè una probabilità del 99,9% che almeno due persone corrispondano.
Metti giù la calcolatrice e il forcone, non parlo di eresia. Il paradosso del compleanno è strano, controintuitivo e completamente vero. È solo un “paradosso” perché il nostro cervello non è in grado di gestire il potere di composizione degli esponenti. Ci aspettiamo che le probabilità siano lineari e consideriamo solo gli scenari in cui siamo coinvolti (entrambi i presupposti errati, a proposito).
Vediamo perché si verifica il paradosso e come funziona.
Problema 1: gli esponenti non sono intuitivi
Abbiamo imparato da soli matematica e statistica, ma non prendiamoci in giro: non è naturale.
Ecco un esempio: qual è la possibilità di ottenere 10 teste di fila quando si lanciano monete? Il cervello inesperto potrebbe pensare in questo modo:
“Beh, ottenere una testa è una probabilità del 50%. Ottenere due teste è due volte più difficile, quindi una probabilità del 25%. Ottenere dieci teste è probabilmente 10 volte più difficile … quindi circa il 50% / 10 o il 5% di possibilità. “
E ci sediamo, compiaciuti come un insetto su un tappeto. Niente dadi.
Ma anche dopo lallenamento, veniamo scoperti di nuovo. Con un interesse del 5% raddoppieremo i nostri soldi in 14 anni, invece del “previsto” 20. Hai dedotto naturalmente la regola del 72 quando hai imparato a conoscere i tassi di interesse? Probabilmente no. Comprendere la crescita esponenziale composta con il nostro cervello lineare è difficile.
Problema 2: gli esseri umani sono un po egoisti
Dai unocchiata alle notizie. Nota quante delle notizie negative sono il risultato di agire senza considerare gli altri. Sono un ottimista e ho speranza per lumanità, ma questa è una discussione a parte :).
In una stanza di 23, pensi ai 22 confronti in cui il tuo compleanno viene confrontato con quello di qualcun altro? Probabilmente.
Pensi ai 231 confronti in cui qualcuno che non è te viene confrontato con qualcun altro che non sei tu? Ti rendi conto che ce ne sono così tanti? Probabilmente no.
Il fatto che trascuriamo il 10 volte più confronti che non ci includono ci aiuta a capire perché il “paradosso” può accadere.
Ok, bene, gli umani sono orribili: fammi vedere la matematica!
Il q uestion: quali sono le possibilità che due persone condividano un compleanno in un gruppo di 23?
Certo, potremmo elencare le coppie e contare tutti i modi in cui potrebbero corrispondere. Ma è difficile: potrebbero esserci 1, 2, 3 o anche 23 partite!
È come chiedere “Qual è la possibilità di ottenere una o più teste in 23 lanci di monete?” Ci sono così tante possibilità: testa al primo lancio, o al 3 °, o allultimo, o il 1 ° e il 3 °, il 2 ° e il 21 ° e così via.
Come risolviamo il problema delle monete? Capovolgi tutto (capito? Capito?). Invece di contare in tutti i modi per ottenere testa, trova la possibilità di ottenere tutte le code, il nostro “scenario problematico”.
Se cè una probabilità dell1% di ottenere tutte le code (più come .5 ^ 23 ma lavora con me qui), cè una probabilità del 99% di avere almeno una testa. Non so se è 1 testa, o 2, o 15 o 23: abbiamo teste, e questo è ciò che conta. Se sottraiamo la probabilità di uno scenario problematico da 1, ci resta la probabilità di uno scenario positivo.
Lo stesso principio si applica ai compleanni. Invece di trovare tutti i modi in cui abbiniamo, trova la possibilità che tutti siano diversi, lo “scenario problematico”. Quindi prendiamo la probabilità opposta e abbiamo la possibilità di una corrispondenza. Può essere 1, o 2, o 20, ma qualcuno ha trovato una corrispondenza, che è ciò che dobbiamo trovare.
Spiegazione: conteggio delle coppie (formula approssimativa)
Con 23 persone abbiamo 253 coppie:
(Rispolvera combinazioni e permutazioni, se vuoi).
La possibilità che 2 persone abbiano compleanni diversi è:
Ha senso, giusto? Quando si confrontano il compleanno di una persona con unaltra, in 364 casi su 365 non si abbinano. Bene. .
Ma fare 253 confronti e renderli tutti diversi è come ottenere testa 253 volte di seguito: dovevi schivare “croce” ogni volta. Otteniamo una soluzione approssimativa fingendo confronti di compleanno sono come lanci di monete. (Vedi Appendice A per il calcolo esatto.)
Usiamo esponenti per trovare la probabilità:
La nostra possibilità di perdere un singolo errore è piuttosto alta (99,7260%), ma se cogli questa possibilità centinaia di volte, le probabilità di mantenere quella serie diminuiscono. Veloce.
La possibilità di trovare una corrispondenza è: 1 – 49,95% = 50,05%, o poco più della metà! Se vuoi trovare la probabilità di una corrispondenza per qualsiasi numero di persone n, la formula è:
Esempio interattivo
Non credevo che avessimo bisogno solo di 23 persone. La matematica funziona, ma è reale?
Ci puoi scommettere.Prova lesempio seguente: scegli un numero di elementi (365), un numero di persone (23) ed esegui alcune prove. Vedrai la partita teorica e la tua partita effettiva mentre esegui le prove. Vai avanti, fai clic sul pulsante (o visualizza la pagina intera).
Man mano che esegui sempre più prove (continua a fare clic!), La probabilità effettiva dovrebbe avvicinarsi a quella teorica.
Esempi e Takeaways
Ecco alcune lezioni dal paradosso del compleanno:
- $ \ sqrt {n} $ è più o meno il numero necessario per avere il 50% di possibilità di un corrisponde a n elementi. $ \ sqrt {365} $ è circa 20. Questo entra in gioco in crittografia per lattacco del compleanno.
- Anche se ci sono 2128 (1e38) GUID, ne abbiamo solo 264 (1e19) da utilizzare prima una probabilità del 50% di collisione. E il 50% è davvero, molto alto.
- Hai solo bisogno di 13 persone che scelgono le lettere dellalfabeto per avere il 95% di possibilità di una corrispondenza. Provalo sopra (persone = 13, oggetti = 26).
- La crescita esponenziale riduce rapidamente la possibilità di scegliere oggetti unici (ovvero aumenta le possibilità di una corrispondenza). Ricorda: gli esponenti non sono intuitivi e gli umani sono egoisti!
Dopo averci pensato a lungo, finalmente mi viene in mente il paradosso del compleanno. Ma continuo a dare unocchiata allesempio interattivo solo per essere sicuro.
Appendice A: spiegazione della moltiplicazione ripetuta (formula esatta)
Ricordi come pensavamo che i compleanni fossero indipendenti? Ebbene, non lo sono.
Se la persona A e la persona B corrispondono e la persona B e C corrispondono, sappiamo che anche A e C devono corrispondere. Il risultato della corrispondenza di A e C dipende dai loro risultati con B, quindi le probabilità non sono indipendenti. (Se veramente indipendenti, A e C avrebbero una probabilità di 1/365 di abbinamento, ma sappiamo che “è una corrispondenza garantita al 100%.)
Quando si contano le coppie, abbiamo trattato le partite di compleanno come lanci di monete, moltiplicando la stessa probabilità più e più volte. Questa ipotesi non è del tutto vera ma è abbastanza buona per un piccolo numero di persone (23) rispetto alla dimensione del campione (365). È improbabile che più persone corrispondano e rovinino lindipendenza, quindi è una buona approssimazione.
È improbabile, ma può succedere. Calcoliamo le reali possibilità che ogni persona scelga un numero diverso:
La moltiplicazione sembra piuttosto brutta:
Ma cè una scorciatoia che possiamo prendere. Quando x è vicino a 0, unapprossimazione di Taylor grossolana del primo ordine per $ e ^ x $ è:
quindi
Usando la nostra comoda scorciatoia possiamo riscrivere la grande equazione in:
Laggiunta di 1 a 22 è (22 * 23) / 2 in modo da ottenere:
Phew. Questa approssimazione è molto vicina, inserisci i tuoi numeri di seguito:
Abbastanza buono per il lavoro del governo, come si suol dire. Se si semplifica un po la formula e si scambia n per 23 si ottiene:
e
Appendice B: La formula generale del compleanno
Generalizziamo la formula per selezionare n persone da T elementi totali (invece di 365) :
Se scegliamo una probabilità (come il 50% di probabilità di una corrispondenza) e risolviamo per n:
Voilà! Se prendi $ \ sqrt {T} $ articoli (il 17% in più se vuoi essere pignolo) hai circa il 50-50 di possibilità di ottenere una corrispondenza. Se inserisci altri numeri puoi risolvere per altre probabilità:
Ricorda che m è la probabilità desiderata di una corrispondenza ( è facile confondersi, lho fatto io stesso). Se vuoi il 90% di possibilità di abbinare i compleanni, inserisci m = 90% e T = 365 nellequazione e vedi che hai bisogno di 41 persone.
Wikipedia ha ancora più dettagli per soddisfare il tuo secchione interiore. Vai avanti e divertiti.
Altri post in questa serie
- Una breve introduzione alla probabilità & Statistiche
- Una spiegazione intuitiva (e breve) del teorema di Bayes
- Comprensione del teorema di Bayes con i rapporti
- Comprensione del problema di Monty Hall
- Come analizzare i dati usando il Media
- Comprensione del paradosso del compleanno