Syntymäpäiväparadoksin ymmärtäminen

23 ihmistä. Vain 23 hengen huoneessa on 50-50 mahdollisuus, että vähintään kahdella henkilöllä on sama syntymäpäivä. 75 hengen huoneessa on 99,9% mahdollisuus, että vähintään kaksi ihmistä täsmää.

Laske laskin ja piki, en puhu harhaoppi. Syntymäpäivän paradoksi on outo, intuitiivinen ja täysin totta. Se on vain ”paradoksi”, koska aivomme eivät kykene käsittelemään eksponenttien yhdistämisvoimaa. Odotamme todennäköisyyksien olevan lineaarisia ja otamme huomioon vain ne skenaariot, joissa olemme mukana (muuten virheelliset oletukset).

Katsotaan, miksi paradoksi tapahtuu ja miten se toimii.

Tehtävä 1: Eksponentit eivät ole intuitiivisia

Olemme opettaneet itsellemme matematiikkaa ja tilastoja, mutta älä unohda itseämme: se ei ole luonnollista.

Tässä on esimerkki: Mikä on mahdollisuus saada 10 päätä peräkkäin, kun käännät kolikoita? näin:

”No, yhden pään saaminen on 50% mahdollisuus. Kahden pään saaminen on kaksi kertaa niin vaikeaa, joten 25% mahdollisuus. Kymmenen pään saaminen on luultavasti 10 kertaa vaikeampi … joten noin 50% / 10 tai 5% mahdollisuus. ”

Ja siellä istumme, itsepäinen kuin vika matolla. Ei noppakuplaa.

Mutta jopa harjoittelun jälkeen jäämme kiinni. Viiden prosentin korolla tuplamme rahamme 14 vuodessa ”odotetun” 20 sijasta. Oletko luonnollisesti päättänyt 72 säännöstä, kun opit korkoja? Luultavasti ei. Ymmärtää yhdistettyä eksponentiaalista kasvua lineaaristen aivojemme avulla on vaikeaa.

Ongelma 2: Ihmiset ovat hiukan itsekkäitä

Katsokaa uutisia. Huomaa, kuinka suuri osa negatiivisista uutisista on seurausta toimimisesta ottamatta huomioon muita. Olen optimistinen ja toivoo ihmiskunnalle, mutta se on erillinen keskustelu :).

Ajatteletko huoneessa, jossa on 23 henkilöä, 22 vertailua, joissa syntymäpäivääsi verrataan jonkun muun omaan? Luultavasti.

Ajatteletko 231 vertailua, joissa joku muu kuin sinä tarkistetaan jonkun muun kanssa, joka ei ole sinä? Ymmärrätkö, että niitä on niin paljon? Luultavasti ei.

Se, että laiminlyömme 10 kertaa niin monta vertailua, jotka eivät sisällä meitä, auttaa meitä ymmärtämään miksi ”paradoksi” voi tapahtua.

Ok, hieno, ihmiset ovat kauheita: Näytä minulle matematiikka!

q uestion: Kuinka suurella todennäköisyydellä kaksi ihmistä jakaa syntymäpäivänsä 23 hengen ryhmässä?

Voimme varmasti listata parit ja laskea kaikki tapoja, joilla he voivat sopia yhteen. Mutta se on vaikeaa: otteluita voi olla 1, 2, 3 tai jopa 23!

Se on kuin kysyttäisiin ”Mikä on mahdollisuus saada yksi tai useampi pää 23 kolikkolevyssä?” Mahdollisuuksia on niin monta: päät ensimmäisellä heitolla tai 3. tai viimeinen tai 1. ja 3., 2. ja 21. ja niin edelleen.

Kuinka kolikko-ongelma ratkaistaan? Käännä se ympäri (hanki se? Hanki se?). Sen sijaan, että laskisit jokaista tapaa saada päät, etsi mahdollisuus saada kaikki hännät, ”ongelmaskenaario”.

Jos on 1% mahdollisuus saada kaikki hännät (enemmän kuin .5 ^ 23, mutta työskentele kanssani täällä), on 99% mahdollisuus saada vähintään yksi pää. En tiedä onko se 1 pää vai 2, vai 15 tai 23: Meillä on päät, ja sillä on merkitystä. Jos vähennämme ongelmaskenaarion todennäköisyyden yhdestä, meille jää hyvien skenaarioiden todennäköisyys.

Sama periaate pätee syntymäpäiviin. Sen sijaan, että löydettäisiin kaikki sopivat tapamme, etsi mahdollisuus ”kaikki ovat erilaiset”, ”ongelmaskenaario”. Otamme sitten päinvastaisen todennäköisyyden ja saamme ottelun mahdollisuuden. Se voi olla yksi ottelu tai 2 tai 20, mutta joku osui, mikä meidän on löydettävä.

Selitys: Parien laskeminen (likimääräinen kaava)

23 ihmisen kanssa meillä on 253 paria:

(Harjaa yhdistelmiä ja permutaatioita, jos haluat).

Kahden ihmisen syntymäpäivät ovat mahdollisia:

Onko järkevää, eikö? Verrattaessa yhden henkilön syntymäpäivää toiseen, 364 365 tilanteesta ei voittanut. .

Mutta 253 vertailun tekeminen ja niiden kaikkien erottaminen on kuin saada päät 253 kertaa peräkkäin – sinun täytyi väistää ”hännät” joka kerta. Saakaamme ”likimääräinen ratkaisu teeskentelemällä syntymäpäivävertailuja” ovat kuin kolikkolevyt. (Tarkka laskelma on liitteessä A.)

Todennäköisyys löydetään eksponenteilla:

Mahdollisuutemme saada yksi epäonnistuminen on melko korkea (99,7260%), mutta kun käytät tätä mahdollisuutta satoja kertoja, kertoimet tämän putken pitämisestä laskevat. Nopeasti.

Mahdollisuus löytää ottelu on: 1 – 49,95% = 50,05% tai hieman yli puolet! Jos haluat löytää ottelun todennäköisyyden mihin tahansa määrään ihmisiä, kaava on:

Vuorovaikutteinen esimerkki

En uskonut tarvitsevamme vain 23 ihmistä. Matematiikka toimii, mutta onko se todellista?

Panostat.Kokeile alla olevaa esimerkkiä: Valitse joukko kohteita (365), joukko ihmisiä (23) ja suorita muutama kokeilu. Näet teoreettisen ottelun ja todellisen ottelun, kun suoritat kokeita. Napsauta eteenpäin, napsauta painiketta (tai katso koko sivu).

Kun suoritat yhä useampia kokeita (jatka napsauttamista!), Todellisen todennäköisyyden tulisi lähestyä teoreettista.

Esimerkkejä ja Takeaways

Tässä on muutama opas syntymäpäiväparadoksista:

  • $ \ sqrt {n} $ on suurin piirtein numero, jonka tarvitset 50% mahdollisuuteen vastaa n kohdetta. $ \ sqrt {365} $ on noin 20. Tämä tulee esiin syntymäpäivähyökkäyksen salauksessa.
  • Vaikka käytettävissä on 2128 (1e38) GUID-tunnusta, meillä on vain 264 (1e19) käytettävä ennen 50% mahdollisuus törmäykseen. Ja 50% on todella, todella korkea.
  • Tarvitset vain 13 ihmistä, jotka valitsevat aakkoset, jotta sinulla olisi 95% mahdollisuus otteluun. Kokeile sitä yllä (ihmiset = 13, kohteet = 26).
  • Eksponentiaalinen kasvu vähentää nopeasti mahdollisuuksia valita yksilöllisiä esineitä (eli se lisää ottelun mahdollisuuksia). Muista: eksponentit eivät ole intuitiivisia ja ihmiset ovat itsekkäitä!

Kun olet miettinyt sitä paljon, syntymäpäiväjärjestys napsauttaa lopulta minua. Mutta tutustun silti interaktiiviseen esimerkkiin vain varmistaakseni.

Liite A: Toistetun kertolaskujen selitys (tarkka kaava)

Muistatko, kuinka luulimme syntymäpäivien olevan itsenäisiä? Ne eivät ole.

Jos henkilö A ja henkilö B ja henkilö B ja C vastaavat, tiedämme, että myös A: n ja C: n on vastattava toisiaan. A: n ja C: n sovittamisen tulos riippuu niiden tuloksista B: n kanssa, joten todennäköisyydet eivät ole riippumattomia. (Jos todella itsenäinen, A: lla ja C: llä olisi 1/365 mahdollisuus toisiinsa, mutta tiedämme, että se on 100% taattu ottelu.)

Laskettaessa pareja käsittelimme syntymäpäiväotteluja kuten kolikkolappuja, kertomalla. sama todennäköisyys uudestaan ja uudestaan. Tämä oletus ei ole ehdottomasti totta, mutta se on tarpeeksi hyvä pienelle määrälle ihmisiä (23) verrattuna otoksen kokoon (365). On epätodennäköistä, että useat ihmiset sopivat yhteen ja ruuvataan itsenäisyyttä, joten se on hyvä arvio.

Se on epätodennäköistä, mutta se voi tapahtua. Selvitetään jokaisen henkilön todelliset mahdollisuudet valita eri numero:

Kertolasku näyttää melko rumalta:

Mutta voimme käyttää pikakuvaketta. Kun x on lähellä 0, karkea ensimmäisen asteen Taylorin likiarvo arvolle $ e ^ x $ on:

niin

Kätevällä pikakuvakkeellamme voimme kirjoittaa ison yhtälön uudestaan:

1: n lisääminen 22: een on (22 * 23) / 2, joten saamme:

Phew. Tämä likiarvo on hyvin lähellä, liitä omat numerosi alla:

Riittävän hyvä valtion työhön, kuten sanotaan. Jos yksinkertaistat kaavaa hieman ja vaihdat n: n arvoon 23, saat:

ja

Liite B: Yleinen syntymäpäiväkaava

Yleistetään kaava siten, että n henkilöä valitaan T-kohteista yhteensä (365: n sijaan) :

Jos valitsemme todennäköisyyden (kuten 50% ottelun mahdollisuus) ja ratkaisemme arvolle n:

Voila! Jos otat $ \ sqrt {T} $ -tuotteita (17% enemmän, jos haluat olla nirso), sinulla on noin 50-50 mahdollisuus saada ottelu. Jos kytket muita numeroita, voit ratkaista muut todennäköisyydet:

Muista, että m on haluttu ottelun mahdollisuus ( on helppo sekoittua, tein sen itse). Jos haluat, että syntymäpäivät sopivat 90%, liitä m = 90% ja T = 365 yhtälöön ja huomaa, että tarvitset 41 henkilöä.

Wikipediassa on vielä enemmän yksityiskohtia tyydyttääkseen sisemmän nörtin. Mene eteenpäin ja nauti.

Muita tämän sarjan viestejä

  1. Lyhyt esittely todennäköisyydestä & Tilastot
  2. Intuitiivinen (ja lyhyt) selitys Bayes-lauseelle
  3. Bayes-teeman ymmärtäminen suhteilla
  4. Monty Hall -ongelman ymmärtäminen
  5. tietojen analysointi Keskimääräinen
  6. syntymäpäiväparadoksin ymmärtäminen

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *