Porozumění narozeninovému paradoxu

23 lidí. V místnosti pouze 23 lidí je 50-50 šance, že alespoň dva lidé budou mít stejné narozeniny. V 75 místnosti je 99,9% šance, že se alespoň dva lidé shodnou.

Odložte kalkulačku a vidle, nemluvím kacířstvím. Paradox narozenin je podivný, protiintuitivní a zcela pravdivý. Je to jen „paradox“, protože náš mozek nedokáže zvládnout sloučeninu síly exponentů. Očekáváme, že pravděpodobnosti budou lineární a vezmeme v úvahu pouze scénáře, kterých se účastníme (mimochodem oba chybné předpoklady).

Podívejme se, proč se paradox stává a jak funguje.

Problém 1: Exponenti nejsou intuitivní

Naučili jsme se matematiku a statistiku, ale nedělejme si srandu: není to přirozené.

Zde je příklad: Jaká je šance, že při převracení mincí dostanete 10 hlav za sebou? takto:

„No, získání jedné hlavy je 50% šance. Získat dvě hlavy je dvakrát tak těžké, takže 25% šance. Získat deset hlav je pravděpodobně 10krát těžší … takže asi 50% / 10 nebo 5% šance. “

A tam sedíme a samolibě jako brouk na koberci. Žádná kostka bub.

Ale i po tréninku jsme znovu chyceni. Při 5% úroku zdvojnásobíme naše peníze za 14 let, spíše než „očekávaných“ 20. Věděli jste přirozeně odvodit pravidlo 72, když se dozvíte o úrokových sazbách? Pravděpodobně ne. Porozumět složenému exponenciálnímu růstu s našimi lineárními mozky je těžké.

Problém 2: Lidé jsou trochu sobečtí

Podívejte se na novinky. Všimněte si, kolik negativních zpráv je výsledkem jednání bez ohledu na ostatní. Jsem optimista a máte naději pro lidstvo, ale to je samostatná diskuse :).

Myslíte si v místnosti 23, na 22 srovnání, kde jsou vaše narozeniny porovnávány s něčím jiným? Pravděpodobně.

Myslíte na 231 srovnání, kdy někdo, kdo není vy, je kontrolován proti někomu jinému, kdo není vy? Uvědomujete si, že jich je tolik? Pravděpodobně ne.

Skutečnost, že zanedbáváme 10krát tolik srovnání, která nás nezahrnují, nám pomáhá pochopit, proč se „paradox“ může stát.

Dobře, dobře, lidé jsou hrozní: Ukažte mi matematiku!

The q uestion: Jaké jsou šance, že dva lidé sdílejí narozeniny ve skupině 23?

Jistě, mohli bychom uvést seznam párů a spočítat všechny způsoby, jak se mohou shodovat. Ale to je těžké: mohlo by to být 1, 2, 3 nebo dokonce 23 zápasů!

Je to jako ptát se: „Jaká je šance získat jednu nebo více hlav ve 23 mincích?“ Existuje tolik možností: hlavy při prvním hodu, nebo 3. nebo poslední, nebo 1. a 3., 2. a 21. atd.

Jak vyřešíme problém s mincí? Flip it around (Get it? Get it?). Spíše než počítat všechny způsoby, jak dostat hlavy, najděte šanci získat všechny ocasy, náš „problémový scénář“.

Pokud existuje 1% šance na získání všechny ocasy (více jako 0,5 ^ 23, ale pracujte zde se mnou), existuje 99% šance, že budete mít alespoň jednu hlavu. Nevím, jestli je to 1 hlava, nebo 2, nebo 15 nebo 23: máme hlavy, a na tom záleží. Pokud odečteme šanci na problémový scénář od 1, zůstane nám pravděpodobnost dobrého scénáře.

Stejný princip platí pro narozeniny. Místo toho, abychom našli všechny způsoby, kterými se shodujeme, najděte šanci, že každý je jiný, „scénář problému“. Pak vezmeme opačnou pravděpodobnost a dostaneme šanci na zápas. Může to být 1 zápas, nebo 2 nebo 20, někdo souhlasil, což je to, co musíme najít.

Vysvětlení: Počítání párů (přibližný vzorec)

S 23 lidmi máme 253 párů:

(Pokud chcete, oprášte kombinace a permutace.)

Pravděpodobnost, že 2 lidé budou mít jiné narozeniny, je:

Dává to smysl, že? Při srovnání narozenin jedné osoby s druhou se ve 364 z 365 scénářů nevyrovná. Fajn .

Ale dělat srovnání 253 a mít je úplně jiné je jako dostat hlavy 253krát za sebou – pokaždé jste se museli vyhnout „ocasu“. Pojďme získat přibližné řešení předstíráním narozeninových srovnání jsou jako převrácení mince. (Přesný výpočet najdete v příloze A.)

K určení pravděpodobnosti používáme exponenty:

Naše šance na získání jediné slevy je docela vysoká (99,7260%), ale když tuto šanci využijete stokrát, šance na udržení této řady klesnou. Rychle.

Šance, že najdeme shodu, je: 1 – 49,95% = 50,05%, nebo něco přes polovinu! Pokud chcete zjistit pravděpodobnost shody pro libovolný počet lidí, n je vzorec:

Interaktivní příklad

Nevěřil jsem, že potřebujeme jen 23 lidí. Matematika funguje, ale je to skutečné?

Sázíte.Vyzkoušejte následující příklad: Vyberte počet položek (365), počet lidí (23) a proveďte několik zkoušek. Během zkoušek uvidíte teoretickou a skutečnou shodu. Pokračujte kliknutím na tlačítko (nebo se podívejte na celou stránku).

Jak provádíte více a více pokusů (klikejte dál!), Skutečná pravděpodobnost by se měla blížit té teoretické.

Příklady a Takeaways

Zde je několik lekcí z narozeninového paradoxu:

  • $ \ sqrt {n} $ je zhruba číslo, které potřebujete, abyste měli 50% šanci na shoda s n položkami. $ \ sqrt {365} $ je asi 20. To se v kryptografii používá pro útok na narozeniny.
  • I když existuje 2128 (1e38) identifikátorů GUID, máme k dispozici pouze 264 (1e19) 50% šance na kolizi. A 50% je opravdu, opravdu vysokých.
  • Potřebujete jen 13 lidí, kteří si vybírají písmena abecedy, abyste měli 95% šanci na shodu. Vyzkoušejte to výše (people = 13, items = 26).
  • Exponenciální růst rychle snižuje šanci na výběr jedinečných předmětů (aka zvyšuje šance na shodu). Pamatujte: exponenti nejsou intuitivní a lidé jsou sobečtí!

Poté, co jsem o tom hodně přemýšlel, narozeninový paradox konečně klikl se mnou. Ale přesto si pro jistotu prohlédnu interaktivní příklad.

Příloha A: Vysvětlení opakovaného násobení (přesný vzorec)

Pamatujete si, jak jsme předpokládali, že narozeniny jsou nezávislé? No, nejsou.

Pokud se shodují Osoba A a Osoba B a Osoba B a C, víme, že A a C se také musí shodovat. Výsledek shody A a C závisí na jejich výsledcích s B, takže pravděpodobnosti nejsou nezávislé. (Jsou-li skutečně nezávislé, A a C by měly šanci na shodu 1/365, ale víme, že je to 100% zaručená shoda.)

Při počítání párů jsme zacházeli s narozeninovými zápasy jako s házením mince stejná pravděpodobnost znovu a znovu. Tento předpoklad není striktně pravdivý, ale je dost dobrý pro malý počet lidí (23) ve srovnání s velikostí vzorku (365). Je nepravděpodobné, že by více lidí odpovídalo a osamostatňovalo nezávislost, takže je to dobrá aproximace.

Je to nepravděpodobné, ale může se to stát. Pojďme zjistit skutečné šance každého člověka vybrat jiné číslo:

Násobení vypadá docela ošklivě:

Ale existuje zkratka, kterou můžeme použít. Když je x blízko 0, hrubá Taylorova aproximace prvního řádu pro $ e ^ x $ is:

tak

Pomocí naší praktické zkratky můžeme velkou rovnici přepsat na:

Přidání 1 až 22 je (22 * 23) / 2, takže dostaneme:

Uf. Tato aproximace je velmi blízká, připojte níže svá vlastní čísla:

Dostatečně dobré pro vládní práci, jak se říká. Pokud trochu zjednodušíte vzorec a vyměníte n za 23, dostanete:

a

Příloha B: Obecný vzorec narozenin

Zobecníme vzorec tak, aby vybíral n lidí z celkového počtu položek T (namísto 365) :

Pokud zvolíme pravděpodobnost (například 50% šanci na shodu) a vyřešíme pro n:

Voila! Pokud si vezmete $ \ sqrt {T} $ položky (o 17% více, pokud chcete být vybíraví), máte asi 50-50 šanci na shodu. Pokud připojíte další čísla, můžete vyřešit další pravděpodobnosti:

Nezapomeňte, že m je požadovaná šance na shodu ( je snadné se zmást, udělal jsem to sám). Pokud chcete 90% šanci na shodné narozeniny, zapojte m = 90% a T = 365 do rovnice a uvidíte, že potřebujete 41 lidí.

Wikipedia má ještě více podrobností, aby uspokojila vašeho vnitřního blbeče. Jděte do toho a užívejte si.

Další příspěvky v této sérii

  1. Stručný úvod k pravděpodobnosti & Statistiky
  2. Intuitivní (a krátké) vysvětlení Bayesovy „věty
  3. Pochopení Bayesovy věty s poměry
  4. Porozumění problému Montyho Halla
  5. Jak analyzovat data pomocí Průměr
  6. Porozumění narozeninovému paradoxu

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *