De verjaardagsparadox begrijpen

23 mensen. In een kamer met slechts 23 personen is er een kans van 50-50 dat ten minste twee personen dezelfde verjaardag hebben. In een kamer van 75 personen is er een kans van 99,9% dat ten minste twee mensen overeenkomen.

Leg de rekenmachine en de hooivork neer, ik spreek geen ketterij. De verjaardagsparadox is vreemd, contra-intuïtief en volkomen waar. Het is slechts een “paradox” omdat onze hersenen de samenstellende kracht van exponenten niet aankunnen. We verwachten dat waarschijnlijkheden lineair zijn en kijken alleen naar de scenarios waarin we betrokken zijn (beide foutieve aannames trouwens).

Laten we eens kijken waarom de paradox zich voordoet en hoe het werkt.

Probleem 1: Exponenten zijn niet intuïtief

We hebben onszelf wiskunde en statistiek geleerd, maar laten we onszelf niet voor de gek houden: het is niet natuurlijk.

Hier is een voorbeeld: wat is de kans om 10 koppen op een rij te krijgen bij het omdraaien van munten? Het ongetrainde brein zou kunnen denken zoals dit:

“Nou, één hoofd krijgen is een kans van 50%. Twee koppen krijgen is twee keer zo moeilijk, dus een kans van 25%. Tien hoofden krijgen is waarschijnlijk 10 keer moeilijker… dus ongeveer 50% / 10 of een kans van 5%. ”

En daar zitten we, zelfvoldaan op een tapijt. Geen dobbelstenen.

Maar zelfs na de training worden we opnieuw betrapt. Bij een rente van 5% verdubbelen we ons geld in 14 jaar, in plaats van de “verwachte” 20. Hebt u natuurlijk de Regel van 72 afgeleid bij het leren over rentetarieven? Waarschijnlijk niet. Het begrijpen van samengestelde exponentiële groei met onze lineaire hersenen is moeilijk.

Probleem 2: mensen zijn een beetje egoïstisch

Kijk eens naar het nieuws. Merk op hoeveel van het negatieve nieuws het resultaat is van handelen zonder rekening te houden met anderen. Ik ben een optimist en heb hoop voor de mensheid, maar dat is een aparte discussie :).

Denk je in een kamer van 23 personen aan de 22 vergelijkingen waarin je verjaardag wordt vergeleken met die van iemand anders? Waarschijnlijk.

Denk je aan de 231 vergelijkingen waarbij iemand die niet jij is, wordt vergeleken met iemand anders die jij niet bent? Realiseer je je dat er zoveel zijn? Waarschijnlijk niet.

Het feit dat we negeren de 10 keer zoveel vergelijkingen die ons niet omvatten, helpt ons in te zien waarom de “paradox” kan gebeuren.

Oké, goed, mensen zijn vreselijk: laat me de wiskunde zien!

De q uestion: Hoe groot is de kans dat twee mensen een verjaardag delen in een groep van 23?

Natuurlijk kunnen we de paren opsommen en alle manieren tellen waarop ze kunnen matchen. Maar dat is moeilijk: er kunnen 1, 2, 3 of zelfs 23 matches zijn!

Het is alsof je vraagt “Wat is de kans om een of meer heads te krijgen in 23 coinflips?” Er zijn zoveel mogelijkheden: koppen bij de eerste worp, of de 3e, of de laatste, of de 1e en 3e, de 2e en 21e, enzovoort.

Hoe lossen we het muntprobleem op? Draai het om (snap het? Snap het?). In plaats van elke manier te tellen om hoofden te krijgen, zoek je de kans om alle munt te krijgen, ons “probleemscenario”.

Als er een kans van 1% is om alle staarten (meer als 0,5 ^ 23 maar werk hier met mij), er is een kans van 99% om minstens één kop te hebben. Ik weet niet of het 1 hoofd is, of 2, of 15 of 23: we hebben hoofden, en dat is waar het om gaat. Als we de kans op een probleemscenario aftrekken van 1, blijft de kans op een goed scenario over.

Hetzelfde principe geldt voor verjaardagen. In plaats van alle manieren te vinden die we matchen, zoek je de kans dat iedereen anders is, het probleemscenario. We nemen dan de tegenovergestelde kans en krijgen de kans op een match. Het kan 1 match zijn, of 2, of 20, maar iemand kwam overeen, dat is wat we moeten vinden.

Uitleg: Paren tellen (geschatte formule)

Met 23 mensen hebben we 253 paren:

(Poets combinaties en permutaties op als je wilt).

De kans dat 2 mensen verschillende verjaardagen hebben is:

Klopt toch? Bij het vergelijken van de verjaardag van de ene persoon met de andere, zullen ze in 364 van de 365 scenarios niet matchen. Prima .

Maar 253 vergelijkingen maken en ze allemaal verschillend laten zijn, is als 253 keer achter elkaar koppen – je moest elke keer “staarten” ontwijken. Laten we een geschatte oplossing krijgen door verjaardagsvergelijkingen te doen. zijn als het omdraaien van munten. (Zie bijlage A voor de exacte berekening.)

We gebruiken exponenten om de waarschijnlijkheid te vinden:

Onze kans om een enkele misser te krijgen is behoorlijk hoog (99,7260%), maar als je die kans honderden keren grijpt, neemt de kans dat je die reeks volhoudt af. Snel.

De kans dat we een match vinden is: 1 – 49.95% = 50.05%, of iets meer dan de helft! Als u de waarschijnlijkheid van een overeenkomst voor een willekeurig aantal mensen n wilt vinden, is de formule:

Interactief voorbeeld

Ik dacht niet dat we maar 23 mensen nodig hadden. De wiskunde werkt, maar is het echt?

Reken maar.Probeer het onderstaande voorbeeld: Kies een aantal items (365), een aantal mensen (23) en voer een paar tests uit. U ziet de theoretische wedstrijd en uw daadwerkelijke wedstrijd terwijl u uw proeven uitvoert. Ga je gang, klik op de knop (of bekijk de volledige pagina).

Naarmate je meer en meer tests uitvoert (blijf klikken!), Zou de werkelijke waarschijnlijkheid de theoretische moeten benaderen.

Voorbeelden en afhaalrestaurants

Hier zijn een paar lessen uit de verjaardagsparadox:

  • $ \ sqrt {n} $ is ongeveer het getal dat je nodig hebt om een kans van 50% te hebben op een match met n items. $ \ sqrt {365} $ is ongeveer 20. Dit speelt een rol bij cryptografie voor de verjaardagsaanval.
  • Hoewel er 2128 (1e38) GUIDs zijn, hebben we slechts 264 (1e19) die eerder moeten worden gebruikt 50% kans op een aanrijding. En 50% is echt heel hoog.
  • Je hebt maar 13 mensen nodig die letters van het alfabet kiezen om 95% kans op een overeenkomst te hebben. Probeer het hierboven (mensen = 13, items = 26).
  • Exponentiële groei vermindert snel de kans om unieke items te kiezen (oftewel het verhoogt de kans op een match). Onthoud: exponenten zijn niet intuïtief en mensen zijn egoïstisch!

Na er lang over nagedacht te hebben, klikt de verjaardagsparadox eindelijk in mij. Maar ik bekijk nog steeds het interactieve voorbeeld om er zeker van te zijn.

Bijlage A: Uitleg over herhaalde vermenigvuldiging (exacte formule)

Weet je nog hoe we aannamen dat verjaardagen onafhankelijk zijn? Nou, dat zijn ze niet.

Als persoon A en persoon B overeenkomen en persoon B en C overeenkomen, weten we dat A en C ook moeten overeenkomen. De uitkomst van het matchen van A en C hangt af van hun resultaten met B, dus de kansen zijn niet onafhankelijk. (Als A en C echt onafhankelijk zouden zijn, zouden A en C een kans van 1/365 hebben om te matchen, maar we weten dat het een 100% gegarandeerde match is.)

Bij het tellen van paren behandelden we verjaardagsmatches als het opgooien van munten. dezelfde waarschijnlijkheid keer op keer. Deze aanname is niet helemaal waar, maar het is goed genoeg voor een klein aantal mensen (23) vergeleken met de steekproefomvang (365). Het is onwaarschijnlijk dat meerdere mensen overeenkomen en de onafhankelijkheid verknoeien, dus het is een goede benadering.

Het is onwaarschijnlijk, maar het kan gebeuren. Laten we eens kijken hoe groot de kans is dat elke persoon een ander getal kiest:

De vermenigvuldiging ziet er nogal lelijk uit:

Maar er is een snelkoppeling die we kunnen gebruiken. Als x dicht bij 0 is, een grove Taylor-benadering van de eerste orde voor $ e ^ x $ is:

dus

Met onze handige sneltoets kunnen we de grote vergelijking herschrijven naar:

Het toevoegen van 1 aan 22 is (22 * 23) / 2 dus we krijgen:

Oef. Deze benadering is zeer dichtbij, vul hieronder uw eigen nummers in:

Goed genoeg voor overheidswerk, zoals ze zeggen. Als je de formule een beetje vereenvoudigt en n voor 23 inwisselt, krijg je:

en

Bijlage B: de algemene verjaardagsformule

Laten we de formule generaliseren om n mensen te kiezen uit T totaal aantal items (in plaats van 365) :

Als we een kans kiezen (zoals 50% kans op een match) en oplossen voor n:

Voilà! Als je $ \ sqrt {T} $ items neemt (17% meer als je kieskeurig wilt zijn), heb je ongeveer 50-50 kans om een match te krijgen. Als u andere getallen invoert, kunt u andere kansen oplossen:

Onthoud dat m de gewenste kans op een overeenkomst is ( het is gemakkelijk om in de war te raken, ik heb het zelf gedaan). Als je een kans van 90% wilt om verjaardagen te matchen, plug dan m = 90% en T = 365 in de vergelijking en kijk dat je 41 mensen nodig hebt.

Wikipedia heeft nog meer details om je innerlijke nerd tevreden te stellen. Ga erop uit en geniet ervan.

Andere berichten in deze serie

  1. Een korte inleiding tot waarschijnlijkheid & Statistieken
  2. Een intuïtieve (en korte) uitleg van de Bayes-stelling
  3. De stelling van Bayes begrijpen met ratios
  4. Het Monty Hall-probleem begrijpen
  5. Hoe gegevens te analyseren met behulp van de Gemiddeld
  6. De verjaardagsparadox begrijpen

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *