Das Geburtstagsparadoxon verstehen

23 Personen. In einem Raum mit nur 23 Personen besteht eine 50: 50-Chance, dass mindestens zwei Personen denselben Geburtstag haben. In einem Raum mit 75 Personen besteht eine 99,9% ige Chance, dass mindestens zwei Personen übereinstimmen.

Legen Sie den Taschenrechner und die Heugabel ab, ich spreche keine Häresie. Das Geburtstagsparadoxon ist seltsam, kontraintuitiv und völlig wahr. Es ist nur ein „Paradoxon“, weil unser Gehirn nicht mit der zusammengesetzten Kraft von Exponenten umgehen kann. Wir erwarten, dass die Wahrscheinlichkeiten linear sind und berücksichtigen nur die Szenarien, an denen wir beteiligt sind (übrigens beide fehlerhafte Annahmen).

Mal sehen, warum das Paradoxon passiert und wie es funktioniert.

Problem 1: Exponenten sind nicht intuitiv

Wir haben uns Mathematik und Statistik beigebracht, aber machen wir uns nichts vor: Es ist nicht natürlich.

Hier ein Beispiel: Wie groß ist die Chance, beim Werfen von Münzen 10 Köpfe hintereinander zu bekommen? Das ungeübte Gehirn könnte denken so:

„Nun, einen Kopf zu bekommen ist eine 50% ige Chance. Zwei Köpfe zu bekommen ist doppelt so schwer, also eine Chance von 25%. Zehn Köpfe zu bekommen ist wahrscheinlich zehnmal schwieriger… also ungefähr 50% / 10 oder eine 5% ige Chance. “

Und da sitzen wir selbstgefällig wie ein Käfer auf einem Teppich. Kein Würfel.

Aber auch nach dem Training werden wir wieder erwischt. Bei 5% Zinsen werden wir unser Geld in 14 Jahren verdoppeln und nicht die „erwarteten“ 20. Haben Sie natürlich die Regel von 72 abgeleitet, als Sie etwas über Zinssätze gelernt haben? Wahrscheinlich nicht. Es ist schwierig, das zusammengesetzte exponentielle Wachstum mit unseren linearen Gehirnen zu verstehen.

Problem 2: Menschen sind ein bisschen egoistisch

Sehen Sie sich die Nachrichten an. Beachten Sie, wie viele der negativen Nachrichten das Ergebnis von Handlungen sind, ohne andere zu berücksichtigen Optimist und haben Hoffnung für die Menschheit, aber das ist eine separate Diskussion :).

Denken Sie in einem Raum von 23 an die 22 Vergleiche, bei denen Ihr Geburtstag mit dem eines anderen verglichen wird? Wahrscheinlich.

Denken Sie an die 231 Vergleiche, bei denen jemand, der nicht Sie ist, gegen einen anderen geprüft wird, der nicht Sie ist? Ist Ihnen klar, dass es so viele gibt? Wahrscheinlich nicht.

Die Tatsache, dass Wir vernachlässigen die zehnmal so vielen Vergleiche, die uns nicht einschließen, um zu erkennen, warum das „Paradoxon“ auftreten kann.

Okay, gut, Menschen sind schrecklich: Zeigen Sie mir die Mathematik!

Das q Frage: Wie hoch sind die Chancen, dass zwei Personen in einer Gruppe von 23 Personen Geburtstag haben?

Sicher, wir könnten die Paare auflisten und alle Arten zählen, wie sie übereinstimmen könnten. Aber das ist schwer: Es könnte 1, 2, 3 oder sogar 23 Spiele geben!

Es ist wie zu fragen: „Wie groß ist die Chance, einen oder mehrere Köpfe in 23 Münzwürfen zu bekommen?“ Es gibt so viele Möglichkeiten: Köpfe beim ersten oder dritten oder letzten oder ersten und dritten, zweiten und 21. Wurf usw.

Wie lösen wir das Münzproblem? Drehen Sie es herum (Erhalten Sie es? Erhalten Sie es?). Anstatt jeden Weg zu zählen, um Köpfe zu bekommen, finden Sie die Chance, alle Schwänze zu bekommen, unser „Problemszenario“.

Wenn es eine 1% ige Chance gibt, zu bekommen Bei allen Schwänzen (eher 0,5 ^ 23, aber hier mit mir zusammenarbeiten) besteht eine 99% ige Chance, mindestens einen Kopf zu haben. Ich weiß nicht, ob es 1 Kopf oder 2 oder 15 oder 23 ist: Wir haben Köpfe, und darauf kommt es an. Wenn wir die Wahrscheinlichkeit eines Problemszenarios von 1 abziehen, bleibt die Wahrscheinlichkeit eines guten Szenarios übrig.

Das gleiche Prinzip gilt für Geburtstage. Anstatt alle Übereinstimmungen zu finden, finden Sie die Chance, dass jeder anders ist, das „Problemszenario“. Wir nehmen dann die entgegengesetzte Wahrscheinlichkeit und erhalten die Chance einer Übereinstimmung. Es kann 1 Übereinstimmung oder 2 oder 20 sein, aber Jemand hat gepasst, was wir finden müssen.

Erläuterung: Zählen von Paaren (ungefähre Formel)

Mit 23 Personen haben wir 253 Paare:

(Kombinieren Sie Kombinationen und Permutationen, wenn Sie möchten).

Die Wahrscheinlichkeit, dass 2 Personen unterschiedliche Geburtstage haben, ist:

Ist das sinnvoll, wenn man den Geburtstag einer Person mit einem anderen vergleicht? In 364 von 365 Szenarien passen sie nicht zusammen. Gut

Aber 253 Vergleiche anzustellen und sie alle unterschiedlich zu machen, ist wie 253 Mal hintereinander Köpfe zu bekommen – man musste jedes Mal „Schwänzen“ ausweichen. Lassen Sie uns eine ungefähre Lösung finden, indem Sie Geburtstagsvergleiche vortäuschen sind wie Münzwürfe. (Die genaue Berechnung finden Sie in Anhang A.)

Wir verwenden Exponenten, um die Wahrscheinlichkeit zu ermitteln:

Unsere Chance, einen einzigen Fehler zu machen, ist ziemlich hoch (99,7260%), aber wenn Sie diese Chance hunderte Male nutzen, sinken die Chancen, diese Serie aufrechtzuerhalten. Schnell.

Die Wahrscheinlichkeit, dass wir eine Übereinstimmung finden, ist: 1 – 49,95% = 50,05% oder etwas mehr als die Hälfte! Wenn Sie die Wahrscheinlichkeit einer Übereinstimmung für eine beliebige Anzahl von Personen in n ermitteln möchten, lautet die Formel:

Interaktives Beispiel

Ich habe nicht geglaubt, dass wir nur 23 Leute brauchen. Die Mathematik funktioniert, aber ist es echt?

Wetten Sie?Versuchen Sie das folgende Beispiel: Wählen Sie eine Anzahl von Elementen (365), eine Anzahl von Personen (23) und führen Sie einige Versuche durch. Sie werden die theoretische Übereinstimmung und Ihre tatsächliche Übereinstimmung sehen, wenn Sie Ihre Versuche durchführen. Klicken Sie auf die Schaltfläche (oder sehen Sie sich die ganze Seite an).

Wenn Sie mehr und mehr Versuche ausführen (klicken Sie weiter!), Sollte sich die tatsächliche Wahrscheinlichkeit der theoretischen annähern.

Beispiele und Imbissbuden

Hier einige Lehren aus dem Geburtstagsparadoxon:

  • $ \ sqrt {n} $ ist ungefähr die Zahl, die Sie benötigen, um eine 50% ige Chance auf a zu haben Übereinstimmung mit n Elementen. $ \ sqrt {365} $ ist ungefähr 20. Dies kommt in der Kryptographie für den Geburtstagsangriff ins Spiel.
  • Obwohl es 2128 (1e38) GUIDs gibt, müssen wir vorher nur 264 (1e19) verbrauchen eine 50% ige Kollisionswahrscheinlichkeit. Und 50% sind wirklich sehr, sehr hoch.
  • Sie brauchen nur 13 Personen, die Buchstaben des Alphabets auswählen, um eine 95% ige Chance auf eine Übereinstimmung zu haben. Probieren Sie es oben aus (Personen = 13, Gegenstände = 26).
  • Exponentielles Wachstum verringert schnell die Wahrscheinlichkeit, einzigartige Gegenstände auszuwählen (auch bekannt als Erhöhung der Chancen auf ein Match). Denken Sie daran: Exponenten sind nicht intuitiv und Menschen sind egoistisch!

Nachdem ich viel darüber nachgedacht habe, klickt das Geburtstagsparadoxon endlich mit mir. Aber ich überprüfe immer noch das interaktive Beispiel, um sicherzugehen.

Anhang A: Erklärung der wiederholten Multiplikation (genaue Formel)

Erinnern Sie sich, wie wir angenommen haben, dass Geburtstage unabhängig sind? Nun, das sind sie nicht.

Wenn Person A und Person B und Person B und C übereinstimmen, wissen wir, dass A und C ebenfalls übereinstimmen müssen. Das Ergebnis der Übereinstimmung von A und C hängt von ihren Ergebnissen mit B ab, sodass die Wahrscheinlichkeiten nicht unabhängig sind. (Wenn A und C wirklich unabhängig wären, hätten sie eine Chance von 1/365, aber wir wissen, dass es sich um eine 100% garantierte Übereinstimmung handelt.)

Beim Zählen von Paaren haben wir Geburtstagsspiele wie Münzwürfe behandelt und multipliziert immer wieder die gleiche Wahrscheinlichkeit. Diese Annahme ist nicht unbedingt richtig, aber für eine kleine Anzahl von Personen (23) im Vergleich zur Stichprobengröße (365) gut genug. Es ist unwahrscheinlich, dass mehrere Personen übereinstimmen und die Unabhängigkeit vermasseln Es ist eine gute Annäherung.

Es ist unwahrscheinlich, aber es kann passieren. Lassen Sie uns die tatsächlichen Chancen herausfinden, dass jede Person eine andere Zahl auswählt:

Die Multiplikation sieht ziemlich hässlich aus:

Es gibt jedoch eine Verknüpfung, die wir verwenden können. Wenn x nahe bei 0 liegt, eine grobe Taylor-Näherung erster Ordnung für $ e ^ x $ ist:

also

Mit unserer praktischen Verknüpfung können wir die große Gleichung wie folgt umschreiben:

Das Hinzufügen von 1 zu 22 ist (22 * 23) / 2, sodass wir Folgendes erhalten:

Puh. Diese Annäherung ist sehr nahe, geben Sie Ihre eigenen Zahlen unten ein:

Gut genug für Regierungsarbeit, wie sie sagen. Wenn Sie die Formel etwas vereinfachen und n gegen 23 austauschen, erhalten Sie:

und

Anhang B: Die allgemeine Geburtstagsformel

Verallgemeinern wir die Formel auf die Auswahl von n Personen aus T Gesamtelementen (anstelle von 365). :

Wenn wir eine Wahrscheinlichkeit (wie 50% Wahrscheinlichkeit einer Übereinstimmung) wählen und nach n auflösen:

Voila! Wenn Sie $ \ sqrt {T} $ -Elemente nehmen (17% mehr, wenn Sie wählerisch sein möchten), haben Sie eine 50-50-Chance, eine Übereinstimmung zu erhalten. Wenn Sie andere Zahlen eingeben, können Sie nach anderen Wahrscheinlichkeiten suchen:

Denken Sie daran, dass m die gewünschte Chance auf eine Übereinstimmung ist ( Es ist leicht zu verwirren, ich habe es selbst gemacht. Wenn Sie eine 90% ige Chance haben möchten, Geburtstage abzugleichen, geben Sie m = 90% und T = 365 in die Gleichung ein und sehen Sie, dass Sie 41 Personen benötigen.

Wikipedia bietet noch mehr Details, um Ihren inneren Nerd zufrieden zu stellen. Gehen Sie weiter und genießen Sie.

Andere Beiträge in dieser Reihe

  1. Eine kurze Einführung in die Wahrscheinlichkeit & Statistik
  2. Eine intuitive (und kurze) Erklärung des Bayes-Theorems
  3. Bayes-Theorem mit Verhältnissen verstehen
  4. Das Monty-Hall-Problem verstehen
  5. Wie man Daten mit dem analysiert Durchschnitt
  6. Das Geburtstagsparadoxon verstehen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.