Comprendre le paradoxe de lanniversaire

23 personnes. Dans une salle de 23 personnes seulement, il y a 50 à 50 chances pour au moins deux personnes davoir le même anniversaire. Dans une salle de 75 personnes, il y a 99,9% de chances quau moins deux personnes correspondent.

Posez la calculatrice et la fourche, je ne parle pas dhérésie. Le paradoxe de lanniversaire est étrange, contre-intuitif et tout à fait vrai. Ce nest quun «paradoxe» parce que notre cerveau ne peut pas gérer la puissance composée des exposants. Nous nous attendons à ce que les probabilités soient linéaires et ne considérons que les scénarios dans lesquels nous sommes impliqués (les deux hypothèses erronées, dailleurs).

Voyons pourquoi le paradoxe se produit et comment cela fonctionne.

Problème 1: les exposants ne sont pas intuitifs

Nous nous sommes enseignés les mathématiques et les statistiques, mais ne nous leurrons pas: ce nest pas naturel.

Voici un exemple: quelle est la chance davoir 10 têtes daffilée en retournant des pièces? Un cerveau non entraîné pourrait penser comme ceci:

« Eh bien, avoir une tête est une chance de 50%. Obtenir deux têtes est deux fois plus difficile, donc une chance de 25%. Obtenir dix têtes est probablement 10 fois plus difficile… donc environ 50% / 10 ou 5% de chance. »

Et nous nous sommes assis, suffisants comme un insecte sur un tapis. Pas de bar de dés.

Mais même après lentraînement, on se fait prendre à nouveau. À un taux dintérêt de 5%, nous doublerons notre argent en 14 ans, plutôt que le 20 « attendu ». Avez-vous naturellement déduit la règle de 72 lorsque vous vous êtes renseigné sur les taux dintérêt? Probablement pas. Comprendre la croissance exponentielle composée avec nos cerveaux linéaires est difficile.

Problème 2: les humains sont un peu égoïstes

Jetez un œil aux actualités. Notez à quel point les nouvelles négatives sont le résultat dagir sans considérer les autres. Je suis un optimiste et avez de lespoir pour lhumanité, mais cest une discussion séparée :).

Dans une salle de 23, pensez-vous aux 22 comparaisons où votre anniversaire est comparé à celui de quelquun dautre? Probablement.

Pensez-vous aux 231 comparaisons où une personne qui n’est pas vous est comparée à une autre personne qui n’est pas vous? Vous rendez-vous compte qu’il y en a tellement? Probablement pas.

Le fait que nous négligeons les 10 fois plus de comparaisons qui ne nous incluent pas nous aide à comprendre pourquoi le «paradoxe» peut arriver.

Ok, très bien, les humains sont affreux: montrez-moi le calcul!

Le q uestion: Quelles sont les chances que deux personnes partagent un anniversaire dans un groupe de 23?

Bien sûr, nous pourrions lister les paires et compter toutes les façons dont elles pourraient correspondre. Mais c’est difficile: il pourrait y avoir 1, 2, 3 ou même 23 matchs!

C’est comme demander «Quelle est la chance d’obtenir une ou plusieurs têtes en 23 lancers de pièces?» Il y a tellement de possibilités: les têtes sur le premier lancer, ou le 3ème, ou le dernier, ou le 1er et le 3ème, le 2ème et le 21ème, et ainsi de suite.

Comment résoudre le problème des pièces? Retournez-le (obtenez-le? Obtenez-le?). Plutôt que de compter tous les moyens pour obtenir des têtes, trouvez la chance dobtenir toutes les queues, notre « scénario de problème ».

Sil y a 1% de chances dobtenir toutes les queues (plus comme .5 ^ 23 mais travaillez avec moi ici), il y a 99% de chances davoir au moins une tête. Je ne sais pas si c’est 1 tête, ou 2, ou 15 ou 23: nous avons des têtes, et c’est ce qui compte. Si nous soustrayons la probabilité dun scénario problématique de 1, nous nous retrouvons avec la probabilité dun bon scénario.

Le même principe sapplique aux anniversaires. Au lieu de trouver toutes les façons de faire correspondre, trouvez la chance que tout le monde soit différent, le « scénario du problème ». Nous prenons alors la probabilité opposée et avons la chance de trouver une correspondance. Cela peut être 1 ou 2 ou 20, mais quelquun correspond, cest ce que nous devons trouver.

Explication: Compter les paires (formule approximative)

Avec 23 personnes, nous avons 253 paires:

(Révisez les combinaisons et les permutations si vous le souhaitez).

La chance que 2 personnes aient des anniversaires différents est:

Cela a du sens, nest-ce pas? Lorsque vous comparez lanniversaire dune personne à une autre, dans 364 scénarios sur 365, elle na pas réussi à correspondre. Très bien .

Mais faire 253 comparaisons et les avoir toutes différentes, cest comme avoir des têtes 253 fois daffilée – vous deviez éviter les « queues » à chaque fois. Obtenons une solution approximative en prétendant des comparaisons danniversaire sont comme des jetons de monnaie. (Voir lannexe A pour le calcul exact.)

Nous utilisons des exposants pour trouver la probabilité:

Nos chances dobtenir un seul échec sont assez élevées (99,7260%), mais lorsque vous tentez cette chance des centaines de fois, les chances de maintenir cette séquence diminuent. Rapide.

Les chances que nous trouvions une correspondance sont: 1 – 49,95% = 50,05%, soit un peu plus de la moitié! Si vous voulez trouver la probabilité dune correspondance pour nimporte quel nombre de personnes n, la formule est:

Exemple interactif

Je ne pensais pas que nous avions besoin de seulement 23 personnes. Le calcul fonctionne, mais est-ce réel?

Vous pariez.Essayez lexemple ci-dessous: Choisissez un certain nombre déléments (365), un certain nombre de personnes (23) et exécutez quelques essais. Vous verrez la correspondance théorique et votre correspondance réelle pendant que vous exécutez vos essais. Allez-y, cliquez sur le bouton (ou voir la page complète).

Au fur et à mesure que vous exécutez de plus en plus dessais (continuez à cliquer!), La probabilité réelle devrait se rapprocher de la théorie.

Exemples et à emporter

Voici quelques leçons du paradoxe de lanniversaire:

  • $ \ sqrt {n} $ est à peu près le nombre dont vous avez besoin pour avoir 50% de chances davoir correspond à n éléments. $ \ sqrt {365} $ est denviron 20. Cela entre en jeu dans la cryptographie pour lattaque danniversaire.
  • Même sil y a 2128 (1e38) GUID, nous navons que 264 (1e19) à utiliser avant une chance de collision de 50%. Et 50%, cest vraiment très élevé.
  • Il suffit de 13 personnes qui choisissent les lettres de lalphabet pour avoir 95% de chances de concordance. Essayez-le ci-dessus (personnes = 13, objets = 26).
  • La croissance exponentielle diminue rapidement les chances de choisir des objets uniques (cest-à-dire quelle augmente les chances dun match). Noubliez pas: les exposants ne sont pas intuitifs et les humains sont égoïstes!

Après y avoir beaucoup réfléchi, le paradoxe de lanniversaire clique enfin avec moi. Mais je continue de consulter lexemple interactif juste pour men assurer.

Annexe A: Explication des multiplications répétées (formule exacte)

Vous rappelez-vous comment nous avons supposé que les anniversaires sont indépendants? Eh bien, ils ne le sont pas.

Si la personne A et la personne B correspondent et que les personnes B et C correspondent, nous savons que A et C doivent également correspondre. Le résultat de lappariement de A et C dépend de leurs résultats avec B, de sorte que les probabilités ne sont pas indépendantes. (Sils étaient vraiment indépendants, A et C auraient 1/365 de chances de correspondre, mais nous savons quil sagit dune correspondance garantie à 100%.)

Lors du comptage des paires, nous avons traité les matchs danniversaire comme des lancers de pièces, en multipliant la même probabilité encore et encore. Cette hypothèse nest pas tout à fait vraie, mais elle est suffisante pour un petit nombre de personnes (23) par rapport à la taille de léchantillon (365). Il est peu probable que plusieurs personnes correspondent et bousillent lindépendance, donc cest une bonne approximation.

Cest peu probable, mais cela peut arriver. Voyons quelles sont les chances réelles que chaque personne choisisse un nombre différent:

La multiplication semble assez moche:

Mais il y a un raccourci que nous pouvons prendre. Quand x est proche de 0, une approximation de Taylor grossière du premier ordre pour $ e ^ x $ est:

donc

En utilisant notre raccourci pratique, nous pouvons réécrire la grande équation comme suit:

Ajouter 1 à 22 équivaut à (22 * 23) / 2 pour obtenir:

Ouf. Cette approximation est très proche, insérez vos propres chiffres ci-dessous:

Assez bien pour le travail du gouvernement, comme on dit. Si vous simplifiez un peu la formule et échangez n pour 23, vous obtenez:

et

Annexe B: La formule générale de lanniversaire

Généralisons la formule pour sélectionner n personnes parmi T éléments au total (au lieu de 365) :

Si nous choisissons une probabilité (comme 50% de chance de correspondance) et résolvons pour n:

Voila! Si vous prenez des objets $ \ sqrt {T} $ (17% de plus si vous voulez être pointilleux), vous avez environ 50 à 50 chances dobtenir une correspondance. Si vous branchez dautres nombres, vous pouvez résoudre dautres probabilités:

Noubliez pas que m est la chance souhaitée dune correspondance ( cest facile de se confondre, je lai fait moi-même). Si vous voulez avoir 90% de chances de faire correspondre les anniversaires, branchez m = 90% et T = 365 dans léquation et voyez que vous avez besoin de 41 personnes.

Wikipedia a encore plus de détails pour satisfaire votre nerd intérieur. Allez-y et amusez-vous bien.

Autres articles de cette série

  1. Une brève introduction à la probabilité & Statistiques
  2. Une explication intuitive (et courte) du théorème de Bayes
  3. Comprendre le théorème de Bayes avec des ratios
  4. Comprendre le problème de Monty Hall
  5. Comment analyser les données à l’aide du Moyenne
  6. Comprendre le paradoxe de lanniversaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *