Compreendendo o Paradoxo do Aniversário

23 pessoas. Em uma sala de apenas 23 pessoas, há uma chance de 50-50 de pelo menos duas pessoas fazerem aniversário no mesmo dia. Em uma sala de 75 pessoas, há 99,9% de chance de pelo menos duas pessoas corresponderem.

Largue a calculadora e o forcado, eu não falo heresia. O paradoxo do aniversário é estranho, contra-intuitivo e totalmente verdadeiro. É apenas um “paradoxo” porque nosso cérebro não consegue lidar com o poder de composição dos expoentes. Esperamos que as probabilidades sejam lineares e consideramos apenas os cenários em que estamos envolvidos (ambas suposições errôneas, a propósito).

Vamos ver por que o paradoxo acontece e como ele funciona.

Problema 1: Os expoentes não são intuitivos

Aprendemos matemática e estatística a nós mesmos, mas não vamos nos enganar: não é natural.

Aqui está um exemplo: qual é a chance de acertar 10 caras em uma moeda? O cérebro não treinado pode pensar assim:

“Bem, obter uma cabeça é uma chance de 50%. Conseguir duas caras é duas vezes mais difícil, portanto, uma chance de 25%. Conseguir dez cabeças é provavelmente 10 vezes mais difícil … então, cerca de 50% / 10 ou 5% de chance. ”

E lá estamos nós sentados, presunçosos como um inseto no tapete. Sem dados, bub.

Mas mesmo depois do treino, somos pegos novamente. Com juros de 5%, dobraremos nosso dinheiro em 14 anos, em vez do “esperado” 20. Você naturalmente inferiu a Regra de 72 ao aprender sobre as taxas de juros? Provavelmente não. Compreender o crescimento exponencial composto com nossos cérebros lineares é difícil.

Problema 2: os humanos são um pouco egoístas

Dê uma olhada nas notícias. Observe o quanto das notícias negativas é o resultado de agir sem considerar os outros. Eu sou um otimista e tenho esperança para a humanidade, mas essa é uma discussão separada :).

Em uma sala de 23, você pensa nas 22 comparações em que seu aniversário está sendo comparado com o de outra pessoa? Provavelmente.

Você pensa nas 231 comparações em que alguém que não é você está sendo comparado com outra pessoa que não é você? Você percebe que existem tantos? Provavelmente não.

O fato de que negligenciarmos as 10 vezes mais comparações que não nos incluem nos ajuda a ver por que o “paradoxo” pode acontecer.

Ok, tudo bem, os humanos são horríveis: mostre-me a matemática!

o q pergunta: Quais são as chances de que duas pessoas façam aniversário em um grupo de 23?

Claro, poderíamos listar os pares e contar todas as formas de correspondência. Mas isso é difícil: pode haver 1, 2, 3 ou mesmo 23 correspondências!

É como perguntar “Qual é a chance de obter uma ou mais caras em 23 lançamentos de moeda?” As possibilidades são tantas: cara no primeiro lance, ou no terceiro, ou no último, ou no primeiro e terceiro, no segundo e no 21, e assim por diante.

Como resolvemos o problema da moeda? Vire ao contrário (entendeu? Entendeu?). Em vez de contar todas as maneiras de obter cara, encontre a chance de obter coroa, nosso “cenário de problema”.

Se houver 1% de chance de obter cara todas as caudas (mais como 0,5 ^ 23, mas trabalhe comigo aqui), há uma chance de 99% de ter pelo menos uma cabeça. Não sei se é 1 cara, ou 2, ou 15 ou 23: nós temos cara, e isso é o que importa. Se subtrairmos a chance de um cenário de problema de 1, ficamos com a probabilidade de um cenário bom.

O mesmo princípio se aplica a aniversários. Em vez de encontrar todas as formas de correspondência, encontre a chance de que todos sejam diferentes, o “cenário do problema”. Em seguida, pegamos a probabilidade oposta e temos a chance de uma correspondência. Pode ser 1 correspondência, ou 2, ou 20, mas alguém combinou, que é o que precisamos encontrar.

Explicação: Contando pares (fórmula aproximada)

Com 23 pessoas, temos 253 pares:

(Recapitule as combinações e permutações, se quiser).

A chance de 2 pessoas fazerem aniversários diferentes é:

Faz sentido, certo? Ao comparar o aniversário de uma pessoa com a de outra, em 364 de 365 cenários eles não corresponderão. .

Mas fazer 253 comparações e fazer com que todas sejam diferentes é como obter cara 253 vezes consecutivas – era necessário desviar da “coroa” a cada vez. Vamos obter uma solução aproximada fingindo comparações de aniversário são como cara ou coroa. (Consulte o Apêndice A para o cálculo exato.)

Usamos expoentes para encontrar a probabilidade:

Nossa chance de acertar uma única falha é muito alta (99,7260%), mas quando você arrisca centenas de vezes, as chances de manter essa seqüência diminuem. Rápido.

A chance de encontrarmos uma correspondência é: 1 – 49,95% = 50,05% ou pouco mais da metade! Se você deseja encontrar a probabilidade de uma correspondência para qualquer número de pessoas n, a fórmula é:

Exemplo interativo

Não acreditava que precisávamos de apenas 23 pessoas. A matemática funciona, mas é real?

Pode apostar.Experimente o exemplo abaixo: Escolha vários itens (365), várias pessoas (23) e faça alguns testes. Você verá a correspondência teórica e sua correspondência real à medida que executa seus testes. Vá em frente, clique no botão (ou veja a página inteira).

Conforme você executa mais e mais tentativas (continue clicando!), A probabilidade real deve se aproximar da teórica.

Exemplos e conclusões

Aqui estão algumas lições do paradoxo do aniversário:

  • $ \ sqrt {n} $ é aproximadamente o número que você precisa para ter 50% de chance de um combinar com n itens. $ \ sqrt {365} $ é cerca de 20. Isso entra em jogo na criptografia para o ataque de aniversário.
  • Embora haja 2128 (1e38) GUIDs, temos apenas 264 (1e19) para usar antes 50% de chance de colisão. E 50% é muito, muito alto.
  • Você só precisa de 13 pessoas escolhendo as letras do alfabeto para ter 95% de chance de uma correspondência. Experimente acima (pessoas = 13, itens = 26).
  • O crescimento exponencial diminui rapidamente a chance de escolher itens únicos (também conhecido como aumenta as chances de uma correspondência). Lembre-se: os expoentes não são intuitivos e os humanos são egoístas!

Depois de pensar muito sobre isso, o paradoxo do aniversário finalmente me atinge. Mas eu ainda verifico o exemplo interativo apenas para ter certeza.

Apêndice A: Explicação da multiplicação repetida (fórmula exata)

Você se lembra de como presumimos que os aniversários são independentes? Bem, eles não são.

Se a pessoa A e a pessoa B corresponderem, e as pessoas B e C corresponderem, sabemos que A e C também devem corresponder. O resultado da correspondência de A e C depende de seus resultados com B, então as probabilidades não são independentes. (Se fossem realmente independentes, A e C teriam 1/365 de chance de coincidir, mas sabemos que é uma combinação 100% garantida.)

Ao contar os pares, tratamos as partidas de aniversário como cara ou coroa, multiplicando a mesma probabilidade indefinidamente. Esta suposição não é estritamente verdadeira, mas é boa o suficiente para um pequeno número de pessoas (23) em comparação com o tamanho da amostra (365). É improvável que várias pessoas correspondam e estraguem a independência, então é uma boa aproximação.

É improvável, mas pode acontecer. Vamos descobrir as chances reais de cada pessoa escolher um número diferente:

A multiplicação parece muito feia:

Mas há um atalho que podemos usar. Quando x está próximo de 0, uma aproximação de Taylor grosseira de primeira ordem para $ e ^ x $ é:

então

Usando nosso atalho prático, podemos reescrever a grande equação para:

Adicionar 1 a 22 é (22 * 23) / 2, então obtemos:

Ufa. Essa aproximação é muito próxima, insira seus próprios números abaixo:

Bom o suficiente para trabalho do governo, como dizem. Se você simplificar um pouco a fórmula e trocar n por 23, obterá:

e

Apêndice B: A fórmula geral de aniversário

Vamos generalizar a fórmula para escolher n pessoas do total de T itens (em vez de 365) :

Se escolhermos uma probabilidade (como 50% de chance de uma correspondência) e resolvermos para n:

Voilà! Se você pegar $ \ sqrt {T} $ itens (17% a mais se você quiser ser exigente), você tem cerca de 50-50 de chance de conseguir uma correspondência. Se você inserir outros números, poderá resolver para outras probabilidades:

Lembre-se de que m é a chance desejada de uma correspondência ( é fácil ficar confuso, eu mesmo fiz). Se você quiser 90% de chance de combinar aniversários, insira m = 90% e T = 365 na equação e veja que você precisa de 41 pessoas.

A Wikipedia tem ainda mais detalhes para satisfazer seu nerd interior. Vá em frente e divirta-se.

Outras postagens desta série

  1. Uma breve introdução à probabilidade & Estatísticas
  2. Uma explicação intuitiva (e curta) do “teorema de Bayes
  3. Compreendendo o teorema de Bayes com razões
  4. Compreendendo o problema de Monty Hall
  5. Como analisar dados usando o Média
  6. Compreendendo o paradoxo do aniversário

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *