23 personas. En una sala de solo 23 personas, existe una probabilidad de 50 a 50 de que al menos dos personas tengan el mismo cumpleaños. En una sala de 75 hay un 99,9% de posibilidades de que al menos dos personas coincidan.
Deje la calculadora y el tridente, no hablo de herejía. La paradoja del cumpleaños es extraña, contraria a la intuición y completamente cierta. Es solo una «paradoja» porque nuestros cerebros no pueden manejar el poder de composición de los exponentes. Esperamos que las probabilidades sean lineales y solo consideramos los escenarios en los que estamos involucrados (ambos supuestos erróneos, por cierto).
Veamos por qué ocurre la paradoja y cómo funciona.
Problema 1: Los exponentes no son intuitivos
Nos hemos enseñado matemáticas y estadística, pero no nos engañemos: no es natural.
Aquí hay un ejemplo: ¿Cuál es la probabilidad de obtener 10 caras seguidas al lanzar monedas? El cerebro inexperto podría pensar así:
«Bueno, conseguir una cara es un 50% de posibilidades. Obtener dos caras es el doble de difícil, por lo que hay un 25% de posibilidades. Conseguir diez cabezas es probablemente 10 veces más difícil … así que alrededor del 50% / 10 o un 5% de probabilidad ”.
Y ahí nos sentamos, presumidos como un insecto sobre una alfombra. No hay burbujas de dados.
Pero incluso después del entrenamiento, nos atrapan de nuevo. Con un interés del 5%, duplicaremos nuestro dinero en 14 años, en lugar de los 20. ¿Inferiste naturalmente la Regla del 72 cuando aprendiste sobre las tasas de interés? Probablemente no. Comprender el crecimiento exponencial compuesto con nuestro cerebro lineal es difícil.
Problema 2: Los seres humanos son un poco egoístas
Echa un vistazo a las noticias. Observa cuántas noticias negativas son el resultado de actuar sin tener en cuenta a los demás. Soy un optimista y tengo esperanza para la humanidad, pero esa es una discusión separada :).
En una sala de 23, ¿piensas en las 22 comparaciones en las que tu cumpleaños se compara con el de otra persona? Probablemente.
¿Piensas en las 231 comparaciones en las que se compara a alguien que no eres tú con alguien que no eres tú? ¿Te das cuenta de que hay tantas? Probablemente no.
El hecho de que descuidar las 10 veces más comparaciones que no nos incluyen nos ayuda a ver por qué puede suceder la «paradoja».
Ok, bien, los humanos somos horribles: ¡Enséñame las matemáticas!
El q Pregunta: ¿Cuáles son las posibilidades de que dos personas compartan un cumpleaños en un grupo de 23?
Claro, podríamos enumerar los pares y contar todas las formas en que podrían coincidir. Pero eso es difícil: ¡podría haber 1, 2, 3 o incluso 23 partidos!
Es como preguntar «¿Cuál es la probabilidad de obtener una o más caras en 23 lanzamientos de moneda?» Hay tantas posibilidades: cara en el primer lanzamiento, o el tercero, o el último, o el primero y el tercero, el segundo y el 21, y así sucesivamente.
¿Cómo resolvemos el problema de las monedas? Dale la vuelta (¿Entiendes? ¿Entiendes?). En lugar de contar todas las formas para sacar cara, encuentra la posibilidad de sacar todas las cruces, nuestro «escenario problemático».
Si hay un 1% de posibilidades de conseguir cara todas las colas (más como .5 ^ 23 pero trabaja conmigo aquí), hay un 99% de posibilidades de tener al menos una cara. No sé si es 1 cabeza, 2, 15 o 23: tenemos cabezas, y eso es lo que importa. Si restamos la probabilidad de un escenario problemático de 1, nos queda la probabilidad de un buen escenario.
El mismo principio se aplica a los cumpleaños. En lugar de encontrar todas las formas en las que coincidimos, encuentra la posibilidad de que todos sean diferentes, el «escenario problemático». Luego tomamos la probabilidad opuesta y obtenemos la posibilidad de una coincidencia. Puede ser 1 coincidencia, 2 o 20, pero alguien coincidente, que es lo que necesitamos encontrar.
Explicación: Contar pares (fórmula aproximada)
Con 23 personas tenemos 253 pares:
(Repase las combinaciones y permutaciones si lo desea).
La probabilidad de que 2 personas tengan diferentes cumpleaños es:
Tiene sentido, ¿verdad? Al comparar el cumpleaños de una persona con el de otra, en 364 de 365 escenarios no coincidirán. Bien .
Pero hacer 253 comparaciones y hacer que todas sean diferentes es como sacar cara 253 veces seguidas: tenías que esquivar «cruz» cada vez. Obtengamos una solución aproximada simulando comparaciones de cumpleaños son como lanzamientos de monedas. (Consulte el Apéndice A para obtener el cálculo exacto).
Usamos exponentes para encontrar la probabilidad:
Nuestra probabilidad de fallar es bastante alta (99.7260%), pero cuando se arriesga cientos de veces, las probabilidades de mantener esa racha disminuyen. Rápido.
La probabilidad de que encontremos una coincidencia es: 1 – 49.95% = 50.05%, ¡o un poco más de la mitad! Si desea encontrar la probabilidad de una coincidencia para cualquier número de personas, la fórmula es:
Ejemplo interactivo
No creía que necesitáramos solo 23 personas. Las matemáticas funcionan, pero ¿es real?
Puedes apostar.Pruebe el siguiente ejemplo: Elija varios elementos (365), varias personas (23) y realice algunas pruebas. Verá la coincidencia teórica y la coincidencia real a medida que realiza las pruebas. Adelante, haga clic en el botón (o vea la página completa).
A medida que realiza más y más pruebas (¡siga haciendo clic!), La probabilidad real debería acercarse a la teórica.
Ejemplos y conclusiones
Aquí hay algunas lecciones de la paradoja del cumpleaños:
- $ \ sqrt {n} $ es aproximadamente el número que necesita para tener un 50% de probabilidad de coincidir con n elementos. $ \ sqrt {365} $ es aproximadamente 20. Esto entra en juego en la criptografía para el ataque de cumpleaños.
- Aunque hay 2128 (1e38) GUID, solo tenemos 264 (1e19) para usar antes un 50% de probabilidad de colisión. Y el 50% es muy, muy alto.
- Solo necesitas 13 personas eligiendo letras del alfabeto para tener un 95% de posibilidades de que coincidan. Pruébelo arriba (personas = 13, elementos = 26).
- El crecimiento exponencial disminuye rápidamente la posibilidad de elegir elementos únicos (también conocido como aumenta las posibilidades de una coincidencia). Recuerde: los exponentes no son intuitivos y los humanos son egoístas.
Después de pensarlo mucho, la paradoja del cumpleaños finalmente me hace clic. Pero todavía miro el ejemplo interactivo solo para asegurarme.
Apéndice A: Explicación de multiplicación repetida (fórmula exacta)
¿Recuerda que asumimos que los cumpleaños son independientes? Bueno, no lo son.
Si la Persona A y la Persona B coinciden, y la Persona B y C coinciden, sabemos que A y C también deben coincidir. El resultado de hacer coincidir A y C depende de sus resultados con B, por lo que las probabilidades no son independientes. (Si son realmente independientes, A y C tendrían una probabilidad de 1/365 de coincidir, pero sabemos que es una coincidencia 100% garantizada).
Al contar pares, tratamos las coincidencias de cumpleaños como lanzamientos de monedas, multiplicando la misma probabilidad una y otra vez. Esta suposición no es estrictamente cierta, pero es lo suficientemente buena para una pequeña cantidad de personas (23) en comparación con el tamaño de la muestra (365). Es poco probable que varias personas coincidan y arruinen la independencia, por lo que es una buena aproximación.
Es poco probable, pero puede suceder. Veamos las posibilidades reales de que cada persona elija un número diferente:
La multiplicación se ve bastante fea:
Pero hay un atajo que podemos tomar. Cuando x está cerca de 0, una aproximación de Taylor aproximada de primer orden para $ e ^ x $ es:
entonces
Usando nuestro práctico atajo podemos reescribir la ecuación grande a:
Agregar 1 a 22 es (22 * 23) / 2, por lo que obtenemos:
Uf. Esta aproximación es muy cercana, ingrese sus propios números a continuación:
Lo suficientemente bueno para el trabajo del gobierno, como dicen. Si simplifica un poco la fórmula y cambia n por 23, obtiene:
y
Apéndice B: La fórmula general de cumpleaños
Generalicemos la fórmula para elegir n personas de T elementos totales (en lugar de 365) :
Si elegimos una probabilidad (como 50% de probabilidad de una coincidencia) y resolvemos para n:
¡Voila! Si toma $ \ sqrt {T} $ artículos (17% más si quiere ser exigente), entonces tiene una probabilidad de 50-50 de obtener una coincidencia. Si ingresa otros números, puede resolver otras probabilidades:
Recuerde que m es la probabilidad deseada de una coincidencia ( es fácil confundirse, lo hice yo mismo). Si quieres un 90% de posibilidades de que coincidan los cumpleaños, introduce m = 90% y T = 365 en la ecuación y comprueba que necesitas 41 personas.
Wikipedia tiene aún más detalles para satisfacer a tu nerd interior. Ve y disfruta.
Otras publicaciones de esta serie
- Una breve introducción a la probabilidad & Estadísticas
- Una explicación intuitiva (y breve) del teorema de Bayes
- Comprender el teorema de Bayes con razones
- Comprender el problema de Monty Hall
- Cómo analizar datos usando el Promedio
- Comprender la paradoja del cumpleaños