Bayes « Theorem (Français)

Bayes peut faire de la magie!

Vous êtes-vous déjà demandé comment les ordinateurs apprennent à connaître les gens?

Exemple:

Une recherche sur Internet pour « lacets automatiques de film » fait apparaître « Retour vers le futur »

Le moteur de recherche a-t-il regardé le film? Non, mais il sait, grâce à de nombreuses autres recherches, ce que les gens recherchent probablement.

Et il calcule cette probabilité en utilisant le théorème de Bayes.

Le théorème de Bayes est un moyen de trouver une probabilité lorsque nous connaissons certaines autres probabilités.

La formule est:

P (A | B) = P (A) P (B | A) P (B)

Ce qui nous dit: à quelle fréquence A se produit étant donné que B se produit, écrit P (A | B),
Quand on sait: à quelle fréquence B se produit étant donné que A se produit, écrit P (B | A)
et la probabilité que A soit seul, écrit P (A)
et la probabilité que B est seul, écrit P (B)

Disons que P (Feu) signifie à quelle fréquence il y a du feu, et P (Fumée) à quelle fréquence nous voir de la fumée, alors:

P (Feu | Fumée) signifie combien de fois il y a du feu quand nous pouvons voir de la fumée
P (Fumée | Feu) signifie combien de fois nous pouvons voir de la fumée quand il y a du feu

Donc, la formule nous dit « en avant » P (Feu | Fumée) lorsque nous connaissons « en arrière » P (Fumée | Feu)

Seulement 4 chiffres

Imaginez 100 personnes à une fête, et vous comptez combien portent du rose ou non, et si un homme ou non, et obtenez ces chiffres:

Bayes « Le théorème est basé uniquement sur ces 4 nombres!

Faisons quelques totaux:

Et calculons quelques probabilités:

Et puis le chiot arrive! Un chiot si mignon.

Mais toutes vos données sont déchirées! Seules 3 valeurs survivent:

  • P (Man) = 0.4,
  • P (Pink) = 0.25 et
  • P (Pink | Man) = 0.125

Pouvez-vous découvrir P (Homme | Rose)?

Imaginez quun invité portant du rose laisse de largent derrière … était-ce un homme? Nous pouvons répondre à cette question en utilisant le « théorème de Bayes:

P (Homme | Rose) = P (Homme) P (Rose | Homme) P (Rose)

P (Homme | Rose ) = 0,4 × 0,1250,25 = 0,2

Remarque: si nous avions encore les données brutes, nous pourrions calculer directement 525 = 0,2

Être général

Pourquoi ça marche?

Remplaçons les nombres par des lettres:

Regardons maintenant les probabilités. Nous prenons donc quelques ratios:

  • la probabilité globale de « A » est P (A) = s + ts + t + u + v
  • la probabilité de « B étant donné A » est P ( B | A) = ss + t

Et puis multipliez-les ensemble comme ceci:

Maintenant, recommençons mais utilisons P (B) et P (A | B):

Les deux manières obtiennent le même résultat de ss + t + u + v

Nous pouvons donc voir que:

P (B) P (A | B) = P (A) P ( B | A)

Joli et symétrique nest-ce pas?

Il doit en fait être symétrique car nous pouvons permuter les lignes et les colonnes et obtenir le même coin supérieur gauche.

Et cest aussi Bayes Fo rmula … divisez simplement les deux côtés par P (B):

P (A | B) = P (A) P (B | A) P (B)

Se souvenir

Pensez dabord à « AB AB AB » puis noubliez pas de le grouper comme: « AB = A BA / B »

P (A | B) = P (A) P (B | A) P (B)

Allergie aux chats?

Lune des utilisations célèbres du théorème de Bayes est les faux positifs et les faux négatifs.

Pour ceux-ci, nous avons deux cas possibles pour « A », tels que Réussite / Échec (ou Oui / Non, etc.)

Exemple: Allergie ou pas?

Hunter dit quelle a des démangeaisons. Il existe un test dallergie aux chats, mais ce test nest pas toujours correct:

  • Pour les personnes réellement allergiques, le test dit «oui» 80% du temps
  • Pour les personnes qui ne sont pas allergiques, le test dit « Oui » 10% du temps (« faux positif »)

Si 1% de la population est allergique , et le test de Hunter dit « Oui », quelles sont les chances que Hunter soit vraiment allergique?

Nous voulons connaître le risque de développer une allergie lorsque le test dit « Oui », écrit P (Allergie | Oui)

Prenons notre formule:

P (Allergie | Oui) = P (Allergie) P (Oui | Allergie) P (Oui)

Oh non! Nous ne savons pas quelle est la probabilité générale que le test dise «Oui» …

… mais nous pouvons le calculer en additionnant ceux avec et ceux sans allergie:

  • 1% ont lallergie et le test dit «Oui» à 80% dentre eux
  • 99% nont pas lallergie et le test dit «Oui» à 10% des

Additionnons cela:

P (Oui) = 1% × 80% + 99% × 10% = 10,7%

Ce qui signifie quenviron 10,7% de la population obtiendra un résultat «Oui».

Nous pouvons donc maintenant compléter notre formule:

P (Allergie | Oui) = 1% × 80% 10,7% = 7.48%

P (Allergie | Oui) = environ 7%

Cest le même résultat que nous avons obtenu sur les faux positifs et les faux négatifs.

En fait, nous peut écrire une version spéciale de la formule de Bayes « juste pour des choses comme ceci:

P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (pas A) P (B | pas A)

« A » avec trois (ou plus) cas

Nous venons de voir « A » avec deux cas (A et non A), dont nous nous sommes occupés dans la ligne du bas.

Quand « A » a 3 cas ou plus, nous les incluons tous dans la ligne du bas:

P (A1 | B ) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … etc

Revenons maintenant aux moteurs de recherche.

Les moteurs de recherche reprennent cette idée et l’améliorent beaucoup (plus d’autres astuces).

ils ont lair de lire dans vos pensées!

Il peut également être utilisé pour les filtres de messagerie, les services de recommandation de musique et plus encore.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *