Teorema di Bayes

Bayes sa fare magie!

Ti sei mai chiesto come i computer imparano a conoscere le persone?

Esempio:

Una ricerca su Internet per “lacci per scarpe automatici per film” fa apparire “Ritorno al futuro”

Il motore di ricerca ha guardato il film? No, ma sa da molte altre ricerche cosa stanno probabilmente cercando le persone.

E calcola tale probabilità utilizzando il teorema di Bayes.

Il teorema di Bayes è un modo per trovare una probabilità quando conosciamo alcune altre probabilità.

La formula è:

P (A | B) = P (A) P (B | A) P (B)

Il che ci dice: quanto spesso accade A dato che B accade, scritto P (A | B),
Quando sappiamo: quanto spesso accade B dato che accade A, scritto P (B | A)
e quanto è probabile che A sia da solo, scritto P (A)
e quanto è probabile che B sia da solo, scritto P (B)

Diciamo che P (Fuoco) significa quanto spesso cè fuoco e P (Fumo) quanto spesso vedi il fumo, quindi:

P (Fuoco | Fumo) significa quanto spesso cè fuoco quando possiamo vedere il fumo
P (Fumo | Fuoco) indica quanto spesso possiamo vedere fumo quando cè fuoco

Quindi la formula ci dice “avanti” P (Fuoco | Fumo) quando sappiamo “al contrario” P (Fumo | Fuoco)

Solo 4 numeri

Immagina 100 persone a una festa e calcoli quante vestono di rosa o no, e se un uomo o no, e ottieni questi numeri:

Il teorema di Bayes si basa solo su questi 4 numeri!

Facciamo alcuni totali:

e calcoliamo alcune probabilità:

E poi arriva il cucciolo! Un cucciolo così carino.

Ma tutti i tuoi dati sono stati strappati! Sopravvivono solo 3 valori:

  • P (Man) = 0.4,
  • P (Pink) = 0.25 e
  • P (Pink | Man) = 0,125

Riesci a scoprire P (Man | Pink)?

Immagina che un ospite vestito di rosa lasci i soldi dietro … era un uomo? Possiamo rispondere a questa domanda usando il teorema di Bayes:

P (Man | Pink) = P (Man) P (Pink | Man) P (Pink)

P (Man | Pink ) = 0.4 × 0.1250.25 = 0.2

Nota: se avessimo ancora i dati grezzi potremmo calcolare direttamente 525 = 0.2

Essere generali

Perché funziona?

Sostituiamo i numeri con le lettere:

Ora esaminiamo le probabilità. Quindi prendiamo alcuni rapporti:

  • la probabilità complessiva di “A” è P (A) = s + ts + t + u + v
  • la probabilità di “B dato A” è P ( B | A) = ss + t

E poi moltiplicali insieme in questo modo:

Ora facciamolo di nuovo ma usa P (B) e P (A | B):

Entrambi modi ottengono lo stesso risultato di ss + t + u + v

Quindi possiamo vedere che:

P (B) P (A | B) = P (A) P ( B | A)

Bello e simmetrico non è vero?

In realtà deve essere simmetrico in quanto possiamo scambiare righe e colonne e ottenere lo stesso angolo in alto a sinistra.

Ed è anche Bayes Fo rmula … dividi entrambi i lati per P (B):

P (A | B) = P (A) P (B | A) P (B)

Ricordare

Prima pensa “AB AB AB”, poi ricordati di raggrupparlo come: “AB = A BA / B”

P (A | B) = P (A) P (B | A) P (B)

Allergia al gatto?

Uno degli usi famosi del teorema di Bayes sono i falsi positivi e i falsi negativi.

Per questi abbiamo due possibili casi per “A”, come Superato / Non superato (o Sì / No ecc.)

Esempio: Allergia o no?

Hunter dice che ha prurito. Esiste un test per lallergia ai gatti, ma questo test non è sempre corretto:

  • Per le persone che hanno davvero lallergia, il test dice “Sì” l80% delle volte
  • Per le persone che non hanno lallergia, il test dice “Sì” il 10% delle volte (“falso positivo”)

Se l1% della popolazione ha lallergia e il test di Hunter dice “Sì”, quali sono le possibilità che Hunter abbia davvero lallergia?

Vogliamo conoscere la possibilità di avere lallergia quando il test dice “Sì”, scritto P (Allergia | Sì)

Prendiamo la nostra formula:

P (Allergia | Sì) = P (Allergia) P (Sì | Allergia) P (Sì)

Oh no! Non sappiamo quale sia la probabilità generale che il test dica “Sì” …

… ma possiamo calcolarla sommando quelli con e quelli senza lallergia:

  • L1% ha lallergia e il test dice “Sì” all80% di loro
  • Il 99% non ha lallergia e il test dice “Sì” al 10% dei

Sommiamo:

P (Sì) = 1% × 80% + 99% × 10% = 10,7%

Ciò significa che circa il 10,7% della popolazione otterrà un risultato “Sì”.

Quindi ora possiamo completare la nostra formula:

P (Allergia | Sì) = 1% × 80% 10,7% = 7.48%

P (Allergy | Yes) = circa 7%

Questo è lo stesso risultato che abbiamo ottenuto con i falsi positivi e i falsi negativi.

In effetti noi può scrivere una versione speciale della formula “Bayes” solo per cose come questa:

P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (non A) P (B | non A)

“A” con tre (o più) casi

Abbiamo appena visto “A” con due casi (A e non A), di cui ci siamo occupati nella riga inferiore.

Quando “A” ha 3 o più casi, li includiamo tutti nella riga inferiore:

P (A1 | B ) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … ecc

Ora, torniamo ai motori di ricerca.

I motori di ricerca prendono questa idea e la ampliano molto (più alcuni altri trucchi).

Rende sembra che possano leggere la tua mente!

Può essere utilizzato anche per filtri di posta, servizi di consigli musicali e altro ancora.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *