Bayes “Tétel

A Bayes varázsolni képes!

Elgondolkodott már azon, hogy a számítógépek hogyan tanulnak az emberekről?

Példa:

A “filmautomatikus cipőfűzők” internetes keresése felveti a “Vissza a jövőbe”

A keresőmotor megnézte a filmet? Nem, de sok más keresésből tudja, hogy mit keresnek az emberek.

És ezt a valószínűséget kiszámítja a Bayes-tétel segítségével.

Bayes “tétel a valószínűség megtalálásának egyik módja, ha ismerünk bizonyos más valószínűségeket.

A képlet:

P (A | B) = P (A) P (B | A) P (B)

Ami megmondja: milyen gyakran történik A, tekintettel arra, hogy B történik, P (A | B),
Amikor tudjuk: milyen gyakran történik B, tekintettel arra, hogy A történik, P (B | A)
és az A valószínűsége önmagában, írva P (A)
és B valószínűsége önmagában, írott P (B)

Tegyük fel, hogy P (Tűz) azt jelenti, hogy milyen gyakran van tűz, P (Füst) pedig azt, hogy milyen gyakran lásd a füstöt:

P (Tűz | Füst) azt jelenti, hogy milyen gyakran van tűz, amikor füstöt láthatunk
P (Füst | Tűz) azt jelenti, hogy milyen gyakran láthatunk füstöt, ha tűz van

Tehát a képlet azt mondja, hogy “előre” P (Tűz | Füst), ha tudjuk, hogy “visszafelé” P (Füst | Tűz)

Csak 4 szám

Képzeljen el 100 embert egy partin, és megszámolja, hogy hányan viselnek rózsaszínt vagy sem, és ha férfi vagy sem, akkor megkapja ezeket a számokat:

Bayes “tétel csak ezen a 4 számon alapszik!

Tegyünk néhány összeget:

És számítson ki néhány valószínűséget:

És akkor megérkezik a kiskutya! Olyan aranyos kiskutya.

De minden adata fel van tépve! Csak 3 érték marad életben:

  • P (Man) = 0,4,
  • P (Pink) = 0,25 és
  • P (Pink | Man) = 0,125

Felfedezheti P (Férfi | Rózsaszín)?

Képzelje el, hogy egy rózsaszínű vendég meghagyja a pénzt … férfi volt? Erre a kérdésre Bayes tételével válaszolhatunk:

P (Férfi | Rózsaszín) = P (Férfi) P (Rózsaszín | Férfi) P (Rózsaszín)

P (Férfi | Rózsaszín ) = 0,4 × 0,1250,25 = 0,2

Megjegyzés: ha még rendelkeznénk a nyers adatokkal, közvetlenül kiszámolhatnánk 525 = 0,2

Általánosnak lenni

Miért működik?

Helyettesítsük a számokat betűkkel:

Most nézzük meg a valószínűségeket. Tehát vegyünk néhány arányt:

  • az “A” teljes valószínűsége P (A) = s + ts + t + u + v
  • a “B adott A” valószínűsége P ( B | A) = ss + t

Ezután szaporítsa őket így:

Most tegyük meg újra, de használjuk a P (B) és a P (A | B) parancsokat:

Mindkettő módon megkapja az ss + t + u + v eredményét

Tehát láthatjuk, hogy:

P (B) P (A | B) = P (A) P ( B | A)

Szép és szimmetrikus, nem?

Valójában szimmetrikusnak kell lennie, mivel felcserélhetjük a sorokat és oszlopokat, és ugyanazt a bal felső sarkot kaphatjuk meg.

És ez a Bayes Fo is rmula … csak ossza el mindkét oldalt P (B) -vel:

P (A | B) = P (A) P (B | A) P (B)

Emlékezés

Először gondolkodj “AB AB AB” -en, majd ne felejtsd el csoportosítani: “AB = A BA / B”

P (A | B) = P (A) P (B | A) P (B)

Macskaallergia?

A Bayes-tétel egyik leghíresebb felhasználása a hamis pozitív és hamis negatív.

Azok számára két lehetséges esetünk van az “A” esetre, például a megfelelő / nem megfelelő (vagy az igen / nem stb.)

Példa: Allergia vagy nem?

Vadász szerint viszket. Van egy teszt a macskák allergiájára, de ez a teszt nem mindig megfelelő:

  • Azoknál az embereknél, akik valóban allergiásak, a teszt azt mondja, hogy “Igen” az esetek 80% -a
  • Azoknál az embereknél, akiknek nincs allergiája, a teszt azt mondja, hogy “Igen” az idő 10% -a (“hamis pozitív”)

Ha a lakosság 1% -a allergiás , és Hunter tesztje azt mondja, hogy „Igen”, mennyi az esélye annak, hogy Hunter valóban allergiás?

Szeretnénk tudni az allergia esélyét, amikor a teszt „Igen” -t mond, írt P (Allergia | Igen)

Adjuk meg a képletünket:

P (Allergia | Igen) = P (Allergia) P (Igen | Allergia) P (Igen)

Ó, ne! Nem tudjuk, milyen általános esélye van annak, hogy a teszt “Igen” -t mondjon. >

  • 1% -uk allergiás, és a teszt “Igen” -et mond 80% -uknak.
  • 99% -uk nem allergiás, és a teszt “Igen” -et mond őket

Tegyük hozzá:

P (Igen) = 1% × 80% + 99% × 10% = 10,7%

Ami azt jelenti, hogy a lakosság körülbelül 10,7% -a kap “Igen” eredményt.

Tehát most kiegészíthetjük képletünket:

P (Allergia | Igen) = 1% × 80% 10,7% = 7.48%

P (Allergia | Igen) = kb. 7%

Ugyanezt az eredményt kaptuk a hamis pozitív és hamis negatívokról. írhat egy speciális változatot a Bayes “képletről csak az ilyen dolgokra:

P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (nem A) P (B | nem A)

“A” három (vagy több) esettel

Éppen láttuk az “A” -t két esettel (A és nem A), amelyről az alsó sorban gondoskodtunk.

Ha az “A” -nak 3 vagy több esete van, mindet belefoglaljuk az alsó sorba:

P (A1 | B ) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … stb

Most térjünk vissza a keresőmotorokhoz.

A keresőmotorok ezt az ötletet alkalmazzák és sokat bővítik (plusz néhány egyéb trükköt).

Ez úgy néz ki, mintha el tudnák olvasni a gondolatait!

Ez is használható levélszűrőkhöz, zenei ajánlási szolgáltatásokhoz és egyebekhez.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük