A Bayes varázsolni képes!
Elgondolkodott már azon, hogy a számítógépek hogyan tanulnak az emberekről?
Példa:
A “filmautomatikus cipőfűzők” internetes keresése felveti a “Vissza a jövőbe”
A keresőmotor megnézte a filmet? Nem, de sok más keresésből tudja, hogy mit keresnek az emberek.
És ezt a valószínűséget kiszámítja a Bayes-tétel segítségével.
Bayes “tétel a valószínűség megtalálásának egyik módja, ha ismerünk bizonyos más valószínűségeket.
A képlet:
P (A | B) = P (A) P (B | A) P (B)
Ami megmondja: | milyen gyakran történik A, tekintettel arra, hogy B történik, P (A | B), | |
Amikor tudjuk: | milyen gyakran történik B, tekintettel arra, hogy A történik, P (B | A) | |
és az A valószínűsége önmagában, írva P (A) | ||
és B valószínűsége önmagában, írott P (B) |
Tegyük fel, hogy P (Tűz) azt jelenti, hogy milyen gyakran van tűz, P (Füst) pedig azt, hogy milyen gyakran lásd a füstöt:
P (Tűz | Füst) azt jelenti, hogy milyen gyakran van tűz, amikor füstöt láthatunk
P (Füst | Tűz) azt jelenti, hogy milyen gyakran láthatunk füstöt, ha tűz van
Tehát a képlet azt mondja, hogy “előre” P (Tűz | Füst), ha tudjuk, hogy “visszafelé” P (Füst | Tűz)
Csak 4 szám
Képzeljen el 100 embert egy partin, és megszámolja, hogy hányan viselnek rózsaszínt vagy sem, és ha férfi vagy sem, akkor megkapja ezeket a számokat:
Bayes “tétel csak ezen a 4 számon alapszik!
Tegyünk néhány összeget:
És számítson ki néhány valószínűséget:
És akkor megérkezik a kiskutya! Olyan aranyos kiskutya.
De minden adata fel van tépve! Csak 3 érték marad életben:
- P (Man) = 0,4,
- P (Pink) = 0,25 és
- P (Pink | Man) = 0,125
Felfedezheti P (Férfi | Rózsaszín)?
Képzelje el, hogy egy rózsaszínű vendég meghagyja a pénzt … férfi volt? Erre a kérdésre Bayes tételével válaszolhatunk:
P (Férfi | Rózsaszín) = P (Férfi) P (Rózsaszín | Férfi) P (Rózsaszín)
P (Férfi | Rózsaszín ) = 0,4 × 0,1250,25 = 0,2
Megjegyzés: ha még rendelkeznénk a nyers adatokkal, közvetlenül kiszámolhatnánk 525 = 0,2
Általánosnak lenni
Miért működik?
Helyettesítsük a számokat betűkkel:
Most nézzük meg a valószínűségeket. Tehát vegyünk néhány arányt:
- az “A” teljes valószínűsége P (A) = s + ts + t + u + v
- a “B adott A” valószínűsége P ( B | A) = ss + t
Ezután szaporítsa őket így:
Most tegyük meg újra, de használjuk a P (B) és a P (A | B) parancsokat:
Mindkettő módon megkapja az ss + t + u + v eredményét
Tehát láthatjuk, hogy:
P (B) P (A | B) = P (A) P ( B | A)
Szép és szimmetrikus, nem?
Valójában szimmetrikusnak kell lennie, mivel felcserélhetjük a sorokat és oszlopokat, és ugyanazt a bal felső sarkot kaphatjuk meg.
És ez a Bayes Fo is rmula … csak ossza el mindkét oldalt P (B) -vel:
P (A | B) = P (A) P (B | A) P (B)
Emlékezés
Először gondolkodj “AB AB AB” -en, majd ne felejtsd el csoportosítani: “AB = A BA / B”
P (A | B) = P (A) P (B | A) P (B)
Macskaallergia?
A Bayes-tétel egyik leghíresebb felhasználása a hamis pozitív és hamis negatív.
Azok számára két lehetséges esetünk van az “A” esetre, például a megfelelő / nem megfelelő (vagy az igen / nem stb.)
Példa: Allergia vagy nem?
Vadász szerint viszket. Van egy teszt a macskák allergiájára, de ez a teszt nem mindig megfelelő:
- Azoknál az embereknél, akik valóban allergiásak, a teszt azt mondja, hogy “Igen” az esetek 80% -a
- Azoknál az embereknél, akiknek nincs allergiája, a teszt azt mondja, hogy “Igen” az idő 10% -a (“hamis pozitív”)
Ha a lakosság 1% -a allergiás , és Hunter tesztje azt mondja, hogy „Igen”, mennyi az esélye annak, hogy Hunter valóban allergiás?
Szeretnénk tudni az allergia esélyét, amikor a teszt „Igen” -t mond, írt P (Allergia | Igen)
Adjuk meg a képletünket:
P (Allergia | Igen) = P (Allergia) P (Igen | Allergia) P (Igen)
Ó, ne! Nem tudjuk, milyen általános esélye van annak, hogy a teszt “Igen” -t mondjon. >
- 1% -uk allergiás, és a teszt “Igen” -et mond 80% -uknak.
- 99% -uk nem allergiás, és a teszt “Igen” -et mond őket
Tegyük hozzá:
P (Igen) = 1% × 80% + 99% × 10% = 10,7%
Ami azt jelenti, hogy a lakosság körülbelül 10,7% -a kap “Igen” eredményt.
Tehát most kiegészíthetjük képletünket:
P (Allergia | Igen) = 1% × 80% 10,7% = 7.48%
P (Allergia | Igen) = kb. 7%
Ugyanezt az eredményt kaptuk a hamis pozitív és hamis negatívokról. írhat egy speciális változatot a Bayes “képletről csak az ilyen dolgokra:
P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (nem A) P (B | nem A)
“A” három (vagy több) esettel
Éppen láttuk az “A” -t két esettel (A és nem A), amelyről az alsó sorban gondoskodtunk.
Ha az “A” -nak 3 vagy több esete van, mindet belefoglaljuk az alsó sorba:
P (A1 | B ) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … stb
Most térjünk vissza a keresőmotorokhoz.
A keresőmotorok ezt az ötletet alkalmazzák és sokat bővítik (plusz néhány egyéb trükköt).
Ez úgy néz ki, mintha el tudnák olvasni a gondolatait!
Ez is használható levélszűrőkhöz, zenei ajánlási szolgáltatásokhoz és egyebekhez.