Bayes „Theorem (Deutsch)

Bayes können zaubern!

Haben Sie sich jemals gefragt, wie Computer etwas über Menschen lernen?

Beispiel:

Eine Internetsuche nach „Filmauto-Schnürsenkeln“ bringt „Zurück in die Zukunft“

Hat die Suchmaschine den Film gesehen? Nein, aber sie weiß aus vielen anderen Suchanfragen, wonach die Leute wahrscheinlich suchen.

Und sie berechnet diese Wahrscheinlichkeit mit dem Bayes-Theorem.

Bayes „Theorem ist ein Weg, eine Wahrscheinlichkeit zu finden, wenn wir bestimmte andere Wahrscheinlichkeiten kennen.

Die Formel lautet:

P (A | B) = P (A) P (B | A) P (B)

Was uns sagt: wie oft A passiert, wenn B passiert, geschrieben P (A | B),
Wenn wir wissen: wie oft B passiert, wenn A passiert, geschrieben P (B | A)
und wie wahrscheinlich A alleine ist, geschrieben P (A)
und wie wahrscheinlich B für sich ist, geschrieben P (B)

Sagen wir, P (Feuer) bedeutet, wie oft es Feuer gibt, und P (Rauch) bedeutet, wie oft wir Rauch sehen, dann:

P (Feuer | Rauch) bedeutet, wie oft es Feuer gibt, wenn wir Rauch sehen können.
P (Rauch | Feuer) bedeutet, wie oft wir Rauch sehen können, wenn es Feuer gibt

Die Formel sagt uns also „vorwärts“ P (Feuer | Rauch), wenn wir „rückwärts“ P (Rauch | Feuer)

Nur 4 Zahlen

Stellen Sie sich 100 Personen auf einer Party vor, und Sie zählen, wie viele rosa tragen oder nicht, und ob ein Mann oder nicht, und erhalten diese Zahlen:

Bayes „Theorem basiert nur auf diesen 4 Zahlen!

Lassen Sie uns einige Summen machen:

Und berechnen Sie einige Wahrscheinlichkeiten:

Und dann kommt der Welpe! So ein süßer Welpe.

Aber alle deine Daten sind zerrissen! Nur 3 Werte überleben:

  • P (Mann) = 0,4,
  • P (Rosa) = 0,25 und
  • P (Rosa | Mann) = 0.125

Können Sie P (Man | Pink) entdecken?

Stellen Sie sich vor, ein pink tragender Gast lässt Geld zurück … war es ein Mann? Wir können diese Frage mit dem Bayes-Theorem beantworten:

P (Man | Pink) = P (Man) P (Pink | Man) P (Pink)

P (Man | Pink) ) = 0,4 × 0,1250,25 = 0,2

Hinweis: Wenn wir noch die Rohdaten hätten, könnten wir direkt berechnen. 525 = 0,2

Allgemein sein

Warum funktioniert es?

Ersetzen wir die Zahlen durch Buchstaben:

Betrachten wir nun die Wahrscheinlichkeiten. Nehmen wir also einige Verhältnisse:

  • die Gesamtwahrscheinlichkeit von „A“ ist P (A) = s + ts + t + u + v
  • die Wahrscheinlichkeit von „B bei A“ ist P ( B | A) = ss + t

Und multiplizieren Sie sie dann wie folgt:

Lassen Sie uns das jetzt noch einmal machen, aber verwenden Sie P (B) und P (A | B):

Beide Wege erhalten das gleiche Ergebnis von ss + t + u + v

Wir können also sehen, dass:

P (B) P (A | B) = P (A) P ( B | A)

Schön und symmetrisch, nicht wahr?

Es muss tatsächlich symmetrisch sein, da wir Zeilen und Spalten vertauschen und dieselbe linke obere Ecke erhalten können.

Und es ist auch Bayes Fo rmula … dividiere einfach beide Seiten durch P (B):

P (A | B) = P (A) P (B | A) P (B)

Erinnern

Denken Sie zuerst an „AB AB AB“ und denken Sie dann daran, es wie folgt zu gruppieren: „AB = A BA / B“

P (A | B) = P (A) P (B | A) P (B)

Katzenallergie?

Eine der bekanntesten Verwendungen des Bayes-Theorems sind falsch positive und falsch negative Ergebnisse.

Für diese haben wir zwei mögliche Fälle für „A“, wie z. B. Bestanden / Nicht Bestanden (oder Ja / Nein usw.)

Beispiel: Allergie oder nicht?

Hunter sagt, sie juckt. Es gibt einen Test für Allergie gegen Katzen, aber dieser Test ist nicht immer richtig:

  • Für Menschen, die wirklich an einer Allergie leiden, sagt der Test in 80% der Fälle „Ja“
  • Bei Personen ohne Allergie lautet der Test in 10% der Fälle „Ja“ („falsch positiv“).

Wenn 1% der Bevölkerung an der Allergie leiden und Jägers Test sagt „Ja“, wie hoch sind die Chancen, dass Hunter wirklich an einer Allergie leidet?

Wir möchten die Wahrscheinlichkeit einer Allergie wissen, wenn der Test „Ja“ sagt. geschrieben P (Allergie | Ja)

Lassen Sie uns unsere Formel erhalten:

P (Allergie | Ja) = P (Allergie) P (Ja | Allergie) P (Ja)

Oh nein! Wir wissen nicht, wie hoch die allgemeine Wahrscheinlichkeit ist, dass der Test „Ja“ sagt …

… aber wir können dies berechnen, indem wir diejenigen mit und diejenigen ohne Allergie addieren:

  • 1% haben die Allergie und der Test sagt „Ja“ zu 80% von ihnen
  • 99% haben keine Allergie und der Test sagt „Ja“ zu 10% von sie

Addieren wir das:

P (Ja) = 1% × 80% + 99% × 10% = 10,7%

Dies bedeutet, dass ungefähr 10,7% der Bevölkerung ein „Ja“ -Ergebnis erhalten.

Jetzt können wir unsere Formel vervollständigen:

P (Allergie | Ja) = 1% × 80% 10,7% = 7.48%

P (Allergie | Ja) = ungefähr 7%

Dies ist das gleiche Ergebnis, das wir bei falsch positiven und falsch negativen Ergebnissen erzielt haben.

Tatsächlich haben wir kann eine spezielle Version der Bayes „-Formel nur für solche Dinge schreiben:

P (A | B) = P (A) P (B | A) P (A) P (B | A) + P (nicht A) P (B | nicht A)

„A“ mit drei (oder mehr) Fällen

Wir haben gerade „A“ mit zwei Fällen gesehen (A und nicht) A), um die wir uns in der unteren Zeile gekümmert haben.

Wenn „A“ 3 oder mehr Fälle hat, fügen wir sie alle in die untere Zeile ein:

P (A1 | B. ) = P (A1) P (B | A1) P (A1) P (B | A1) + P (A2) P (B | A2) + P (A3) P (B | A3) + … etc

Nun zurück zu den Suchmaschinen.

Suchmaschinen nehmen diese Idee auf und skalieren sie stark (plus einige andere Tricks).

Es macht Sie sehen so aus, als könnten sie Ihre Gedanken lesen!

Sie können auch für E-Mail-Filter, Musikempfehlungsdienste und mehr verwendet werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.