ベイズの定理

ベイズは魔法を使うことができます!

コンピューターが人についてどのように学ぶのか疑問に思ったことはありませんか?

例:

「映画の自動靴ひも」をインターネットで検索すると、「バック・トゥ・ザ・フューチャー」が表示されます

検索エンジンは映画を見ましたか?いいえ、しかし他の多くの検索から人々がおそらく探しているものを知っています。

そしてベイズの定理を使用してその確率を計算します。

ベイズの定理は、他の特定の確率がわかっている場合に確率を見つける方法です。

式は次のとおりです。

P(A | B)= P(A)P(B | A)P(B)

これは次のことを示しています: Bが発生した場合にAが発生する頻度、P(A | B)、
わかっている場合: Aが発生した場合にBが発生する頻度は、P(B | A)
Aがそれ自体である可能性、P(A)と書かれている
およびBが単独で発生する可能性、P(B)と記述

P(Fire)は火災の頻度を意味し、P(Smoke)は私たちの頻度を意味するとします。煙を見る:

P(Fire | Smoke)は、煙が見えるときに火が出る頻度を意味します
P(Smoke | Fire)は、火が出るときに煙が見える頻度を意味します
/ p>

つまり、式の種類は、「後方」P(煙|火)がわかっているときに「前方」P(火|煙)を示します

4つの数字だけ

パーティーで100人を想像してみてください。ピンクを着ているかどうか、男性かどうかを計算して、次の数値を取得します。

ベイズ “定理は、これら4つの数値のみに基づいています。

いくつかの合計を行いましょう:

そしていくつかの確率を計算します:

すると、子犬が到着します。とてもかわいい子犬。

しかし、すべてのデータが破壊されています。 3つの値のみが存続します:

  • P(Man)= 0.4、
  • P(Pink)= 0.25、および
  • P(Pink | Man)= 0.125

P(Man | Pink)を発見できますか?

ピンクを着たゲストがお金を残していると想像してみてください…それは男性でしたか?ベイズの定理を使用してこの質問に答えることができます:

P(Man | Pink)= P(Man)P(Pink | Man)P(Pink)

P(Man | Pink )= 0.4×0.1250.25 = 0.2

注:生データがまだある場合は、直接計算できます525 = 0.2

一般的

なぜ機能するのですか?

数字を文字に置き換えましょう:

次に確率を見てみましょう。そこで、いくつかの比率を取ります。

  • 「A」の全体的な確率はP(A)= s + ts + t + u + v
  • 「Aが与えられたB」の確率はP( B | A)= ss + t

次に、次のようにそれらを乗算します。

もう一度やりましょう。ただし、P(B)とP(A | B)を使用します。

両方方法はss + t + u + vの同じ結果を取得します

したがって、次のことがわかります。

P(B)P(A | B)= P(A)P( B | A)

素晴らしく対称的ではありませんか?

行と列を入れ替えて同じ左上隅を取得できるため、実際には対称である必要があります。

そしてそれはBayesFoでもありますrmula …両側をP(B)で割るだけです:

P(A | B)= P(A)P(B | A)P(B)

覚えている

最初に「ABABAB」と考えてから、「AB = A BA / B」のようにグループ化することを忘れないでください。

P(A | B)= P(A)P(B | A)P(B)

猫アレルギー?

ベイズの定理の有名な用途の1つは、偽陽性と偽陰性です。

「A」には、合格/不合格(またははい/いいえなど)の2つのケースが考えられます。

例:アレルギーかどうか

ハンターはかゆみがあると言います。猫アレルギーのテストがありますが、このテストが常に正しいとは限りません。

  • 実際にアレルギーを持っている人の場合、テストでは80%の確率で「はい」と表示されます。
  • アレルギーを持っていない人の場合、テストでは10%の確率で「はい」(「偽陽性」)と表示されます

人口の1%がアレルギーを持っている場合、ハンターのテストで「はい」と表示された場合、ハンターが実際にアレルギーを持っている可能性はどのくらいですか?

テストで「はい」と表示されたときにアレルギーを起こす可能性を知りたいのですが、書かれたP(アレルギー|はい)

式を取得しましょう:

P(アレルギー|はい)= P(アレルギー)P(はい|アレルギー)P(はい)

ああ、いや! 「はい」と答えるテストの一般的な可能性が何であるかはわかりません…

…しかし、アレルギーのある人とない人を合計することで計算できます:

  • 1%がアレルギーを持っており、テストでは80%に「はい」と答えています
  • 99%はアレルギーがなく、テストでは10%に「はい」と答えていますそれら

それを合計しましょう:

P(はい)= 1%×80%+ 99%×10%= 10.7%

これは、人口の約10.7%が「はい」の結果を得るということを意味します。

これで、式を完成させることができます。

P(アレルギー|はい)= 1% ×80%10.7%= 7。48%

P(Allergy | Yes)=約7%

これは、FalsePositiveとFalseNegativeで得られた結果と同じです。

実際、 次のような場合にのみ、ベイズの式の特別なバージョンを記述できます。

P(A | B)= P(A)P(B | A)P(A)P(B | A) + P(not A)P(B | not A)

3つ(またはそれ以上)のケースで「A」

2つのケース(Aと A)、これは最終的に処理しました。

「A」に3つ以上のケースがある場合、それらすべてを最終的に含めます。

P(A1 | B )= P(A1)P(B | A1)P(A1)P(B | A1)+ P(A2)P(B | A2)+ P(A3)P(B | A3)+ … etc

ここで、検索エンジンに戻ります。

検索エンジンはこのアイデアを取り入れて、大幅にスケールアップします(さらに他のいくつかのトリックもあります)。

彼らはあなたの心を読むことができるように見えます!

メールフィルター、音楽推薦サービスなどにも使用できます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です