読者です 読者をやめる 読者になる 読者になる

Data Science by R and Python

統計学を、広く、深く、わかりやすく。

確率の謎・ベイズの定理 - 2名のうち1名が女の子とわかったとき、2名とも女の子の確率? -

ベイズの定理??

今日は、ベイズの定理について。ベイズの定理を聞いたことのない人もいるかもしれませんので、まずはベイズの定理から説明します。ベイズの定理は数学的には次のように書き表されます。

{ \displaystyle
P(B|A) = \frac{P(A | B)\, P(B)}{P(A)}
}

数式をみても、さっぱり意味の分からない人もいらっしゃるかと思うので、具体例で詳しく1つ1つ説明していきます。

ベイズの定理の主張

まず、ベイズの定理って何を主張しているのかを説明します。
具体的な例で説明しましょう。

「隣の家に2人の子供がいる事が解っています、ある日、隣の子供のうち1人が女の子である事が解りました。隣家のお母さんに「女のお子さんはいますか?」と質問した所「はい」と答えました。このとき、もう1人の子供も女の子である確率はいくつでしょうか?※なお、男女比は1:1とする。」という問題を考えましょう。

この問題、普通に考えれば1/2なんですけど、これ違うんです。事前に「一人が女の子」という情報が与えられているので、考え方としては、「一人が女の子であるとわかったもとでの、もう一人の女の子」である確率を考えることになります。

全ての事象は次の4つです。
(女・女)、(男・女)、(女・男)、(男・男)

で、今「一人が女の子」という情報が与えられているので
(女・女)、(男・女)、(女・男)
が起こりうる全ての事象となります。すると、結果的に答えは、1/3となるわけです。

ベイズの定理的に解釈すると...

{ \displaystyle
P(B|A) = \frac{P(A | B)\, P(B)}{P(A)} = \frac{P(A \cap B)}{P(A)} 
}

これは、Aという情報が与えられたもとでの、Bが起こる確率を意味します。つまり、先ほどの例でいえば、「A:2名のうち少なくとも1名が女の子」という情報を意味します。このもとで、事象B「2名とも女の子」を計算しています。そして、P(A)というのはAが起こる確率です。
ちなみに、P(A) = 3/4 です(2名とも男の子ではない限り、、、なので)。次に、P(A かつ B) = 1/4(2名とも女の子の確率)です。よって、式としては計算すると、1/3になりますね。

別の問題

「皆さんが街角にいて、目の前を3人の男性、1人の女性が通り過ぎたとします。この時、次に通る人は男性ですか?女性ですか?」というのを当てるゲームをしましょう。

普通に考えれば、次が男性である確率は1/2, 女性である確率がと考えるのが1/2です。いわゆる習った確率の「普通」です。しかしながら、次の人の前に「3名」の男性、「1名」の女性が通っているという事実があります。この情報を捨ててしまっていいのでしょうか?

ベイズはこの情報を利用します。「男性が3名」「女性が1名」ということは、次に男性が通る確率は、1/2よりも少し高いのではないかと予測します。つまり、経験を用いて「私たちの知っている1/2という何も知らない状態の確率」を書き換えるのです。

(注:間違えても3名の男性、1名女性が通ったのだから、次は足りてない女性の確率が高そうだ!なんて考えないでください。こう考えてしまった人は、ギャンブルに負けやすいタイプです。「次こそ、次こそ」という悪い推測を信じてしまうタイプなので気をつけましょう)

はい、続けます。

つまり、ベイズの定理を用いると「男性が通る確率は、1/2ではなく、次に男性が通る確率の方が高い」という結果が導かれます。そういう意味で「経験」を反映した確率を得ることができる。これがベイズの定理です。


不可解ですか?不可解ですよね。でも、これがベイズのルールです。さいころを10回振って「6の目」が4回出た場合は、ベイズの定理に基づけば、次に6が出る確率は1/6よりも大きくなると考えます。これは、経験的に「6」が「出やすい」さいころなのだ。と判断していることになります。これを、数式で表したものがベイズの定理です。

{ \displaystyle
P(B|A) = \frac{P(A | B)\, P(B)}{P(A)} = \frac{P(A \cap B)}{P(A)} 
}

ベイズの定理はどこで使われるの?

実際、ベイズの定理はどこで使われるのですが?と言われると、実は皆さんが利用している様々なサービスの中に利用されています。例えば、「迷惑メールの発見・分類といった作業のコンピュータを用いた自動化(フィルタリング)」なんていうのは、ベイズの定理がバリバリ使われている一例です。