第1話 補遺
① ギャンブラーの破産問題
1回の賭けで、勝って1円を得る確率が \(p\)、負けて1円を失う確率が \(q=1-p\) になるギャンブルを考える。本書では、\(m\) 円を持って賭けをはじめたギャンブラーが \(N\) 円持って帰る確率 \(P(m,N)\) が、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N },$$
という公式で与えられるとして、これを使ってギャンブルの必勝法を考えた。この補遺では、この公式を導こう。
まず、この確率は、
$$P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),~~~~~~(1)$$
を満たすことを示す。最初の賭けでギャンブラーが確率 \(p\) で勝つと、\(m\) 円は \((m+1)\) 円になる。ギャンブラーは、今や \((m+1)\) 円持っているので、これを \(N\) 円にして帰れる確率は \(P(m+1,N)\) だ。一方、最初の賭けで確率 \(q\) で負けたとすと、持ち金は \((m-1)\) 円。これを \(N\) 円にして帰れる確率は \(P(m-1,N)\) だ。ギャンブラーは最初の賭けで勝つか負けるかしかない。最初の回に勝って最後に \(N\) 円になる確率 \(p\times P(m+1,N)\) と、最初の回に負けて最後に \(N\) 円になる確率 \(q\times P(m-1,N)\) を足したものが、\(P(m,N)\) に等しいというのが上の式だ。
また、特別な場合として、
$$P(N,N)=1,$$
が成り立つ。これは、最初から \(N\) 円持っていれば、すでに目的の金額になっているから、賭けをすることなくそのまま帰ればよい。だから、「 \(N\) 円持って帰る確率」は1ということを表している。
もう一つ、
$$P(0,N)=0,$$
も成り立つ。これは、最初にゼロ円であれば、すでに破産しているので、最初の賭けをすることすらできない。だから、\(N\) 円にできる確率はゼロだということを表している。
確率 \(P(m,N)\) はこの3つの式を満たしていなければいけない。本文で使った公式、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N }$$
はこの3つの式を満たしている。これを確かめよう。
まず、\(P(N,N)=1\) が成り立つ理由は簡単だ。上の式で \(P(N,N)\) を計算すると、分子と分母が等しいから 1となる。
次に、\(P(0,N)=0\) を示すには、\((q/p)^0= 1\) が必要になる。これが成り立てば、\(P(0,N)\) の分子が \(1-(q/p)^0=0\) となるからだ。ある数のゼロ乗は必ず1になるというのは、べき乗の基本的性質だ。これについては、第3話の話で説明する。
最初の \(P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),\) を確認するには、少し計算が必要になる。この式の両辺に \(\left(1-(q/p)^N \right)\)を 掛けると、
$$1-(q/p)^m=p\times\left(1-(q/p)^{m+1} \right)+q\times\left(1-(q/p)^{m-1}\right),$$
となるので、これを示せばよい。
右辺は、
\begin{align}&p\times \left(1-(q/p)^{m+1}\right)+q\times\left(1-(q/p)^{m-1}\right)\\&=p-\frac{q^{m+1}}{p^m} +q-\frac{q^m}{p^{m-1}}\\ &=p- q \frac{q^m}{p^m} +q - p \frac{q^m}{p^m}\\ &= p + q - (p+q)\frac{q^m}{p^m} \\ &=(p+q)\times \left(1-(q/p)^m \right), \end{align}
だが、これは \(p+q=1\) を使えば、左辺に等しい。これで必要な式が確認できた。
逆に、この3つの式 \(P(m,N)\) は、
$$P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),$$
しかないことを示すこともできる。
まず、\(m=0,1,\dots, N\) だということを思い出しておこう。たとえば、\(N=2\)のときには \(m=0,1,2\) であり、(1)式は、
$$P(1,2)=p \times P(2,2) + q \times P(0,2),$$
となる。\(P(0,2)=0, P(2,2)=1\) を知っていて、これを使うと、\(P(1,2)=p\)。これで、\(P(m,2)\) が全部の \(m\) について決まってしまった。
では、\(N=3\) のときにはどうかなるかというと、\(m=0,1,2,3\) で、(1)は、
\begin{align}& P(1,3) = p \times P(2,3) + q \times P(0,3) = p \times P(2,3), \\ & P(2,3) = p \times P(3,3) + q \times P(1,3) = p + q \times P(1,3). \end{align}
ここで、\(P(0,3)=0, P(3,3)=1\) を使った。これは、\(P(1,3)\) と \(P(2,3)\) についての連立1次方程式なので、これを解くと、この2つも決まってしまう。
どんな \(N\) についても、(1)は \(P(1,N)\), \(P(2,N)\),..., \(P(N-1,N)\) についての、\((N-1)\) 個の連立1次方程式になっている ( \(P(0,N)=0\), \(P(N,N)=1\)を使う)。そして、これを解くと \(P(m,N)\) が全部決まってしまうんだ。
\(m\) 円を持って賭けを始めたギャンブラーが \(N\) 円持って帰る確率\(P(m,N)\) は、上の3つの式を満たしている。逆に、この3つの式を満たすことを要求すると、\(P(m,N)\) は決まってしまうので、そのような \(P(m,N)\) があれば、それが正しい答のはずだ。本文で使った確率の式、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N },$$
は、この3つを満たしているので、これが答になる。
② 乳がん検診で陽性が出る確率
本書では、40代女性がマンモグラフィー検診を受けて陽性が出る確率が8パーセント、すなわち \(P\)(陽性) \(=0.08 \) であるとして、陽性の結果が出たときに実際に乳がんにかかっている確率を計算した。この補遺では、本書で与えられたデータと \(P\)(乳がんなし→陽性)\( =0.07 \)を使って、\(P\)(陽性) \(=0.08 \) を導いてみよう。
【注:本書の初版では、本文に掲載されていた\(P\)(乳がんなし→陽性)\( =0.07 \) のデータが、編集の際に誤って削除されていました。詳しくは、正誤表をご覧ください。】
では、\(P\) (陽性) を計算してみよう。ここで使うのは、
$$P(陽性)= P(乳がんあり)P(乳がんあり \rightarrow 陽性)+P(乳がんなし)P(乳がんなし \rightarrow 陽性),$$
という式だ。さっき、\( P\) (数学)\( P\) (数学 → 理科) は数学も理科も両方得意な確率だという話をした。同じように、\( P\) (乳がんあり) \( P\) (乳がんあり→ 陽性)は、乳がんがあって陽性になる確率、\(P\) (乳がんなし)\( P\) (乳がんなし → 陽性)は、乳がんでなくて陽性になる確率だ。乳がんは「ある」か「ない」かのどちらしかないから、この両方の確率を足すと、\(P\) (陽性) になるというのが上の式だ。
さて、僕らは既に、
\begin{align}& P(乳がんあり)=0.008, \nonumber \\ & P(乳がんなし)=1-0.008=0.992, \\&P(乳がんあり \rightarrow 陽性)=0.9, \\ & P(乳がんなし \rightarrow 陽性)=0.07,\end{align}
を知っているから、これを使えば、
$$ P(陽性) =0.008×0.9 + 0.992×0.07 = 0.08 , $$
となる。つまり、40代の女性がマンモグラフィーを受診して、その結果が陽性になる確率は8パーセントというわけだ。
③ 再検査でもう一度陽性が出たら
もし検診を受けて陽性という結果が出たら、さらに検査を受けることになるだろう。そこで、もう一度陽性になったら、そのときに乳がんである確率はどうだろうか。計算を簡単にするために、2回目の検診の信頼度もマンモグラフィーと同じだと考えよう。
さっきは、40代の女性について、ベイズの定理を使って、確率 \(P\) (陽性→ 乳がんあり)を計算した。今度は、1回目の検診で陽性になった女性のグループについて、同じ計算をしてみよう。ベイズの定理は、
$$P(陽性)P(陽性\rightarrow 乳がんあり)=P(乳がんあり)P(乳がんあり\rightarrow 陽性),$$
のままだけれど、1回目の検診で陽性になったグループでは \(P\) (陽性) や \(P\) (乳がんあり) の値が異なる。
1回目の検診で陽性が出た場合、乳がんの確率は9パーセントだった。だから、このグループについては \(P\) (乳がんあり) \( =0.09\) を使う。では、このグループの女性が2回目の検診で陽性になる確率 \(P\) (陽性)はどうかと言うと、
\begin{align}P(陽性)\,& = P(乳がんあり)P(乳がんあり \rightarrow 陽性)\\ &~~~~+P(乳がんなし)P(乳がんなし\rightarrow 陽性)\\ &=0.09 \times 0.9+0.91 \times 0.07=0.14,\end{align}
となる。この計算では、1回目でも2回目でも、検診の信頼度は同じで、
$$P(乳がんあり \rightarrow 陽性)=0.9 、P(乳がんなし\rightarrow 陽性) = 0.07$$
だと仮定した。
この値について、ベイズの定理を使うと、
\begin{align}P(陽性 \rightarrow 乳がんあり)&=\frac{P(乳がんあり)P(乳がんあり\rightarrow 陽性)}{P(陽性)}\\ &=\frac{0.09×0.9}{0.14} =0.58. \end{align}
1回陽性が出ただけでは、乳がんである確率が9パーセントしかなくても、再度検査して陽性になったら、乳がんである確率が58パーセントもあることになる。
検診をする前の乳がんの確率は0.8パーセント。検診をして陽性だったときの確率は9パーセント。2度目の検診をしてまた陽性だったら、確率は58パーセント。ベイズの定理を使うと、新しい情報が手に入るごとに、確率がどのように修正されていくかが分る。「経験に学ぶ」ということを、数学的に表現することができるんだ。
④ 癖のあるサイコロが混ざっているとき
本書では、癖のあるサイコロとないサイコロが混ざっている場合に、1の目が出る確率を、
$$P(1の目)= P(癖なし)P(癖なし \rightarrow 1の目)+P(癖あり)P(癖あり \rightarrow 1の目),$$
という式で計算した。この式は、補遺②の「検診で陽性が出る確率」と同様に説明できる。
\(P\) 癖なし)\( P\) (癖なし → 1の目)は、手に取ったサイコロに癖があって、しかも1の目が出る確率。\(P\) (癖あり)\( P\) (癖あり → 1の目) は、癖がなくて1の目が出る確率だ。サイコロには癖が「ある」か「ない」かのどちらしかないから、この両方の確率を足すと、\(P\) (1の目) になるというのが上の式だ。