第1話 補遺
① ギャンブラーの破産問題
1回の賭けで、勝って1円を得る確率が \(p\)、負けて1円を失う確率が \(q=1-p\) になるギャンブルを考える。本書では、\(m\) 円を持って賭けをはじめたギャンブラーが \(N\) 円持って帰る確率 \(P(m,N)\) が、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N },$$
という公式で与えられるとして、これを使ってギャンブルの必勝法を考えた。この補遺では、この公式を導こう。
まず、この確率は、
$$P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),~~~~~~(1)$$
を満たすことを示す。最初の賭けでギャンブラーが確率 \(p\) で勝つと、\(m\) 円は \((m+1)\) 円になる。ギャンブラーは、今や \((m+1)\) 円持っているので、これを \(N\) 円にして帰れる確率は \(P(m+1,N)\) だ。一方、最初の賭けで確率 \(q\) で負けたとすと、持ち金は \((m-1)\) 円。これを \(N\) 円にして帰れる確率は \(P(m-1,N)\) だ。ギャンブラーは最初の賭けで勝つか負けるかしかない。最初の回に勝って最後に \(N\) 円になる確率 \(p\times P(m+1,N)\) と、最初の回に負けて最後に \(N\) 円になる確率 \(q\times P(m-1,N)\) を足したものが、\(P(m,N)\) に等しいというのが上の式だ。
また、特別な場合として、
$$P(N,N)=1,$$
が成り立つ。これは、最初から \(N\) 円持っていれば、すでに目的の金額になっているから、賭けをすることなくそのまま帰ればよい。だから、「 \(N\) 円持って帰る確率」は1ということを表している。
もう一つ、
$$P(0,N)=0,$$
も成り立つ。これは、最初にゼロ円であれば、すでに破産しているので、最初の賭けをすることすらできない。だから、\(N\) 円にできる確率はゼロだということを表している。
確率 \(P(m,N)\) はこの3つの式を満たしていなければいけない。本文で使った公式、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N }$$
はこの3つの式を満たしている。これを確かめよう。
まず、\(P(N,N)=1\) が成り立つ理由は簡単だ。上の式で \(P(N,N)\) を計算すると、分子と分母が等しいから 1となる。
次に、\(P(0,N)=0\) を示すには、\((q/p)^0= 1\) が必要になる。これが成り立てば、\(P(0,N)\) の分子が \(1-(q/p)^0=0\) となるからだ。ある数のゼロ乗は必ず1になるというのは、べき乗の基本的性質だ。これについては、第3話の話で説明する。
最初の \(P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),\) を確認するには、少し計算が必要になる。この式の両辺に \(\left(1-(q/p)^N \right)\)を 掛けると、
$$1-(q/p)^m=p\times\left(1-(q/p)^{m+1} \right)+q\times\left(1-(q/p)^{m-1}\right),$$
となるので、これを示せばよい。
右辺は、
\begin{align}&p\times \left(1-(q/p)^{m+1}\right)+q\times\left(1-(q/p)^{m-1}\right)\\&=p-\frac{q^{m+1}}{p^m} +q-\frac{q^m}{p^{m-1}}\\ &=p- q \frac{q^m}{p^m} +q - p \frac{q^m}{p^m}\\ &= p + q - (p+q)\frac{q^m}{p^m} \\ &=(p+q)\times \left(1-(q/p)^m \right), \end{align}
だが、これは \(p+q=1\) を使えば、左辺に等しい。これで必要な式が確認できた。
逆に、この3つの式 \(P(m,N)\) は、
$$P(m,N)=p\times P(m+1,N)+q\times P(m-1,N),$$
しかないことを示すこともできる。
まず、\(m=0,1,\dots, N\) だということを思い出しておこう。たとえば、\(N=2\)のときには \(m=0,1,2\) であり、(1)式は、
$$P(1,2)=p \times P(2,2) + q \times P(0,2),$$
となる。\(P(0,2)=0, P(2,2)=1\) を知っていて、これを使うと、\(P(1,2)=p\)。これで、\(P(m,2)\) が全部の \(m\) について決まってしまった。
では、\(N=3\) のときにはどうかなるかというと、\(m=0,1,2,3\) で、(1)は、
\begin{align}& P(1,3) = p \times P(2,3) + q \times P(0,3) = p \times P(2,3), \\ & P(2,3) = p \times P(3,3) + q \times P(1,3) = p + q \times P(1,3). \end{align}
ここで、\(P(0,3)=0, P(3,3)=1\) を使った。これは、\(P(1,3)\) と \(P(2,3)\) についての連立1次方程式なので、これを解くと、この2つも決まってしまう。
どんな \(N\) についても、(1)は \(P(1,N)\), \(P(2,N)\),..., \(P(N-1,N)\) についての、\((N-1)\) 個の連立1次方程式になっている ( \(P(0,N)=0\), \(P(N,N)=1\)を使う)。そして、これを解くと \(P(m,N)\) が全部決まってしまうんだ。
\(m\) 円を持って賭けを始めたギャンブラーが \(N\) 円持って帰る確率\(P(m,N)\) は、上の3つの式を満たしている。逆に、この3つの式を満たすことを要求すると、\(P(m,N)\) は決まってしまうので、そのような \(P(m,N)\) があれば、それが正しい答のはずだ。本文で使った確率の式、
$$P(m,N)=\frac{1-(q/p)^m}{1-(q/p)^N },$$
は、この3つを満たしているので、これが答になる。
② 前立腺がん検診で陽性が出る確率
本書では、50代男性がPSA検診を受けて陽性が出る確率が10パーセント、すなわち \(P\)(陽性) \(=0.1 \) であるとして、陽性の結果が出たときに実際に前立腺がんにかかっている確率を計算した。この補遺では、本書で与えられたデータと\(P\)(前立腺がんなし→陽性)\( =0.1 \)を使って、\(P\)(陽性) \(=0.1 \) を導いてみよう。
ここで使うのは、
$$P(陽性)= P(前立腺がんあり)P(前立腺がんあり \rightarrow 陽性)+P(前立腺がんなし)P(前立腺がんなし \rightarrow 陽性),$$
という式だ。さっき、\( P\) (数学)\( P\) (数学 → 理科) は数学も理科も両方得意な確率だという話をした。同じように、\( P\) (前立腺がんあり) \( P\) (前立腺がんあり→ 陽性)は、前立腺がんがあって陽性になる確率、\(P\) (前立腺がんなし)\( P\) (前立腺がんなし → 陽性)は、前立腺がんでなくて陽性になる確率だ。前立腺がんは「ある」か「ない」かのどちらしかないから、この両方の確率を足すと、\(P\) (陽性) になるというのが上の式だ。
さて、僕らは既に、
\begin{align}& P(前立腺がんあり)=0.0014, \nonumber \\ & P(前立腺がんなし)=1-0.0014=0.9986, \\&P(前立腺がんあり \rightarrow 陽性)=0.85, \\ & P(前立腺がんなし \rightarrow 陽性)=0.1,\end{align}
を知っているから、これを使えば、
$$ P(陽性) =0.0014×0.85 +0.9986×0.1 \approx 0.1, $$
となる。この計算では、50代の男性が前立腺がんかかっている確率自身が0.0014ととても小さいので、\(P\)(前立腺がんなし→陽性)と \(P\)(陽性) がほぼ等しくなっている。そのため、PSA検査を受診して、その結果が陽性になる確率は10パーセントとなる。
③ 再検査でもう一度陽性が出たら
もし検診を受けて陽性という結果が出たら、さらに検査を受けることになるだろう。そこで、もう一度陽性になったら、そのときに前立腺がんである確率はどうだろうか。PSA検査で陽性が出ると、実際には生体検査など異なる検査を行うことになり、信頼度もPSA検査とは異なるが、ここでは計算を簡単にするために2回目の検診の信頼度もPSAと同じだとしてみよう。
さっきは、50代の男性について、ベイズの定理を使って、確率 \(P\) (陽性→ 前立腺がんあり)を計算した。今度は、1回目の検診で陽性になった男性のグループについて、同じ計算をしてみよう。ベイズの定理は、
$$P(陽性)P(陽性\rightarrow 前立腺がんあり)=P(前立腺がんあり)P(前立腺がんあり\rightarrow 陽性),$$
のままだけれど、1回目の検診で陽性になったグループでは \(P\) (陽性) や \(P\) (前立腺がんあり) の値が異なる。
1回目の検診で陽性が出た場合、前立腺がんの確率は1.2パーセントだった。だから、このグループについては \(P\) (前立腺がんあり) \( =0.012\) を使う。では、このグループの男性が2回目の検診で陽性になる確率 \(P\) (陽性)はどうかと言うと、
\begin{align}P(陽性)\,& = P(前立腺がんあり)P(前立腺がんあり \rightarrow 陽性)\\ &~~~~+P(前立腺がんなし)P(前立腺がんなし\rightarrow 陽性)\\ &=0.012 \times 0.85+0.988 \times 0.1 = 0.109,\end{align}
となる。この計算では、1回目でも2回目でも、検診の信頼度は同じで、
$$P(前立腺がんあり \rightarrow 陽性)=0.85 、P(前立腺がんなし\rightarrow 陽性) = 0.1$$
だと仮定した。
この値について、ベイズの定理を使うと、
\begin{align}P(陽性 \rightarrow 前立腺がんあり)&=\frac{P(前立腺がんあり)P(前立腺がんあり\rightarrow 陽性)}{P(陽性)}\\ &=\frac{0.012×0.85}{0.109} \approx 0.094. \end{align}
1回陽性が出ただけでは、前立腺がんである確率が1.2パーセントしかなくても、再度検査して陽性になったら、前立腺がんである確率が9.4パーセントに上昇する。
さらにもう一度検査をして、また陽性だった場合には、同じ計算を繰り返すと、前立腺がんである確率はほぼ五分五分の47パーセントとなる。ベイズの定理を使うと、新しい情報が手に入るごとに、確率がどのように修正されていくかが分る。「経験に学ぶ」ということを、数学的に表現することができるんだ。
④ 癖のあるサイコロが混ざっているとき
本書では、癖のあるサイコロとないサイコロが混ざっている場合に、1の目が出る確率を、
$$P(1の目)= P(癖なし)P(癖なし \rightarrow 1の目)+P(癖あり)P(癖あり \rightarrow 1の目),$$
という式で計算した。この式は、補遺②の「検診で陽性が出る確率」と同様に説明できる。
\(P\) 癖なし)\( P\) (癖なし → 1の目)は、手に取ったサイコロに癖があって、しかも1の目が出る確率。\(P\) (癖あり)\( P\) (癖あり → 1の目) は、癖がなくて1の目が出る確率だ。サイコロには癖が「ある」か「ない」かのどちらしかないから、この両方の確率を足すと、\(P\) (1の目) になるというのが上の式だ。