3囚人問題 (さんしゅうじんもんだい、英 : Three Prisoners problem )は確率論 の問題で、マーティン・ガードナー によって1959年 に紹介された[ 1] [ 2] 。「ベルトランの箱のパラドクス (英語版 ) 」を下敷きにしていると考えられている。
概要
ある監獄にA、B、Cという3人の囚人がいて、それぞれ独房に入れられている。罪状はいずれも似たりよったりで、近々3人まとめて処刑 される予定になっている。ところが恩赦 が出て3人のうちランダム に選ばれた1人だけ助かることになったという。誰が恩赦になるかは明かされておらず、それぞれの囚人が「私は助かるのか?」と聞いても看守 は答えない。したがって囚人Aが恩赦になる確率はこの時点では1/3 であると考えられる。
囚人Aは一計を案じ、看守に向かってこう頼んだ。「BとCのどちらが処刑されるかだけでも教えてくれないか?」すると看守は「Bは処刑される」と教えてくれた。
それを聞いた囚人Aはひそかに喜んだ。Bが死刑になる事は確定した以上、恩赦になるのはAかCのいずれか一方であるはずであり、したがってAが恩赦になる確率は1/2 に上昇したからである。
果たして囚人Aが喜んだのは正しいか?
解法
結論を述べるためにまず記号を定義し、簡単な考察をする。「Aが恩赦になる」、「Bが恩赦になる」、「Cが恩赦になる」という事象を略記してそれぞれA、B、Cと書き、「看守が「Bは死刑になる」と答える」という事象をbとする。
看守はA自身が死刑になるか否かを答えないのであるから、恩赦になるのがBの場合、看守は必ず「Cは死刑になる」と答える。同様の理由により、恩赦になるのがCの場合、看守は必ず「Bは死刑になる」と答える。すなわち、
Pr
[
b
∣
B
]
=
0
,
Pr
[
b
∣
C
]
=
1
{\displaystyle \Pr[b\mid B]=0,~~~\Pr[b\mid C]=1}
…①
である。
しかし恩赦を受けるのがA自身であるケースでは、看守は「Bは死刑になる」という回答と「Cは死刑になる」という回答のいずれを答えるか任意に選ぶ事ができる。すなわち、
Pr
[
b
∣
A
]
{\displaystyle \Pr[b\mid A]}
がいくつになるのかは3囚人問題のセッティングのみからは決まらず、看守の性格や思考等に依存して決まる。従って看守の答えを聞いて囚人Aが喜んだのが正しいか否かは、この
Pr
[
b
∣
A
]
{\displaystyle \Pr[b\mid A]}
がどのような値になるのかに依存して異なる [ 3] 。
これをみるために「Bは死刑になる」と看守から聞いた後Aが恩赦になる事後確率
Pr
[
A
∣
b
]
{\displaystyle \Pr[A\mid b]}
を求める。恩赦がランダムに決まるという仮定より
Pr
[
A
]
=
Pr
[
B
]
=
Pr
[
C
]
=
1
3
{\displaystyle \Pr[A]=\Pr[B]=\Pr[C]={1 \over 3}}
…②
であるので、ベイズの定理 より、
Pr
[
A
∣
b
]
=
Pr
[
b
∣
A
]
Pr
[
A
]
Pr
[
b
]
=
Pr
[
b
∣
A
]
Pr
[
A
]
Pr
[
b
∣
A
]
Pr
[
A
]
+
Pr
[
b
∣
B
]
Pr
[
B
]
+
Pr
[
b
∣
C
]
Pr
[
C
]
=
(
2
)
Pr
[
b
∣
A
]
Pr
[
b
∣
A
]
+
Pr
[
b
∣
B
]
+
Pr
[
b
∣
C
]
=
(
1
)
Pr
[
b
∣
A
]
Pr
[
b
∣
A
]
+
1
{\displaystyle \Pr[A\mid b]={\Pr[b\mid A]\Pr[A] \over \Pr[b]}={\Pr[b\mid A]\Pr[A] \over \Pr[b\mid A]\Pr[A]+\Pr[b\mid B]\Pr[B]+\Pr[b\mid C]\Pr[C]}{\underset {(2)}{=}}{\Pr[b\mid A] \over \Pr[b\mid A]+\Pr[b\mid B]+\Pr[b\mid C]}{\underset {(1)}{=}}{\Pr[b\mid A] \over \Pr[b\mid A]+1}}
である[ 3] 。具体的な値をいくつか代入してみると、
Pr
[
A
∣
b
]
=
{
1
2
if
Pr
[
b
∣
A
]
=
1
1
3
if
Pr
[
b
∣
A
]
=
1
2
0
if
Pr
[
b
∣
A
]
=
0.
{\displaystyle \Pr[A\mid b]={\begin{cases}{1 \over 2}&{\text{if }}\Pr[b\mid A]=1\\{1 \over 3}&{\text{if }}\Pr[b\mid A]={1 \over 2}\\0&{\text{if }}\Pr[b\mid A]=0.\end{cases}}}
したがって最初に述べたように、「Bは死刑になる」と看守から聞いた後Aが恩赦になる事後確率
Pr
[
A
∣
b
]
{\displaystyle \Pr[A\mid b]}
は、Aが恩赦されるケースで看守が「Bが死刑となる」と答える確率
Pr
[
b
∣
A
]
{\displaystyle \Pr[b\mid A]}
に依存して値が変わる。
もしAが確率
Pr
[
b
∣
A
]
{\displaystyle \Pr[b\mid A]}
に関して何ら情報を持たないなら、
Pr
[
b
∣
A
]
=
1
2
{\displaystyle \Pr[b\mid A]={1 \over 2}}
と仮定するのは自然である(最大エントロピー原理 )[ 3] 。この場合には、看守の返答後にAが恩赦になる確率
Pr
[
A
∣
b
]
{\displaystyle \Pr[A\mid b]}
は
1/3のままである。すなわち「恩赦の確率が1/2にあがった」という囚人Aが喜んだのは間違っている 事になる。
しかしAが
Pr
[
b
∣
A
]
{\displaystyle \Pr[b\mid A]}
に関する何らかの情報(例えば「看守はBを嫌っている」という情報)を持っている場合は、必ずしも
Pr
[
b
∣
A
]
=
1
2
{\displaystyle \Pr[b\mid A]={1 \over 2}}
とするのは自然ではない[ 3] 。
仮に
Pr
[
b
∣
A
]
=
1
{\displaystyle \Pr[b\mid A]=1}
であれば、
Pr
[
A
∣
b
]
=
1
2
{\displaystyle \Pr[A\mid b]={1 \over 2}}
となる為、囚人Aが喜んだのは正しい 事になる。
一方
Pr
[
b
∣
A
]
=
0
{\displaystyle \Pr[b\mid A]=0}
であれば
Pr
[
A
∣
b
]
=
0
{\displaystyle \Pr[A\mid b]=0}
より、看守の返答を聞いたことによりAが恩赦になる確率は0に下がってしまう 。
恩赦が等確率でない場合
上ではA、B、Cが恩赦を受ける確率はいずれも1/3である事を仮定し、
Pr
[
b
∣
A
]
=
1
2
{\displaystyle \Pr[b\mid A]={1 \over 2}}
なら囚人が喜んだのは間違っている事を見た。
しかし例えば、恩赦になる確率だけをそれぞれA=1/4、B=1/4、C=1/2に変えると、(
Pr
[
b
∣
A
]
=
1
2
{\displaystyle \Pr[b\mid A]={1 \over 2}}
であっても)看守が「Bは死刑になる」と答えることでAの恩赦確率は1/5とかえって低下してしまう[ 4] [ 5] 。
心理学の題材として
直感的・主観的に捉えて予想した確率と本当の確率[ 注釈 1] が一致しないのはなぜか、さらに、解答を説明されても即座に理解できなかったり、理解したつもりでも納得できないのはなぜか、という研究が認知心理学 の研究分野で行われた。
看守の返答を聞いた後Aが恩赦になる確率のアンケートを行ったある研究[ 注釈 2] では、回答者の76%が1/2、14%が1/3と解答している[ 5] 。しかし、確率は統計 に基づくことを説明するヒントを載せたところ、この比率は逆転した[ 5] 。
脚注
注釈
^ 計算による正しい解。
^ 対象:日本の文系大学生142人。
出典
^ Gardner, Martin (October 1959). “Mathematical Games: Problems involving questions of probability and ambiguity”. Scientific American 201 (4): 174-182. doi :10.1038/scientificamerican1059-174 .
^ Gardner, Martin (1959). “Mathematical Games: How three modern mathematicians disproved a celebrated conjecture of Leonhard Euler”. Scientific American 201 (5): 188. doi :10.1038/scientificamerican1159-181 .
^ a b c d Judea Pearl (1988/9/1). Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference . Morgan Kaufmann Series in Representation and Reasoning. Morgan Kaufmann. p. 61. ISBN 978-1558604797
^ 市川伸一 著、日本認知科学会 編 編『確率の理解を探る――3囚人問題とその周辺』共立出版〈認知科学モノグラフ 10〉、1998年5月。ISBN 4-320-02860-0 。
^ a b c 小林厚子 (1998年). “確率判断の認知心理(1) 、『東京成徳大学研究紀要』第5号 ” (pdf). 2017年11月10日閲覧。 p3-5
関連項目