ベイズ理論(長文)
2006/12/19 (火)
随分前になりますが、マイミクさんの日記で「モンティ・ホール・ジレンマ」と呼ばれる確率の問題が出題されていました。
モンティ・ホールという人が司会者を務める昔のアメリカのテレビ番組で、景品を隠したドアをゲストに選ばせる、というよくあるゲームなのですが、ルールはこんな感じです。
この問題は「ベイズの定理」(wikipedia での説明はこちら)という考え方で
P(A|X) = {P(X|A) P(A)} / {P(X)}
というような計算式を用いて解けるそうなのですが、文系アタマの私にとってはこの公式はややこしくて混乱してくるので、これを使わずに考えてみました。一応正解に辿り着くことが出来たようです。
でもマイミクさんの日記にはその後にもう1問ありました。
というようなものでした。これがどうも理解できなくて…。考えてみたい方のために、ちょっと空白を開けておきます。
------------
最初の問題の正解は、「選択を変えた方が倍有利である」です。私は↓こんな考え方で解きました。
それぞれのドアが当たりである確率は 1/3 ずつなので、
(1) 最初に選んだドアが当たりである確率…1/3
(2) 最初に選んだドアがハズレである確率…2/3
(1) の場合、選択を変えれば当たりの確率は 0%、変えなければ 100%
(2) の場合、選択を変えれば当たりの確率は 100%、変えなければ 0%
なので、当たりの確率は
(1) 最初の選択が当たりで、選択を変えない場合 … 1/3 × 1 = 1/3
(2) 最初の選択が当たりで、選択を変えた場合 … 1/3 × 0 = 0
(3) 最初の選択がハズレで、選択を変えない場合 … 2/3 × 0 = 0
(4) 最初の選択がハズレで、選択を変えた場合 … 2/3 × 1 = 2/3
というわけで、選択を変えなければ、当たりの確率は (1) + (3) = 1/3
選択を変えれば、当たりの確率は (2) + (4) = 2/3
------------
2番目の問題は、「選択を変えても変えなくても、当たりの確率は変わらない」というのが正解だそうです。これがどうも理解できなくて。理由は、ゲストの選んでいない2つの扉のうち、ハズレの扉が開いたのは偶然なので、残りの扉が当たりである確率には影響を与えない、というようなものでした。
でも地震があったとき、ゲストの選んだドアや当たりの隠れたドアが開いてしまったり、または全部のドアがあいてしまうような可能性もあるわけで、その場合はゲームは最初からやり直しになっていたでしょう。今回はたまたまではあっても、ゲストの選んでないハズレのドアがあいたワケですから、ゲーム続行が可能である状況になって続行を決めた時点で、結果は1問目と同じになるようにしか思えないのです。

どうして今更こんなことを書こうという気になったかというと…最近旦那が↓こんな本を図書館から借りてきたからです。
友野典男『行動経済学 / 経済は「感情」で動いている』
そのなかに、こんな問題がありました。
答えは
1)… 1/3
2)… 1/2
3)… 1/2
とのことでした。
この問題について詳しい解説が無かったので憶測ですが、1と2は割に簡単に理解できるのです。
1)の場合は、子供の性別が上から 女女、女男、男女、男男 である確率がそれぞれ 1/4 ずつですが、奥さんの言葉によって最後の可能性が否定されたので、女女、女男、男女 である確率がそれぞれ 1/3 ずつになった、というコトですよね。
2)の場合は、奥さんの言葉によって、女女、女男 という可能性だけが残されたので 1/2 に。
問題は 3)の場合です。1)のように「女の子が少なくとも一人は居る」という情報を耳にすることと、実際女の子を1人目撃することとの違いは何だろう…と結構悩んだのですが、女の子を1人目撃した場合、それが姉だろうが妹だろうが、2)の場合と同様に、具体的にどちらか片方を女の子と限定しているのに対して、1)の場合は「女の子が居る」という情報だけなので、奥さんのアタマの中にどちらの子が、或いは両方が浮かんでいるのかどうか判らない。そこが違いなのでしょうか。でもあまりスッキリしません。
3)は
(1) 目撃したのが上の子である確率 … 1/2
(2) 目撃したのが下の子である確率 … 1/2
(1) の場合、下の子が男の子である確率 … 1/2 … (3)
(1) の場合、下の子が女の子である確率 … 1/2 … (4)
(2) の場合、上の子が男の子である確率 … 1/2 … (5)
(2) の場合、上の子が女の子である確率 … 1/2 … (6)
なので、結局もう一人が男の子である確率は
(1)×(3) + (2)×(5) = 1/4 + 1/4 = 1/2
という風に考えるのでしょうか…。

この本では、ベイズ・ルールを説明するためにもう一つ面白い問題が載っていました。
というものです。うっかり「99%」と答えてしまいそうですが、そうではありません。
例えばここに 1,000,000人の人が居たとします。
● 実際に感染症にかかっている人は、0.01% にあたる 100 人です。
● 1,000,000人全員が検査を受けたとして、陽性と出るのは
感染者 100人のうち、正しく陽性と診断される 99% にあたる 99人 と
非感染者 999,900人のうち、間違って陽性と診断される 1% にあたる 9,999 人
を足した数です。
というわけで、あなたが実際に感染している確率は
陽性と診断された実際の感染者の数(99人)/ 陽性と診断された人の数(99+9999人)
= 99/(99+9999) = 0.00980… 約 1% 未満
ということになります。ちょっと意外な感じがしません? 感染症にかかる確率自体が非常に低ければ、検査の信頼性が高くても、間違って陽性と判断されている場合の数がグっと増えるので、実際に感染している確率はとても低くなるのです。
ちなみにこの本では、「ベイズ・ルール」は以下のように説明されています。
「モンティ・ホール・ジレンマ」の2番目の問題も、ベイズの定理の難しい式を使わずに、文系アタマでも理解できるよう、言葉でかみ砕いて説明してくれるひとを歓迎します。どなたか是非〜。
モンティ・ホールという人が司会者を務める昔のアメリカのテレビ番組で、景品を隠したドアをゲストに選ばせる、というよくあるゲームなのですが、ルールはこんな感じです。
●ゲストは3つのドアを見せられる
●3つのドアのうち1つのドアの後ろにだけ景品があり、見事それを選べば景品が貰える
●残りの2つのドアはハズレ
●司会者はどのドアの後ろに景品があるか知っているが、ゲストは勿論知らない。
という条件のもと…
●ゲストはまず、これだと思うドアをひとつ選択する
●司会者はゲストの選ばなかった2つのドアのうち、ハズレのドアを1つ開けてみせる
●ゲストは、最初の選択のままでいくか、もう1つの閉じているドアに変更するかを選ぶことが出来る
------------
この場合、ゲストは最初の自分の選択を変えた方が有利だろうか、あるいは変えない方が有利だろうか?
この問題は「ベイズの定理」(wikipedia での説明はこちら)という考え方で
P(A|X) = {P(X|A) P(A)} / {P(X)}
というような計算式を用いて解けるそうなのですが、文系アタマの私にとってはこの公式はややこしくて混乱してくるので、これを使わずに考えてみました。一応正解に辿り着くことが出来たようです。
でもマイミクさんの日記にはその後にもう1問ありました。
ゲストが最初のドアを選んだ後、地震が起こって、たまたまゲストの選んでいない2つのドアのうち景品のないほうのドアが開いてしまった。司会者は、結果は同じになったのだから、とゲームを続行することにした。
この場合はゲストは選択変えるべきだろうか?
というようなものでした。これがどうも理解できなくて…。考えてみたい方のために、ちょっと空白を開けておきます。
------------
最初の問題の正解は、「選択を変えた方が倍有利である」です。私は↓こんな考え方で解きました。
それぞれのドアが当たりである確率は 1/3 ずつなので、
(1) 最初に選んだドアが当たりである確率…1/3
(2) 最初に選んだドアがハズレである確率…2/3
(1) の場合、選択を変えれば当たりの確率は 0%、変えなければ 100%
(2) の場合、選択を変えれば当たりの確率は 100%、変えなければ 0%
なので、当たりの確率は
(1) 最初の選択が当たりで、選択を変えない場合 … 1/3 × 1 = 1/3
(2) 最初の選択が当たりで、選択を変えた場合 … 1/3 × 0 = 0
(3) 最初の選択がハズレで、選択を変えない場合 … 2/3 × 0 = 0
(4) 最初の選択がハズレで、選択を変えた場合 … 2/3 × 1 = 2/3
というわけで、選択を変えなければ、当たりの確率は (1) + (3) = 1/3
選択を変えれば、当たりの確率は (2) + (4) = 2/3
------------
2番目の問題は、「選択を変えても変えなくても、当たりの確率は変わらない」というのが正解だそうです。これがどうも理解できなくて。理由は、ゲストの選んでいない2つの扉のうち、ハズレの扉が開いたのは偶然なので、残りの扉が当たりである確率には影響を与えない、というようなものでした。
でも地震があったとき、ゲストの選んだドアや当たりの隠れたドアが開いてしまったり、または全部のドアがあいてしまうような可能性もあるわけで、その場合はゲームは最初からやり直しになっていたでしょう。今回はたまたまではあっても、ゲストの選んでないハズレのドアがあいたワケですから、ゲーム続行が可能である状況になって続行を決めた時点で、結果は1問目と同じになるようにしか思えないのです。

どうして今更こんなことを書こうという気になったかというと…最近旦那が↓こんな本を図書館から借りてきたからです。
友野典男『行動経済学 / 経済は「感情」で動いている』
そのなかに、こんな問題がありました。
隣家に新しく一家が引っ越してきた。子供が2人いることはわかっているが、男の子なのか女の子なのかはわからない。
1)隣の奥さんに「女の子はいますか」と聞いたところ、答えは「はい」であった。
もう1人も女の子である確率はいくらか?
2)隣の奥さんに「上の子は女の子ですか」と聞いたところ、答えは「はい」であった。
もう1人も女の子である確率はいくらか?
3)隣の奥さんが女の子を1人連れて歩いているのを見た。
もう1人の子供も女の子である確率はいくらか?
答えは
1)… 1/3
2)… 1/2
3)… 1/2
とのことでした。
この問題について詳しい解説が無かったので憶測ですが、1と2は割に簡単に理解できるのです。
1)の場合は、子供の性別が上から 女女、女男、男女、男男 である確率がそれぞれ 1/4 ずつですが、奥さんの言葉によって最後の可能性が否定されたので、女女、女男、男女 である確率がそれぞれ 1/3 ずつになった、というコトですよね。
2)の場合は、奥さんの言葉によって、女女、女男 という可能性だけが残されたので 1/2 に。
問題は 3)の場合です。1)のように「女の子が少なくとも一人は居る」という情報を耳にすることと、実際女の子を1人目撃することとの違いは何だろう…と結構悩んだのですが、女の子を1人目撃した場合、それが姉だろうが妹だろうが、2)の場合と同様に、具体的にどちらか片方を女の子と限定しているのに対して、1)の場合は「女の子が居る」という情報だけなので、奥さんのアタマの中にどちらの子が、或いは両方が浮かんでいるのかどうか判らない。そこが違いなのでしょうか。でもあまりスッキリしません。
3)は
(1) 目撃したのが上の子である確率 … 1/2
(2) 目撃したのが下の子である確率 … 1/2
(1) の場合、下の子が男の子である確率 … 1/2 … (3)
(1) の場合、下の子が女の子である確率 … 1/2 … (4)
(2) の場合、上の子が男の子である確率 … 1/2 … (5)
(2) の場合、上の子が女の子である確率 … 1/2 … (6)
なので、結局もう一人が男の子である確率は
(1)×(3) + (2)×(5) = 1/4 + 1/4 = 1/2
という風に考えるのでしょうか…。

この本では、ベイズ・ルールを説明するためにもう一つ面白い問題が載っていました。
ある致命的な感染症にかかる確率は1万分の1(0.01%)である。あなたがこの感染症にかかっているかどうか検査を受けたところ結果は陽性であった。この検査の信頼性は99%である。実際にこの感染症にかかっている確率はどの程度だろうか?
というものです。うっかり「99%」と答えてしまいそうですが、そうではありません。
例えばここに 1,000,000人の人が居たとします。
● 実際に感染症にかかっている人は、0.01% にあたる 100 人です。
● 1,000,000人全員が検査を受けたとして、陽性と出るのは
感染者 100人のうち、正しく陽性と診断される 99% にあたる 99人 と
非感染者 999,900人のうち、間違って陽性と診断される 1% にあたる 9,999 人
を足した数です。
というわけで、あなたが実際に感染している確率は
陽性と診断された実際の感染者の数(99人)/ 陽性と診断された人の数(99+9999人)
= 99/(99+9999) = 0.00980… 約 1% 未満
ということになります。ちょっと意外な感じがしません? 感染症にかかる確率自体が非常に低ければ、検査の信頼性が高くても、間違って陽性と判断されている場合の数がグっと増えるので、実際に感染している確率はとても低くなるのです。
ちなみにこの本では、「ベイズ・ルール」は以下のように説明されています。
生起確率に関する事前の情報(この場合は感染率)がある時に、ある新しい情報(検査の信頼性)が得られた場合には、事態の生じる確率をどのように更新したら合理的なのかを示している
「モンティ・ホール・ジレンマ」の2番目の問題も、ベイズの定理の難しい式を使わずに、文系アタマでも理解できるよう、言葉でかみ砕いて説明してくれるひとを歓迎します。どなたか是非〜。
「場のルールによって与えられたもともとの選択肢」に「すでに起こってしまった出来事についての情報」を加味して、確率を選択肢ごとに書き下して足しこめばいいわけです。
1番目と2番目の問題の間の決定的な違いは、「扉を開けた存在(司会者 or 地震)がルールに準じていたか否か」です。
参加者が扉Aを選び、扉Bが開いたという事象だけを見ても、参加者にとってはまったく異なる意味合いを持っているわけです。
ご存知の通り、1番目は観測によって情報が増えるのですが、2番目は増えたことにならないのです。
このような問題を考えるとき、地震によって当たりの扉が開いたり、全部開いてしまう可能性だって「あった」と考えては問題が終わりません。
結果から出発して、その結果が情報を与えていたかどうかという考察を重ねるのが正解です。
事象だけ見ればまったく同じことなのですが、その意味は観察者側に委ねられているという意味で、こういった問題は数学に観察者の主観的な評価(信念)が絡んでくるという、直感的には受け入れがたい枠組みになっているのです。
こんきちさん、理系に行くべき人だったかもしれません。
ここまで1つの問題を長く真剣に考えることのできる才能は、理系に不可欠なものです。
1問目3問目、わたしゃ正解でしたが「直感」でした。
2問目の1は?
問題は「女の子がいますか?」で、おにいちゃんおねえちゃん
は聞いてないから男女も女男も
どっちでも一緒で、(男女,女男)か女女で1/2じゃないの?
不満。
前に「つるかめ算」も聞いたけど忘れちゃったなぁ。
勝手に紹介してしまってスミマセン。登場ありがとうございます。(^。^)
いやー、考えても結局結論に至らないのでは、やっぱり理系の才能はないんだと思います。
2番目の問題について、「地震の行動」自体がルールに準じていなかったのは明白ですが
たまたまその結果が司会者が選び得た行動と一致したために、司会者がゲーム続行を選択した訳で
その時点で地震の行動の結果はルールに引き戻され、「地震が扉Bを開いた」という事象が、
参加者にとって 1問目とまったく同じ意味合いを持つようになった、つまり情報が増えた、
という風に思えてしまうのです。
1問目の私の解き方がもし合っているのだとしたら
(1) 最初に選んだドアが当たりである確率…1/3
(2) 最初に選んだドアがハズレである確率…2/3
ここまでは一緒ですよね…? で、今は地震によって、ゲストが選んだ以外の、
残った2つのドアのうち1つが空いていてハズレと判っている状態なので、
(1) の場合、選択を変えれば当たりの確率は 0%、変えなければ 100%
(2) の場合、選択を変えれば当たりの確率は 100%、変えなければ 0%
この部分も同じになるように思えます。そうすると結果は1番と全く同じ…
もしこれが、地震によって景品の位置も変わってしまい、どのドアに後ろに入っているか
司会者にも判らなくなってしまった、というのなら 確率は 1/2 だと思うのですが。
「結果から出発して、その結果が情報を与えていたかどうかという考察を重ねる」
↑この考え方が文系組には不慣れでややこしいのですよね…
結果というのはこの場合、ゲストが選択を変えたかどうか、ということでしょうか。
きわめて文系的なギモンだと思うのですが、うちの旦那も全く同じ思考を辿っています。
このギモンを文系路線のままで上手く解決する方法はないでしょうかね〜。
≡★ ぎださん ★≡
うちの旦那も文系(経済学)ですけど、こういうのを考えるのは結構好きみたいですよん。
ま〜経済学は純粋な文系ではないかもしれないですが…
> おにいちゃんおねえちゃんは聞いてないから男女も女男もどっちでも一緒
うーん、これは違うような気がします。聞いて無くても 女女・女男・男女は
同様に確からしく起こりうると思うので…
見当外れを恐れずに理系式回答を文系式回答に翻訳するなら…
司会者の場合は『ゲストの選択を受けて』可能性をひとつ潰しているのに対して
地震の場合は『ゲストの選択に関係無く』結果的に可能性をひとつ潰しただけだ
という、その違い。だから地震が起きる前と後では変化は無いも同じ、という。
地震ではなく、仮に第二のゲストがいたとして、
第一のゲストが選択した後に第二のゲストが他のドアを選択した場合…
第一のゲストが選択したドアも、第二のゲストが選択したドアも、残ったドアも
当たる確率は等しく1/3なので、第二のゲストのドアがたとえ外れていようと
第一のゲストのドアも残りのドアも当たる確率は1/3のままだ
…という事なんじゃないでしょうか。地震はそれと同じなのでは??
ドアが開いて外れを視認してしまうから惑わされてしまうんだと思います。
とにかくは…
地震(第二ゲスト)による選択は、この場合『たまたま』外れてただけの話で
当たってた可能性もあるというのが、『絶対に外れしか開けない』司会者との違い
という事になるんだろうと思います。
たまたま似たような状況になっただけの話で、地震(第二ゲスト)と司会者は全然違う
役割になっているんだと思います。
プレイヤーが1つのドアを選んだのち、司会者が残りの99個のドアのうちはずれの98個のドアを開ける場合、司会者が開けなかったもう一つのドアに景品がある可能性は99/100、もともと選んでいたドアが当たりの可能性は1/100になりますよね。この場合、残りの99個のうち98個のハズレを司会者が教えてくれているわけですから当然ドアを替えたほうが有利なわけです。
一方プレイヤーが1つのドアを選んだのち、地震で残りの98個のドアが偶然に開いた場合は、「偶然」ドアが98個開いた結果全部ハズレだったわけですから、残りの1つのドアが当たりである確率も、最初に選んだドアが当たりである確率も同じですよね。
これをドアの数を減らして考えていくと、ドアの数が3個の時でも同じように考えられるから…って余計にわかりにくくなったような…(T(エ)T)
私、大学時代「理学部物理学科」を卒業しましたが、こういう確率論が大の苦手で、かなり苦労したのを覚えています。(量子力学とか統計力学とかはモロ確率論だから。)理系に進み、今でも分析化学系の仕事をしていますが、僕はおそらく文系人間だったのだと思います。
普段使わない頭をフル回転させたので頭が痛いです…。
起こりえても質問は「女の子はいますか?」だから
どちらの場合も一緒でしょ。日本語的には。
「おねーちゃんがいますか?」で「はい」で、
もう1人が女の子かどうか聞いているなら、
言ってることは分かるけど。。。
わかった!… ような気がする…
じっくりレス書きますので、ちょっとお待ち下さいね!
≡★ 池本さん ★≡
第2のゲストがいた場合、というのは判る気もするのですが
この場合は第2のゲストがもしも当たりのドアを選択したとしたら
司会者はその時点でゲームを中止したはず、という条件がつくので
混乱してしまうのです…以下くまちゃんへのレスに続く (笑)
≡★ くまちゃん ★≡
「偶然」ドアが98個あいた場合、と考えると、そんな場合が
いかに起こりにくいか実感がわきますね〜。
偶然空いたドアの中にもしも当たりのドアがあった場合は、
司会者はその時点でゲームを中止したのですよね。
でもそのことは関係ないんだ、ということに、ドアの数を
思いっきり増やすことで気づいたような気がします。
中止しなかったということが、司会者がドアを選んだということと
等しいのではなくて、只単に大もとの選択肢が減っただけなのだ、
ということですね。
おつきあい頂いてありがとうございました! >お2人様
≡★ ぎださん ★≡
「おねーちゃんがいますか?」が「はい」で、もう1人が女の子かどうか
聞いているなら、もう1人も女の子である確率 は 1/2 ですよね。
(↑それが2問目)
日本語的には 男女、女男 が一緒でも、確率で考える場合は
男×2、男女、女×2 とわけてしまうと、同様に確からしくなくなるので
都合が悪いです。
うまく説明できてませんね。(^_^; すいません。
私もこの本を今読んでいるところなので、お邪魔いたしました。
さてこの中にある「感染症問題」なのですが、どうもよくわからないのが、
「検査で陽性と判断されても実際に陽性であるのは0.098%でしかない」
検査を、なぜ
「信頼性99%」
と決めているのかということなのです。
これは「信頼性0.098%の検査」になぜならないんでしょう?
そう考えると、そもそも「信頼性99%」という結果がどのように導き出されたのかの説明が問題文に全くない以上、最初から確率の計算は不可能である(つまりパラメータが不足しているので答えは出せない)が正解にはならないんでしょうか?
確率の計算を人間が間違えているというより、単に「信頼性が高そうなイメージ」にだまされてるというだけのような気がするのです。それとも、「あたかも確率で計算しているように見せて実は異なる問題でも、人間は数字が出ていると騙されてしまう」という心理を説明している問題なのでしょうか?
子供の性別当ても、
「女の子がいますか?→はい」という情報の後「もう一人の子供」という言葉が突然出てくるのですが、
「もう一人」と指すからにはそれ以前に特定された誰かがいるはず……と考えるが普通だけれど、実はそうでなく「特定された誰か」はいない。(つまり「もう一人」というのが複数の可能性を指しているにもかかわらず、実は一人を指しているかのようなミスディレクションを生む)
だから答えが異なってくる……という理屈自体は何となくわかるのですが、そうするとこれは問題文が曖昧であることに原因があり、確率の問題というよりも言葉の曖昧さの問題になってしまうような気がして……。
厳密に全ての前提条件をきちんと説明した上でも、同じように人間は間違えると思うので、確かに確率計算において人間が咄嗟の判断を誤るというのはその通りだと思うのですが、上二つの問題はその事実を説明してはいないような気がしてしまうのですが……どうなんでしょうか(^^;。
いらっしゃいませ。初めまして (^。^)
私は思いっきり門外漢なので、自信を持って「こうです」と言えることは無いんですが、
「0.98%」という数字は、検査がどのくらいの確率で正しいか、ということのほかに
「この病気に感染する人の割合」という別のデータが絡んで出された数字で、
病気自体の感染力が弱いからといって、検査結果が正しく出る確率には影響がないものと思います。
確かに問題文の中には「信頼性」の定義はちゃんとしていませんよね。
私もこの雑記を書いたとき、グーグルかなにかで「感染症検査の信頼性」の定義を
調べてみたりしました。
結局ちゃんと定義しているサイトには行き当たりませんでしたが、著者の解説から
検査事例100件につき1件の割合で、実際とは逆の判断が下される
(本当はクロなのに陰性と判断、または本当はシロなのに陽性と判断)
という定義なのだと解釈しました。まあ後付けといえばそうなんですが。
実は私はこの本自体を読んでいなくて、うちのダンナが読んで面白いと思った問題を
ピックアップして私に出題してくれたので、その時にダンナに「信頼性ってどういうこと?」
と訪ねたら、ダンナも著者の意図を読み取って上のように「信頼性」の定義を私に説明しました。
私はその前提で考えたのに、ひっかかってしまいました。(^_^;
「検査の信頼性」という言葉の定義について専門知識がないので何とも言えないのですが、
これを「『信頼性0.98%の検査』である」としてしまうと、「検査の信頼性」というものに
対象となる病気の感染力がいつでも影響を与えてしまうことになるので、分けて考えた方が
都合が良いだろう、という気がします。
この検査は逆にいうと「1% は間違う」ということなので、「陽性」という診断結果は
99% の正解の中の一人か、1% の間違いの中の一人かどっちか、ということですが
この場合「1% の間違い」のほう数があまりにも多いので、感覚として理解しにくいのかな、
と思います。私もこうやって書いていても「ホンマかいな」という気になってきます (笑)
検査を受けなければ、この病気に感染している確率は 0.01% で、陽性と診断されれば
感染している確率は 0.98% 、つまり100倍近くにあがるということですね…多分。
1,000,000人 のうち、
●感染している人 … 100人
そのうち、●陽性と診断される人 … 99人
●陰性と診断される人 … 1人
●感染していない人 … 999,900人
そのうち、●陽性と診断される人 … 9,999人
●陰性と診断される人 … 989,901人
ということなので、逆に陰性と診断されたのに本当は感染している確率は
陰性と診断された感染者の数(1人)/ 陰性と診断された人の数(1+989,901人)
= 1 / 989,902 = 0.00000101020100..... 約 0.0001 %
と、べらぼうに低くなります…多分 (笑)
陽性と診断された人たちだけを集めて再検査をすると、10098人のうち、
●感染している人 … 99人
そのうち、●陽性と診断される人 … 98人
●陰性と診断される人 … 1人
●感染していない人 … 9,999人
そのうち、●陽性と診断される人 … 100人
●陰性と診断される人 … 9,899人
概算ですがこうなるので、感染している確率は
陽性と診断された感染者の数(98人)/ 陽性と診断された人の数(98+100人)
= 98 / 198 = 0.494949..... 約 50 %
となるのでしょうか…多分(←しつこい)
間違って診断されるケースに法則性があったりして、「同じケースは必ず間違う」
というのだと、この計算は意味がありませんが…ランダムに間違いが発生するなら
陽性のひとだけ集めて検査を重ねれば、陽性と診断されて本当に感染している確率は
どんどん高くなる…ような気がします。でも逆に、陰性と診断されたけれど実は
感染していた、という確率も上がってくるようですが。(この場合1/9900≒0.01%)
こういう計算のためにも、「検査の信頼性」は感染率とは分けて考えるべきなのでは?
−−−−−−−−−−−−−−−−−
子供の性別については、子供が2人であるという情報は掴んでいる、という設定なので
(1) の問題の場合は「特定された誰か」は居ないけれど少なくとも2人のうちのどちらかで、
「もうひとり」という言葉が指す対象も2人のうちどちらなのか不確定になりますね。
(2) の問題の場合は「上の子」と限定して質問しているので、「もうひとり」という
言葉が指す対象は下の子に限定されています。 (3) も同じく「目撃していない方」に
限定されます。
この違いによって、確率が変わってきているのだと思うのですが、どうでしょう?
(1) の場合は、「もうひとり」という言葉が指す対象が限定されていないわけですから
仰る通り複数の可能性が出てきますが、それは問題文が曖昧であるということにはならず
どのように不確定であるかが明白なので、記事で書いたような計算が可能なのだと思います。
−−−−−−−−−−−−−−−−−
以上が門外漢なりの私の考えでした。只、自信があるわけではないです (^_^;
スミマセン〜
うーん、やはり、もともと「検査の信頼性」自体が明確に定義されていない以上、感染症問題で「人間の確率計算をどれくらい間違えるか」をはかる妥当性に疑問を感じてしまいます……。
計算自体は正しいと思いますし、納得もできるのですが、やはり最初にその定義がない以上、これはミスディレクション(あるいは実験結果に影響するノイズ)だと言われた時に反論できないのではないでしょうか。
「陽性は必ず判定できるけど、あやまって陰性を間違えて陽性と判定する場合もある」「陰性なのは確実にわかるけど、陽性を見逃す可能性もある」ようなことは日常ではよくありますし、こういったものをイメージされたとすると「信頼性」の定義が変わってしまう(し、問題を聞いた時に回答者がどの定義をイメージしているのかコントロールできない)。
「それら全ての可能性を考慮して、均して計算すれば、信頼性=「検査事例100件につき1件の割合で、実際とは逆の判断が下されること」になるのだ」
ということでしょうか。
たとえば今の社会では、医学の分野で「検査の信頼性と言った場合これこれの計算式で出したものを指す」と明確に定義され、それが社会全体に周知されていると言えるのならいいのですが、そうとも思えませんし……。
となると、間違えたのは確率計算が不得手だからではなく、ただ定義付けが問題作成者と異なっていたから、ということになってしまわないでしょうか。
それとも、
「そういった定義づけを、空気を読んで、現実(あるいは問題作成者)と一致させることもまた、確率計算の能力のひとつで、そもそもそこがズレてしまうことも含めて、人間の判断が間違うことを実験で示している」
ということなのでしょうか……?
(あ、自分で書いていてこの最後の考えが一番著者の説に近いような気がしてきてしまった……(^^;)
ええと、誤解しないでいただきたいのですが、私は著者の説に基本的に賛成していますし、人間が厳密な前提を必要とする「確率」というものを咄嗟に扱うのはもともと不得手であろうと思っています。つまり、言いたいことはわかるし、それには賛成するのです。
しかし、この実験(問題)でその結論を導き出すのはちょっと恣意的ではないかな、と。
単純に、問題文に「信頼性とはこれこれの定義を指す」と入れておいてくれればスムーズに考えられますし、それでも同じくらいの誤答は出たと思います。
(私も間違えたと思います(笑) ちなみに私の場合は、そもそもこの問題、間違える以前に、何を問うているのかよくわかりませんでした(^^;)
長々とスミマセンでした(^^;。
定義がきちんとなされていないことは確かで、手落ちと言っていいでしょうね。
それに対する私の反応は「ちゃんと定義して欲しいなー」というところで終わりで
その裏に著者の別の意図があるようには感じませんでした。
問題文から「多分こういうことだろう」と自分で感じたことと、作者の意図が
結果的に同じだったからかもしれませんが。
これは確率に関する設問なので、実社会ではどうなのかということはさておき
数学の問題として、「信頼性とだけ言っておいて、特殊な法則なんかは特に明記してないから
多分こういうことだろう」という思考回路が働いたのだと思います。
そうやって「検査の信頼性」という言葉を著者の意図する定義でちゃんと読み取った上で
見事に引っかかってしまったので、私にとってはとても面白い問題でした。
> 間違えたのは確率計算が不得手だからではなく、ただ定義付けが問題作成者と異なっていたから
もちろんそういうケースも多いのでしょうね。
私がもしそうだったら、「なんだーそういう意味だったのかー」とちょっと憤慨して
「それだったらちゃんと定義づけしてくれればいいのに」と思って終わりだったでしょう。
受け取り方って面白いモノですね。