三門問題的概率定義缺陷:補充研究
Supplementary Study on Definitional Deficiencies in the Monty Hall Problem
——隨機性類型、比例與概率的本體論區分,及模擬論證的類型錯誤
Neo.K(許筌崴) EveMissLab 一言諾科技有限公司
摘要
本文作為「三門問題的敘述歧義分析」(Neo.K,前篇)之補充研究,聚焦於前篇尚未充分處理的三個根本性問題:(一)「概率」作為術語在三門問題中指涉的對象究竟屬於哪一種隨機性框架,至今未被原問題明確;(二)「比例」與「概率」在本體論層次上的不可互換性,導致電腦模擬的論證地位存在類型錯誤(type error);(三)在缺乏公理、定理、引理等正式數學結構的情況下,三門問題以「腦力遊戲」身份進入教育體系所造成的認知後果。
本文不裁決三門問題「應使用哪種概率定義」,因為原問題本身從未明確這一點,這本身就是缺陷所在。本文的目的是:將這個缺陷的精確輪廓呈現出來,供後續研究與教育實踐參考。
關鍵詞:隨機性類型學、頻率主義概率、貝葉斯概率、比例、類型錯誤、三門問題、公理缺失、認知影響
第一部分:前篇的定位與本文的補充範疇
1.1 前篇的貢獻邊界
前篇系統性地論證了三門問題在「敘述結構」層面的缺陷,包括視角混淆、信息結構不完整、隱含假設未被明示等問題,並提出了一個歧義測度框架,計算出標準版本保留約48.3%的殘留歧義。這些論證在其設定的分析框架內是自洽且有效的。
然而,前篇存在一個被明確指出的局部問題:在第三部分討論電腦模擬時,論文將「模擬結果驗證理論計算」的關係描述為隱含假設的問題,但未深入追究一個更根本的層次——模擬輸出的「頻率比例」與理論宣稱的「概率」,在本體論上是否屬於同一類事物,可以互相支持。
此外,前篇雖提及信息結構與決策依賴性,但未正面處理:三門問題的核心術語「probability(機率/概率)」本身究竟對應哪種隨機性定義,以及這種不確定性如何影響整個問題的論證有效性。
1.2 本文的補充範疇
本文補充以下三個互相關聯的問題域:
其一,隨機性的類型學:真隨機性、認識論隨機性、頻率比例三者的定義邊界,以及三門問題的情境實際落入哪個或哪些類別。
其二,比例與概率的本體論區分:為什麼這兩個概念不能互換,以及電腦模擬在這個區分下的論證地位。
其三,公理缺失的教育後果:一個缺乏正式數學基礎的問題如何以「標準答案」的形式進入教育體系,並產生系統性認知影響。
第二部分:隨機性的類型學——三門問題的歸屬問題
2.1 三種隨機性的定義
在討論三門問題使用的是哪種「概率」之前,必須先釐清「隨機性」這個基礎概念的類型學。學術上通常區分以下三個層次,但三門問題的標準討論從未明確指明使用的是哪一種:
定義 2.1(本體論隨機性,Ontological Randomness)
事件在物理層面缺乏確定的先因,結果在事件發生前不以任何形式存在於現實中。此類隨機性要求物理世界本身具有非決定論性質。量子力學的測量坍縮是目前學界認可的候選實例。其概率值描述的是物理實在的內在屬性,而非觀察者知識狀態的函數。
定義 2.2(認識論隨機性,Epistemic Randomness)
事件具有完整的決定論因果鏈,但觀察者由於信息不完整而無法預測結果。此類「隨機性」本質上是觀察者知識狀態的函數,而非物理世界的屬性。概率值描述的是觀察者在當前信息狀態下的不確定性程度。擲骰子、洗牌等日常情境均屬此類。
定義 2.3(頻率比例,Frequentist Proportion)
在大量重複試驗構成的集合中,某結果出現的相對頻率。這不是對「隨機性」的描述,而是對集合統計結構的描述。頻率比例作為概率的基礎,要求:(a)試驗可重複,(b)試驗之間相互獨立,(c)存在足夠大的樣本以使頻率穩定收斂。
2.2 三門問題情境的類型分析
對三門問題的各個組件逐一進行類型歸屬分析,結果如下:
2.2.1 車的初始放置
車在節目開始前被放置在某扇門後。這是一個物理事件,完成後即為確定事實。對節目製作方而言,車的位置是已知的確定量,不存在任何隨機性。
對參賽者而言,車的位置是未知的。這種不確定性來源於信息缺失,而非物理世界的非決定論性。因此,參賽者面對的是「認識論隨機性」,而非本體論隨機性。
重要推論:車在遊戲進行當下已位於某扇確定的門後。不存在「車有1/3的概率在門1後面」這樣的物理事實——只存在「我不知道車在哪裡,我的信念分配為1/3、1/3、1/3」這樣的認識論陳述。
2.2.2 主持人的開門行為
在參賽者初選非車門的情況下(佔2/3的情境),主持人的開門行為是完全決定論的——他別無選擇,只能開那扇唯一的山羊門。這裡沒有任何隨機性,既非本體論的,也非認識論的。
在參賽者初選車門的情況下(佔1/3的情境),主持人在兩扇山羊門中隨機選一扇開。如果「隨機」意指主持人自己也不能預測(例如擲硬幣決定),則這是認識論隨機性。如果主持人實際上有一個確定的偏好規則,只是參賽者不知道,則仍然是認識論隨機性。標準版問題對此未作區分。
2.2.3 參賽者的決策情境
這是最關鍵的類型歸屬問題。參賽者在某一個確定的時刻,面對兩扇仍然關閉的門,需要做出一次性決策。車已經在某扇門後,這是既成事實。
問題是:「換門後贏得汽車的概率為2/3」這個陳述,對當下的參賽者意味著什麼?
若採用頻率主義解讀:此陳述描述的是「在大量相同情境的重複試驗中,採用換門策略的參賽者中有2/3贏得汽車」。這對當下的單次決策者沒有直接的概率意義——他只會遇到這個情境一次,結果要麼贏要麼輸,不存在「0.67次贏」。
若採用貝葉斯(主觀概率)解讀:此陳述描述的是「給定已知信息,理性信念應將2/3的主觀概率賦予『換門後贏』這個命題」。這對單次決策者有直接意義,但依賴於完整定義的信念空間與更新規則。
標準的三門問題論證從未明確採用哪種解讀,卻在兩者之間隱性切換,用頻率主義的模擬結果支持貝葉斯主義的決策建議。
2.3 未定義的隨機性類型構成定義缺陷
命題 2.1(隨機性類型的未定義性)
三門問題的原始敘述及現代標準版均未明確指定其使用的隨機性框架。在頻率主義框架下,「2/3」是集合層次的比例陳述;在貝葉斯框架下,「2/3」是單次決策者的信念更新結果。兩種框架在技術上可以導出相同的數值,但其本體論地位、適用條件和認識論意涵根本不同。未明確此區分,是問題敘述的第一重根本性缺陷。
第三部分:比例與概率的本體論區分——電腦模擬的類型錯誤
3.1 比例不等於概率
這是前篇模擬分析部分需要進一步澄清的核心問題。電腦模擬被廣泛用來「驗證」三門問題的2/3答案,但這種驗證存在一個根本性的論證缺陷。
定義 3.1(統計比例)
在有限樣本 n 次試驗中,結果 A 出現 k 次,則比例為 p̂ = k/n。這是一個描述性統計量,屬於已觀測集合的屬性,不對任何單次未來事件作出概率宣稱。
定義 3.2(Kolmogorov 公理下的概率)
概率是定義在樣本空間 Ω 上的測度函數 P: F → [0,1],滿足:(a)非負性 P(A) ≥ 0;(b)規範性 P(Ω) = 1;(c)可列可加性。此定義對概率的解釋(頻率主義或貝葉斯主義)保持中立,但要求基礎樣本空間與事件代數被完整定義。
關鍵區分在於:比例是對已發生樣本集合的描述,是回顧性的(retrospective)。概率是對未發生事件的信念或測度,是前瞻性的(prospective)。兩者在數值上可能相同,但其本體論地位完全不同。
3.2 電腦模擬的論證地位
一個典型的三門問題模擬程式執行以下操作:重複 n 次試驗,在每次試驗中模擬車的放置、參賽者的選擇、主持人的開門行為,以及換門策略的結果,最後計算換門策略的勝利次數除以總試驗次數。
模擬的輸出是:在 n 次試驗的集合中,採用換門策略的比例約為 2/3。
命題 3.1(模擬的類型錯誤)
電腦模擬產生的是頻率比例(定義3.1),但三門問題的標準答案宣稱的是單次決策者的概率(定義3.2)。將前者作為後者的論證支持,在論證類型上構成錯誤(type error):兩者屬於不同的本體論類別,不能互相直接支持。
更精確地說,模擬程式實際驗證的條件命題是:「若在大量重複試驗中,每次試驗均滿足完整假設集合 A_sim(包括等機率車位、知情主持人、必開山羊門等),則採用換門策略的頻率比例收斂於2/3。」
這是一個有效的統計事實,但它在邏輯上不能直接推導至:「在當下這一次試驗中,換門策略的(貝葉斯或頻率主義)概率為2/3。」
3.3 模擬與理論一致的真正意義
模擬與理論計算的一致性,實際上驗證的是:「在完整假設集合 A_sim 下,貝葉斯計算與頻率比例給出相同的數值。」這是一個元層次的一致性事實,並非對問題本身無歧義性的驗證。
換言之,模擬結果說的是:「如果世界是這樣運作的,那麼這個計算是對的。」它無法說:「世界確實是這樣運作的,而且這個計算描述的就是你現在面對的情境。」
命題 3.2(模擬論證的條件性)
電腦模擬對三門問題的「驗證」是高度條件性的:它在一個已完整預設所有關鍵假設的封閉系統中運行,並在該系統內部輸出與理論一致的頻率比例。這不構成對理論在開放現實情境中的有效性的論證,也不構成對問題敘述本身清晰性的佐證。
第四部分:公理缺失——一個腦力遊戲如何影響教育與認知
4.1 三門問題缺乏的正式數學結構
數學中的嚴格命題系統通常包含以下層次:公理(Axioms)作為不加證明的基礎前提;定義(Definitions)作為術語的精確邊界;引理(Lemmas)作為輔助性中間結論;定理(Theorems)作為主要結論;推論(Corollaries)作為定理的直接後果。
三門問題的答案「2/3」被廣泛接受為「數學真理」,但它從未被嵌入任何這樣的正式結構中。沒有公理系統明確宣告「本問題中的概率」指的是什麼;沒有定義明確區分問題中涉及的隨機性類型;沒有引理支撐關鍵的條件概率計算中的隱含步驟;沒有定理正式陳述並嚴格證明結論的充分必要條件。
命題 4.1(正式結構缺失命題)
三門問題作為一個被廣泛引用的「條件概率範例」,至今缺乏以下正式數學結構:(a)概率空間的完整公理化定義;(b)「隨機」一詞在問題各組件中的統一定義;(c)從問題情境到概率空間的嚴格映射定理;(d)結論有效性的充分必要條件定理。這一缺失不影響在特定假設下的計算正確性,但影響問題作為數學教育素材的嚴謹性。
4.2 以「腦力遊戲」身份進入教育的後果
三門問題之所以缺乏上述正式結構,部分原因在於它最初以「益智謎題」(puzzle)的形式出現在大眾媒體(Parade雜誌),而非學術期刊的定理陳述。這種起源身份在其進入教育體系的過程中留下了結構性印記。
問題以「看似簡單但答案反直覺」的特性被教育者選用,主要服務於引發認知衝突的教學目的,而非作為嚴格數學推理的訓練材料。這導致教育實踐中出現以下模式:
第一,答案先於定義被傳授。學生在理解「概率」指什麼之前,就被告知答案是「2/3」。這逆轉了數學教育應有的方向。
第二,模擬被作為「直觀理解」的替代品,而非嚴格論證的補充。學生「親眼看到」頻率比例趨近2/3,便認為「理解了」,但實際上跳過了從頻率比例到概率的關鍵概念橋樑。
第三,反直覺性被視為教學亮點,而非問題結構需要修正的信號。問題的認知衝擊力被保留,問題的定義缺陷被忽略。
4.3 認知後果的系統性描述
命題 4.2(認知後果命題)
在缺乏正式數學結構的情況下,三門問題的教育使用至少產生以下三種系統性認知後果:(a)概念混淆:學習者無法區分比例、頻率概率、貝葉斯概率三個層次的概念,傾向於將三者混同;(b)權威依賴:由於無法從定義出發獨立推導,學習者傾向於以「專家共識」或「電腦模擬」作為信念基礎,而非邏輯論證;(c)條件盲目:學習者接受無條件化的結論(「應該換門」),而非條件命題(「在假設 A 成立的前提下,換門策略具有更高的期望收益」)。
這三種後果的累積效應,使得三門問題成為一個「製造偽理解」的教育工具——學習者記住了答案,相信自己理解了,但無法應對假設變化的情境,也無法識別問題的定義缺陷。
第五部分:補充概念清單與核心命題整合
5.1 需要先對齊的概念清單
以下概念是三門問題的完整分析所必需,但在原問題及大多數標準解釋中缺席或未被充分定義:
概念清單 A:隨機性層次
A1. 本體論隨機性(真隨機性):結果在發生前物理上不確定。 A2. 認識論隨機性(主觀不確定性):結果物理上確定,但觀察者信息不完整。 A3. 頻率比例:集合層次的統計描述,非單次事件的概率陳述。 區分問題:三門問題中車的位置屬於 A2,非 A1;標準模擬產生 A3,非直接的 A2 量。
概念清單 B:概率的定義框架
B1. 頻率主義概率(Frequentist Probability):極限頻率,要求可重複性與獨立性。 B2. 貝葉斯概率(Bayesian Probability / Subjective Probability):信念度量,適用於單次事件,依賴先驗與似然函數。 B3. Kolmogorov 公理概率(Axiomatic Probability):測度論框架,對解釋中立,但要求樣本空間被完整定義。 問題:三門問題的標準論證在 B1(模擬)與 B2(決策建議)之間未加說明地切換。
概念清單 C:決策論層次
C1. 期望效用最大化(Expected Utility Maximization):決策論命題,描述理性行為者的選擇準則。 C2. 概率命題(Probabilistic Proposition):描述事件發生的可能性量,與決策論命題屬不同層次。 C3. 決策確定性 vs 結果概率性:在完整信息下,換門是確定性決策(機率1);換門後贏是概率性結果(機率2/3)。這兩個量的混淆構成範疇錯誤。
概念清單 D:論證有效性條件
D1. 充分條件:標準假設集合 A_required 全部成立時,換門勝率為 2/3 是有效結論。 D2. 必要條件:至少需要「主持人知情且必開山羊門」與「參賽者完全知曉並相信此規則」兩個條件,結論才成立。 D3. 條件命題的完整形式:「若 D2 中的必要條件成立,且 A_required 中所有假設成立,則換門策略的(貝葉斯)概率為 2/3。」
5.2 補充論文的核心命題
以下是本補充研究的核心命題,可直接整合進原論文作為新增節次:
核心命題 I(隨機性類型未定義命題)
三門問題的原始版本及現代標準版均未明確其核心術語「probability/概率/機率」所指涉的隨機性類型。在本體論層次,三門問題涉及的不確定性屬於認識論隨機性,而非真隨機性。這一區分對決策論分析至關重要:貝葉斯概率適用於認識論隨機性情境,頻率主義概率原則上要求可重複試驗,而單次遊戲情境不滿足此要求。
核心命題 II(模擬類型錯誤命題)
電腦模擬三門問題所產生的「2/3」是統計頻率比例,而非對單次決策者有直接意義的概率量。將模擬結果作為理論答案的「驗證」,構成從集合層次描述(比例)到個體層次宣稱(概率)的論證類型錯誤。模擬的有效論證形式應為:「在假設 A_sim 完整成立的條件下,大規模重複採用換門策略的相對頻率收斂於 2/3」,而非「換門的概率為 2/3」。
核心命題 III(公理缺失的教育影響命題)
三門問題以「益智謎題」而非「數學定理」的形式進入教育體系,導致其核心術語未被公理化定義,其結論未被嵌入嚴格的充分必要條件框架。這一結構性缺失使得教育使用中大規模出現「偽理解」:學習者記住無條件化的答案,但無法應對假設變化,無法識別定義缺陷,也無法區分決策論命題與概率命題。三門問題對教育的實質影響不容低估,其根源在於正式數學結構的缺席。
核心命題 IV(立場中立的定義缺陷命題)
本研究不裁決三門問題「應採用頻率主義還是貝葉斯主義概率解釋」,因為原問題本身從未明確這一點。不明確本身即是缺陷。在頻率主義框架下,答案需要附加「大量重複試驗」的條件;在貝葉斯框架下,答案需要完整定義先驗信念空間與更新規則。兩種框架在充分定義的條件下均可導出 2/3 的數值,但其論證結構、適用範圍與認識論意涵根本不同。要求問題明確其使用的框架,是最低限度的定義誠實性要求。
第六部分:建議的補充結構
6.1 對原論文的修訂建議
基於本補充研究的分析,建議在原論文中進行以下修訂,不改變原論文的核心立場,僅強化其論證基礎:
修訂一:在第二部分(敘述結構形式化分析)之前增加「第零部分:術語的本體論定位」,明確界定本文分析所使用的概率框架,並指出原問題未提供此定位是問題的前置缺陷。
修訂二:在第三部分(電腦模擬分析)中,將「隱含假設集合」的論點升級為「類型錯誤論點」,明確指出模擬輸出(頻率比例)與理論宣稱(概率)的本體論層次差異,這比「隱含假設被預設」的說法更為精確。
修訂三:在第四部分(爭議根源分析)中增加「隨機性類型混淆」作為爭議的第四根源,補充前篇的視角混淆、信息結構缺陷、知識傳播失真三個根源。
6.2 三門問題完整分析的理想結構
若將原論文與本補充研究整合,三門問題的完整學術分析應包含以下六個層次,以確保邏輯上沒有跳躍:
層次一,術語定義層:明確「概率」「隨機」「條件」等核心術語在本問題中的操作定義,指定使用的概率框架。
層次二,本體論定位層:分析問題各組件的隨機性類型,確認情境屬於認識論隨機性,適用貝葉斯更新。
層次三,信息結構層:完整定義所有參與方的信息集合及其包含關係(原論文第二部分)。
層次四,敘述結構層:分析視角混淆、隱含假設等語言層面的缺陷(原論文核心貢獻)。
層次五,論證結構層:在充分定義的條件下,完成嚴格的貝葉斯推導,得出條件命題形式的結論。
層次六,教育與認知層:分析這些缺陷如何在傳播與教育中產生系統性影響(原論文第四部分)。
第七部分:框架轉換的合法性條件
前六部分完成了對三門問題的批判性分析,但批判本身不構成完整的學術貢獻。本部分試圖在批判的基礎上提出一個建構性框架:何種條件下,從一個概率框架的結果推導到另一個概率框架的結論是合法的? 我們稱這類推導為框架轉換(framework transition),並主張任何在無條件下執行框架轉換的論證,在嚴格意義上構成論證鏈中的未驗證跳躍。
我們不在此提出統一的概率本體論——那是更大的工作。本部分的目標較為有限:整理既有的、在概率哲學文獻中已被嚴格證明的「橋樑定理」,將它們組織為一份轉換許可表,並用此表對三門問題的標準論證進行橋樑審計(bridge audit),指出其在哪些位置跨越了未付通行費的橋樑。
7.1 框架轉換的形式問題
定義 7.1(概率框架) 設 𝓕 = {F_freq, F_Bayes, F_Kol} 為三個基礎概率框架:
- F_freq:頻率主義框架,概率為極限相對頻率
- F_Bayes:貝葉斯框架,概率為理性信念度量
- F_Kol:Kolmogorov 公理框架,概率為樣本空間上的測度,對解釋中立
定義 7.2(框架轉換) 設 P_i 為框架 F_i 中的命題,P_j 為框架 F_j 中的命題。一個從 P_i 推導出 P_j 的論證稱為從 F_i 到 F_j 的框架轉換。當 i = j 時稱為框架內推理;當 i ≠ j 時稱為跨框架推理。
命題 7.1(跨框架推理的非普遍合法性) 跨框架推理不是普遍合法的。其合法性需要由特定的橋樑定理(bridge theorem)所擔保。在無相應橋樑定理支撐的情況下,任何跨框架推理都應被視為論證鏈中的未驗證跳躍。
這個命題在概率哲學文獻中是常識(Hájek 2012, Gillies 2000),但在應用層面,特別是在教育與科普的論證中,它持續被忽略。三門問題是這種忽略的典型案例。
7.2 三座古典橋樑
我們整理三座最重要的古典橋樑,它們連接不同的概率框架。
橋樑一:de Finetti 表示定理(1937)
從頻率主義的集合層次描述,推導到貝葉斯的單次信念,需要經過 de Finetti 橋樑。
設 X₁, X₂, X₃, ... 為一個無限隨機變量序列。若該序列可交換(exchangeable)——即任意有限子序列的聯合分布在置換下不變——則存在一個概率測度 μ,使得序列的聯合分布可以表示為以 μ 為先驗的條件分布的混合。
通行費:可交換性必須被驗證或合理假設。可交換性的核心是「個體之間沒有可區分的本體論差異」,這在許多現實情境下不成立。
橋樑二:Cox 定理(1946)
從定性的可信度排序,推導到定量的貝葉斯概率,需要經過 Cox 橋樑。
Cox 證明:若可信度測度滿足(a)連續性(b)一致性(c)在邏輯運算下保持結構性質,則此測度同構於概率測度,且必然滿足貝葉斯更新規則。
通行費:三條公理必須被明確接受。Jaynes(2003)將這條橋樑視為貝葉斯主義的基礎,但反對者指出這些公理本身並非無爭議。
橋樑三:大數法則
從個體事件的概率,推導到大量重複試驗的頻率收斂,需要經過大數法則。
弱大數法則:設 X₁, ..., X_n 為獨立同分布隨機變量,期望為 μ,則樣本平均依概率收斂於 μ。強大數法則(Kolmogorov)在更強的條件下給出幾乎處處收斂。
通行費:獨立同分布(iid)條件必須成立。在試驗之間存在依賴或分布隨時間漂移的情境下,大數法則不適用,或需要更精細的版本(如鞅收斂定理)。
橋樑四:Bernstein–von Mises 定理
從貝葉斯後驗,推導到頻率主義的最大似然估計收斂,需要經過 Bernstein–von Mises 橋樑。
在足夠大的樣本量、可識別性、與正則性條件下,貝葉斯後驗分布漸近收斂於以 MLE 為中心的高斯分布。
通行費:大樣本、可識別性、正則性。在小樣本或非正則模型中,此橋樑失效。
7.3 轉換許可表
將上述橋樑整理為許可表,作為概率論證有效性審計的工具:
從
到
橋樑
通行費
失效情境
F_freq(集合)
F_Bayes(單次)
de Finetti
可交換性
個體攜帶不可化約差異
F_Bayes(主觀)
F_freq(經驗)
大數法則
獨立同分布
試驗依賴或分布漂移
定性可信度
F_Bayes(數值)
Cox
連續性+一致性+結構保持
公理被拒絕或不適用
F_Bayes(後驗)
F_freq(MLE)
Bernstein–von Mises
大樣本+正則性
小樣本或非正則模型
F_Bayes(後驗)
行為建議
期望效用最大化
效用函數已定義
效用未定義或非單期
單一計算
普遍建議
主體可互換性
個體狀態均質性
個體攜帶差異化信息
最後兩列(從後驗到行為、從個體到普遍)嚴格說來不是概率框架內部的轉換,而是從概率到決策論、從個體到群體的轉換。我們將其納入此表,因為它們在實際論證中常與概率轉換混合出現,構成同一類論證有效性問題。
7.4 三門問題標準論證的橋樑審計
我們現在用此表對三門問題的標準論證進行逐橋審計。標準論證的結構如下:
步驟 S1:電腦模擬 n 次試驗,輸出換門策略的勝利比例約為 2/3。 步驟 S2:理論計算貝葉斯後驗 P(C = d₂ | H = d₃, P = d₁) = 2/3。 步驟 S3:結論「換門的概率為 2/3」。 步驟 S4:行為建議「你應該換門」。
審計 A1:S1 → S3 的橋樑
從模擬輸出的頻率比例,推導到單次決策者的概率宣稱,跨越了 de Finetti 橋樑。
通行費狀態:未付費。模擬中的 n 次試驗之間滿足 iid(因為由相同的隨機數生成器產生),但模擬試驗集合與當下這一次真實遊戲實例之間的可交換性從未被驗證。對於一個正在參與遊戲的真實參賽者,他不會重複進行同一場遊戲——這是一次性的、不可重複的本體論事件。模擬試驗作為其「參考類」(reference class)的合法性,需要獨立論證。
未付費的代價:標準論證實際上隱含地假設了 Reichenbach 意義上的參考類問題已被解決,但從未明確處理它。
審計 A2:S2 → S3 的橋樑
從貝葉斯計算結果,推導到「概率為 2/3」這個宣稱,看似是框架內推理,實際上隱含了一個跨框架轉換:它假設了 Cox 公理使得貝葉斯框架成為概率分析的「標準」框架。
通行費狀態:部分付費。Cox 定理確實在 Jaynes 學派內部被廣泛接受,但在三門問題的標準教學中,Cox 公理從未被明確陳述。學生被告知「貝葉斯計算給出 2/3」,而非「在接受 Cox 公理的前提下,貝葉斯框架是描述此情境的合理框架,其計算給出 2/3」。
未付費的代價:結論被呈現為框架中立的數學真理,而非框架條件性的計算結果。
審計 A3:S3 → S4 的橋樑
從概率計算結果,推導到行為建議,跨越了期望效用最大化橋樑。
通行費狀態:嚴重未付費。標準論證從未明確指定參賽者的效用函數,隱含假設了:(a)效用對汽車的線性,(b)風險中性,(c)單期最大化(無未來考慮)。對於一個風險規避型的參賽者(例如,在不換門時心理損失較小),最優策略可能不是無條件換門。
未付費的代價:概率最優與決策最優被等同視之,但兩者只在特定的效用結構下重合。
審計 A4:單一計算 → 普遍建議的橋樑
從一個假想的「理性人」的計算,推導到對所有實際讀者的建議「你應該換門」,跨越了主體可互換性橋樑(此問題在補充研究 II 中已詳細展開)。
通行費狀態:完全未付費。每個真實讀者攜帶不同的信息集合、信念狀態與認知背景。標準論證將所有讀者強制映射為同一個「理性人」的副本,這個操作的合法性從未被論證。
未付費的代價:結論的普遍性被誇大,個體差異性被抹除。
7.5 審計結果與對第二篇主論點的補強
四次橋樑審計的結果是:三門問題的標準論證在四個位置上跨越了未付費的橋樑。其中橋樑 A1 與 A3 涉及概率與決策論的核心結構,A2 涉及框架選擇的元理論層次,A4 涉及論證對象的本體論假設。
需要強調的是:未付費並不意味著結論錯誤。在每一座橋樑的通行費都被合理假設成立的條件下,結論「換門的期望勝率為 2/3,理性風險中性參賽者應採取此策略」是嚴格正確的。橋樑審計的目的是讓這些隱含假設浮出水面,而非否定計算結果。
這個建構性貢獻補強了第二篇的批判性論點。第二篇指出三門問題在框架選擇上存在悄然切換,但未提供切換是否合法的判斷標準。轉換許可表提供了這個標準:任何跨框架轉換,必須對應一座有名稱的橋樑,且該橋樑的通行費必須被明確支付或合理假設。在此標準下,三門問題的標準論證被定位為一個橋樑費未結清的論證——它在計算層面正確,在論證鏈完整性層面有缺。
這個定位比第二篇原有的「定義缺陷」陳述更精確。「定義缺陷」是描述性的,「橋樑費未結清」是規範性的——它指出了論證的具體缺口在哪裡,以及修復這個缺口需要做什麼工作(明確聲明使用的框架、驗證可交換性、定義效用函數、論證主體可互換性)。
7.6 對 AI 與教育實踐的補充建議
基於轉換許可表,我們可以對第六部分的建議作出補充:
對 AI 系統:在處理涉及概率的問題時,內部維護一個「橋樑帳本」,記錄每次論證使用了哪座橋樑、通行費是否已被驗證或假設。在輸出結論時,將未付費的橋樑標示為條件,而非將條件結論呈現為無條件真理。
對教育實踐:在教授三門問題(以及任何條件概率經典案例)時,將「我們現在從哪個框架推到哪個框架,使用了哪座橋樑」作為顯式的教學環節。學生記住「答案是 2/3」是淺層學習;學生能識別「這個答案使用了 de Finetti 橋樑、Cox 橋樑與期望效用橋樑」是深層學習。
這個補充將「定義誠實性」這個規範性呼籲,轉化為一個具體可操作的審計實踐。
結語:定義的誠實性作為數學的基本倫理
三門問題爭議持續三十餘年,在學術界、教育界、大眾媒體,以及近年的AI系統中留下了深刻印記。這個爭議的根源不是答案錯誤——在充分定義的條件下,換門策略確實具有更高的期望收益。根源在於問題本身的定義從未被充分誠實地呈現。
一個沒有公理的定理是什麼?一個沒有明確框架的概率陳述是什麼?一個在頻率主義與貝葉斯主義之間悄然切換而不加說明的論證是什麼?答案是:它們都是有效但不完整的知識片段——足以在特定解讀下為真,但不足以作為教育的基礎。
三門問題的真正遺產,不應是「你應該換門」這個無條件答案,而是它所揭示的教訓:概念定義的完整性是數學論證有效性的前提條件。當這個前提條件被忽略,哪怕是一個只有三扇門的簡單問題,也能在半個世紀內持續產生認知混亂。
在那個意義上,三門問題不是一個已被解決的問題,而是一個還在持續定義中的問題。
參考文獻
Kolmogorov, A. N. (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung. Springer.
de Finetti, B. (1974). Theory of Probability (Vols. 1–2). Wiley.
Jaynes, E. T. (2003). Probability Theory: The Logic of Science. Cambridge University Press.
von Mises, R. (1928). Probability, Statistics and Truth. George Allen & Unwin.
Selvin, S. (1975). A Problem in Probability. The American Statistician, 29(1), 67.
vos Savant, M. (1990, September 9). Ask Marilyn. Parade Magazine, 16.
Gillies, D. (2000). Philosophical Theories of Probability. Routledge.
Hacking, I. (2001). An Introduction to Probability and Inductive Logic. Cambridge University Press.
Neo.K (2025). 三門問題的敘述歧義分析:視角混淆與信息結構缺陷的系統性研究. EveMissLab Working Paper.
Neo.K(許筌崴)
EveMissLab 一言諾科技有限公司
2025