**三門問題的本體論層缺陷：補充研究（二）**

_Supplementary Study II: Ontological Deficiencies in the Monty Hall Problem_

——時序狀態轉化的範疇錯誤，與「理性人」假設的主體抹殺問題

Neo.K（許筌崴）　EveMissLab 一言諾科技有限公司　2026年3月

# 摘要

本文是「三門問題的敘述歧義分析」（前篇）與「三門問題的概率定義缺陷：補充研究（一）」的延伸，聚焦於一個更深層的本體論問題：三門問題在其根本結構上，是一個時序狀態轉化系統（sequential state-transformation system），而標準數學處理將其壓平為靜態概率空間。這個操作本身是一個範疇錯誤，它不只造成信息損失，更遮蔽了問題的真實本質。

本文同時分析「理性人」（rational agent）假設的結構性問題：此假設將每個參賽者的完整個體狀態強制均質化，抹去了個體差異對最優決策的影響。我們將指出，對於任何攜帶超出 {P, H} 的額外信息的真實參賽者，標準答案 2/3 在嚴格意義上不適用。

本文的立場與前兩篇一致：不否認在充分定義的條件下換門策略具有更高的期望收益，但要求這個結論所依賴的結構性簡化被誠實地呈現，而非以「唯一正確答案」的形式教授。

_關鍵詞：時序狀態轉化、範疇錯誤、全態貝葉斯、理性人假設、主體差異性、信號提取、本體論壓平_

# 第一部分：兩篇補充研究的定位回顧

在整理本文的論證結構之前，先簡要回顧三篇論文各自處理的層次，以便讀者定位本文的位置。

前篇（敘述歧義分析）處理的是語言層面：三門問題的自然語言敘述存在視角混淆、信息結構模糊、隱含假設未被明示等結構性缺陷。前篇的核心貢獻是建立了歧義測度框架，並提出了改進版敘述方案。

補充研究（一）處理的是數學定義層面：三門問題從未明確其核心術語「概率」所指涉的隨機性框架，電腦模擬輸出的頻率比例與理論宣稱的概率在本體論上屬於不同類別，構成類型錯誤。

本文（補充研究二）處理的是本體論層面：三門問題的情境本質上是一個動態時序過程，而非靜態概率空間；每個參賽者是一個獨特的本體論主體，而非可互換的「理性人」。這個層次的問題在前兩篇中雖有觸及，但尚未被系統性地展開。

三個層次的問題相互獨立，但彼此疊加。解決任何一個層次的問題，都不能消解另外兩個層次的問題。

# 第二部分：三門問題的時序結構

## 2.1 被忽略的動態性

三門問題的標準呈現方式，習慣於將整個情境作為一個已完成的快照來分析：車在某扇門後，主持人已開了某扇門，參賽者面對兩個剩餘選項。在這個快照中，問題被簡化為：「條件概率 P(C = d₂ | H = d₃, P = d₁) 等於多少？」

這個問題在技術上是可以被精確回答的。問題不在於答案的計算，而在於這個「快照化」操作本身是否忠實地表示了原始情境的結構。

我們的論點是：它並不忠實。三門問題的情境是一個按照時間順序展開的事件序列，每個事件都在原有基礎上改變了系統的狀態。將這個序列壓平為一個靜態的條件概率計算，丟失了時序結構本身所攜帶的信息。

## 2.2 事件的時序拆解

讓我們仔細地還原三門問題的時序結構，不做任何簡化：

**事件序列**

t₀（初始化）：車被隨機放置在三扇門之一後。這是一個物理事件，完成後車的位置成為確定的（但對參賽者未知的）事實。系統進入狀態 S₀。  t₁（參賽者選擇）：參賽者在沒有任何關於車位置的直接信息的情況下，選擇一扇門 P。系統進入狀態 S₁ = (S₀, P)。此時信息結構發生了第一次改變：主持人現在知道 C 與 P 的關係。  t₂（主持人開門）：主持人根據其知識狀態與規則，選擇開啟門 H。這個行為本身攜帶信息——它的確定性依賴於 C 與 P 的關係。系統進入狀態 S₂ = (S₁, H)。  t₃（參賽者決策）：參賽者在觀察到 H 之後，決定保持 P 或換至剩餘門。這個決策發生在狀態 S₂ 的完整脈絡中。

關鍵觀察：這四個事件在本體論上是不可交換的。它們不只是「同一個情境的四個描述角度」，而是四個按照因果順序排列的狀態轉化。t₂ 的信息內容依賴於 t₁ 的結果；t₃ 的最優行動依賴於 t₂ 的具體展開方式。

## 2.3 壓平操作的信息損失

當標準分析將上述序列壓平為條件概率計算時，具體丟失了什麼？

第一，主持人在 t₂ 的行為的非均勻確定性結構被抹去。當 C ≠ P 時，主持人的行為是完全確定論的——他別無選擇，只能開那唯一的山羊門。當 C = P 時，主持人在兩扇門之間有選擇，行為引入了（認識論意義上的）不確定性。這兩種情況在靜態概率計算中被混同為「主持人開了一扇山羊門」這個單一事件。非均勻的確定性結構消失了。

第二，t₁ 到 t₂ 之間的因果方向被模糊。靜態的條件概率 P(C|H,P) 描述的是「給定 H 和 P，C 的分布」，但這個表述省略了 H 是在 P 已知後才被確定的這一因果事實。條件概率的計算結果雖然數值上正確，但其因果詮釋需要額外的謹慎。

第三，每個時間點上參賽者的信息狀態的演化過程不見了。在 t₁ 時，參賽者的信息集合是空的（對車位置而言）。在 t₂ 之後，信息集合包含了 H 的觀察結果。這個演化過程本身是決策情境的一部分，在靜態表述中無從體現。

## 2.4 範疇錯誤的定義

**定義 2.1（本體論壓平，Ontological Flattening）**

將一個時序狀態轉化系統（其中每個事件依賴於前序事件的結果，且事件的本體論地位隨時間演化）表示為靜態概率空間的操作，稱為本體論壓平。本體論壓平是有條件合法的降維操作，但不是等價表示。

**命題 2.1（三門問題的範疇錯誤）**

三門問題的標準數學處理對其時序狀態轉化結構執行了本體論壓平，並將壓平後的靜態計算結果直接呈現為對原始動態情境的完整描述。這構成一個範疇錯誤（categorical error）：靜態概率空間與時序狀態轉化系統屬於不同的數學範疇，前者是後者的一個降維投影，不能在沒有明確說明的情況下被當作後者的完整等價物。

需要強調的是：這個範疇錯誤不使換門策略的行動建議失效。在充分定義的條件下，換門仍然具有更高的期望收益。但它確實改變了「2/3」這個數值的本體論地位：它不是三門問題情境的固有屬性，而是對一個特定降維投影的計算結果。

# 第三部分：全態貝葉斯框架下的重新表述

## 3.1 時序狀態轉化的形式語言

全態貝葉斯（Full-State Bayesian，FSB）框架，如Neo.K（2026）所發展，提供了一個自然的語言來表述時序狀態轉化系統，而不需要執行本體論壓平。

在FSB框架下，三門問題的情境被表述如下：

**三門問題的FSB表述**

S₀ = W(car_position, rules)　　　　　　　　　初始狀態 S₁ = W(S₀, player_choice)　　　　　　　　　參賽者選擇後的狀態 S₂ = W(S₁, host_action)　　　　　　　　　　主持人開門後的狀態 S₃ = W(S₂, final_decision)　　　　　　　　　最終決策後的狀態  其中 W 是編織操作，每個新的編織元被加入系統狀態，舊狀態的結構被保留（歷史保留性）。

在這個表述中，問題不是「P(C = d₂ | H = d₃, P = d₁) = ?」，而是：「在狀態 S₂ 下，哪個 final_decision 的選擇導致 S₃ 具有更高的期望效用？」

這兩個問題在充分定義的條件下給出相同的行動建議，但它們的形式結構不同：前者是靜態的條件概率查詢，後者是動態的決策最優性問題。FSB的貢獻不在於改變答案，而在於提供了一個不需要本體論壓平的表述方式。

## 3.2 主持人行為的非均勻結構在FSB中的保留

在FSB表述中，主持人的行為被表示為 host_action 這個編織元。這個編織元的信息內容依賴於 S₁ 的結構——具體說，依賴於 car_position 與 player_choice 的關係。

當 C ≠ P 時（機率 2/3），host_action 是完全確定的：主持人只有一個可以選擇的門。這個確定性在 S₂ 中被完整保留——S₂ 的結構顯示主持人在這個情況下沒有任何選擇餘地。

當 C = P 時（機率 1/3），host_action 包含了一個選擇：主持人在兩扇可行的門中挑選。這個選擇的過程是 S₂ 結構的一部分，不被壓平操作抹去。

這個非均勻性正是換門策略的力量所在：它利用了主持人在 C ≠ P 情況下的確定性。FSB框架自然地保留了這個結構，而靜態的條件概率計算，雖然數值上正確地反映了這個非均勻性，但在表述層面上把它隱藏在了計算步驟之中。

# 第四部分：「理性人」假設的結構性問題

## 4.1 理性人假設的內容

三門問題的標準解答預設了一個「理性人」（rational agent）作為決策主體。這個假設通常被視為無害的技術性簡化，但它實際上包含了一組非常強的預設條件：

**理性人假設的隱含條件**

R₁：參賽者的信息集合恰好等於 {P, H}，既不多也不少。 R₂：參賽者完全知曉遊戲規則，包括主持人知情且必開山羊門。 R₃：參賽者完全信任這些規則，沒有任何懷疑。 R₄：參賽者沒有任何額外的觀察能力（如對主持人行為模式的觀察）。 R₅：參賽者的決策純粹基於期望效用最大化，不受其他因素影響。 R₆：所有參賽者在以上五個條件上完全一致，是可互換的。

這六個條件的組合定義了一個高度特殊化的假想主體。問題不在於這個主體的定義，而在於標準解答從未明確聲明它在使用這個假設，也從未討論當真實參賽者偏離這個假想主體時，答案如何變化。

## 4.2 信息集合的個體差異

在真實的遊戲情境中，每個參賽者攜帶的信息集合 I_P 是不同的。以下幾個例子說明這種差異對最優決策的影響：

### 4.2.1 對主持人行為模式的觀察

設參賽者觀察到主持人在開門前猶豫了一段時間 τ。若主持人在 C = P 時（需要從兩扇門中選擇）的猶豫時間分布，與在 C ≠ P 時（只有一扇門可以選擇）的分布不同，則 τ 是一個有信息量的信號。

形式上，若 P(τ > t₀ | C = P) ≠ P(τ > t₀ | C ≠ P)，則參賽者的正確後驗為：

_P(C | H, P, τ) ≠ P(C | H, P)_

在這種情況下，忽略 τ 而直接採用標準的 2/3 策略，對這個參賽者而言並非最優。最優策略取決於 τ 的觀察值以及其對主持人行為模式的先驗信念。

### 4.2.2 對規則的不確定性

設參賽者不完全確定主持人是否「必定」開山羊門。他的信念可以被表示為：

_P(主持人策略 = 必開山羊門) = β，β ∈ [0, 1]_

在補充研究（一）中，我們已指出標準版本未明確說明 β = 1。對於一個持有 β < 1 信念的參賽者，最優策略不是無條件換門，而是依賴於 β 的值的混合策略。只有當 β = 1 時，換門的期望效用才嚴格等於 2/3。

### 4.2.3 對主持人動機的推斷

在真實的博弈情境中，主持人是一個有動機的行為者。如果參賽者有理由相信主持人的開門策略不是中立的——例如，主持人傾向於在參賽者初選正確時才提供換門機會，以減少節目成本——那麼主持人開門這個事件本身就是一個關於 C 與 P 關係的額外信號。

這個推斷是否成立，依賴於參賽者對主持人動機的先驗信念。不同的參賽者可能持有不同的信念，導致不同的後驗分布和不同的最優策略。

## 4.3 個體差異的本體論地位

上述例子可能被解讀為「信息不完整時的特殊情況」，而標準問題只是對信息完整的理想情況給出了答案。這個解讀雖然部分合理，但忽略了一個更深的問題。

在全態貝葉斯框架下，每個參賽者是一個攜帶完整狀態向量 S_t 的本體論主體。這個狀態向量包含了他所有的感知、記憶、信念和觀察能力。沒有任何兩個真實的參賽者擁有完全相同的 S_t。

「理性人」假設的操作是：把所有不同的 S_t 強制映射到一個單一的理想化狀態 S_rational，然後計算在 S_rational 下的最優策略。這個操作有其工程上的便利性，但它的本體論代價是：計算結果嚴格說來只對 S_rational 這個從未在現實中存在過的抽象主體有效。

**命題 4.1（主體差異性命題）**

三門問題的標準答案 2/3，嚴格來說僅對滿足理性人條件 R₁ 至 R₆ 的假想主體有效。對於任何信息集合超出 {P, H} 的真實參賽者，最優策略取決於其完整的狀態向量 S_t，在一般情況下不等於無條件換門，其期望收益也不等於 2/3。這不是對標準答案的否定，而是對其適用範圍的精確界定。

# 第五部分：兩個問題的交叉

## 5.1 範疇錯誤與主體差異性的關聯

時序結構的範疇錯誤與主體差異性問題，看似是兩個獨立的批評，但它們共享一個深層的根源：標準處理方式在兩個層面上都執行了同一種操作——把一個豐富的、具體的、動態的情境，壓縮為一個貧乏的、抽象的、靜態的計算問題。

時序壓平：把四個依次發生的本體論事件壓縮為一個條件概率查詢。

主體均質化：把無數個攜帶不同狀態向量的真實個體壓縮為一個假想的理性人。

這兩個壓縮操作本身都是可以被明確定義並合理使用的技術手段。問題在於，它們在標準的三門問題呈現中從未被明確聲明為壓縮操作。計算結果被直接呈現為對原始情境的完整回答，而非對一個簡化模型的計算結果。

## 5.2 對「正確答案」概念的重新審視

整合前三篇論文的分析，我們可以給出一個對「三門問題的正確答案」的精確描述：

**整合命題：三門問題的條件性正確答案**

在以下所有條件同時成立的情況下： （a）概率被詮釋為貝葉斯主觀信念（補充研究一） （b）時序結構被壓平為靜態條件概率計算（本文第二部分） （c）參賽者被假定為滿足 R₁ 至 R₆ 的理性人（本文第四部分） （d）前篇所列的假設集合 A_required 全部成立  「採用換門策略」是嚴格優勢策略，期望獲勝概率為 2/3。  這個結論在上述條件下是嚴格正確的。但它是高度條件性的——四組條件中任何一組不成立，結論都需要重新計算。

這個表述不是在削弱三門問題的教育價值，而是在給它一個更誠實的形式。一個清楚地標示了其有效範圍的結論，比一個被呈現為無條件真理的結論，在教育上更有價值，也在學術上更為嚴謹。

# 第六部分：對教育實踐的溫和建議

我們注意到，三門問題作為條件概率的教學案例，在全球教育體系中有著廣泛而持久的使用。本文的分析不是要求將其從教材中移除，而是提出幾個可以讓這個案例更有教育深度的建議。

其一，在教授標準解答之前，明確告訴學生這個問題包含了哪些假設，以及這些假設在真實情境中是否總是成立。這個討論本身就是一個極好的批判性思維訓練機會。

其二，將「信息集合如何影響最優決策」作為延伸討論。如果參賽者觀察到了額外的信號（如主持人的猶豫），最優策略會如何改變？這個討論引入了貝葉斯更新的真正核心：信念應該跟隨信息更新。

其三，區分「換門是理性人在給定信息下的最優策略」與「換門一定會贏」。前者是決策論命題，後者是概率論命題，兩者不同。學生理解這個區分，比記住「答案是 2/3」更有持久的學習價值。

其四，在高年級課程中，可以引入時序博弈的視角，讓學生看到三門問題的靜態版本是其動態版本的一個截面，而非全部。這為後續學習序貫決策理論打下概念基礎。

這些建議的共同點是：增加複雜度，但是以一種讓學生感受到知識是分層的、有邊界的、可以被質疑和延伸的方式。這比讓學生記住一個無條件的「正確答案」，更接近數學教育的真正目的。

# 結語：誠實地呈現簡化

三篇論文的分析，歸根結底，都在說一件事：三門問題是一個好問題，但它沒有被誠實地呈現。

它的敘述包含了視角混淆和信息缺口。它的核心術語「概率」沒有被明確定義。它的數學處理對動態情境執行了靜態壓平。它的「標準答案」預設了一個從未存在的均質理性人。

這些問題的存在，不是因為三門問題的設計者或推廣者有惡意，而是因為一個問題在從學術環境傳播到教育環境再傳播到大眾環境的過程中，每一步都傾向於丟失一些條件、一些邊界、一些複雜性——因為這些東西讓傳播變得更困難。

我們相信，數學的美不依賴於它的答案看起來簡單乾淨。數學的美在於它的論證是誠實的、邊界是清晰的、假設是可見的。一個被誠實呈現的複雜答案，比一個被遮蔽了複雜性的簡單答案，更接近數學本來的樣子。

_三門問題值得被誠實地呈現。這三篇論文，是朝這個方向的一次嘗試。_

# 參考文獻

Neo.K（2025）. 三門問題的敘述歧義分析：視角混淆與信息結構缺陷的系統性研究. EveMissLab Working Paper.

Neo.K（2025）. 三門問題的概率定義缺陷：補充研究（一）. EveMissLab Working Paper.

Neo.K（2026）. 全態貝葉斯：從編織本體論到活系統的狀態轉化理論. EveMissLab.

Selvin, S. (1975). A Problem in Probability. The American Statistician, 29(1), 67.

vos Savant, M. (1990, September 9). Ask Marilyn. Parade Magazine, 16.

Jaynes, E. T. (2003). Probability Theory: The Logic of Science. Cambridge University Press.

Savage, L. J. (1954). The Foundations of Statistics. Wiley.

von Neumann, J., & Morgenstern, O. (1944). Theory of Games and Economic Behavior. Princeton University Press.

Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.

Harsanyi, J. C. (1967). Games with incomplete information played by 'Bayesian' players. Management Science, 14(3), 159–182.

Neo.K（許筌崴）

EveMissLab 一言諾科技有限公司

2026年3月