# 引用即歷史：AI時代數學認識論的位移與命題橋接準則

**草稿 / 非發表用**
EveMissLab 工作文件 · Neo.K

---

## 摘要

傳統數學知識的認識論基礎是**共識堆疊**：數學家引用被社群接受的定理，建立在前人工作之上，以同行評審作為可靠性的保證機制。本文論證，這個機制在AI與計算機驗證工具普及的當下，正在經歷一次根本性的認識論位移。

位移的核心有三個層面：第一，計算機驗證（尤其是Lean 4等形式化系統）提供了一種在認識論地位上**高於人類共識**的證明類型——不因其更聰明，而因其間隙更少、更透明、更可追責。第二，AI的推理能力已達到可以從公理出發重新推導大量中間命題的程度，使「無法自行驗證故必須引用」這個傳統藉口在結構上開始瓦解。第三，上述兩個條件合在一起，使得**命題橋接準則**——凡宣稱問題P₂延伸或解決問題P₁，必須提供精確的命題關係說明——從理想性要求轉變為可執行的操作標準。

本文不宣稱AI無誤或計算機萬能。本文的論點是：時代條件已改變，舊有認識論標準（引用同行評審定理即可）已不再是唯一可行的選項，而新標準（從公理出發、AI輔助推導、機器驗證封閉）正在成為可選的、且在某些意義上更優的替代。在這個轉變之下，數學引用的地位從**認識論依賴**重新定位為**歷史標注**。

本文同時提出命題橋接準則作為數學問題演化的通用透明要求，並以EveMissLab同日工作的掛谷問題分析作為具體案例。

---

## 一、傳統數學知識的認識論基礎

### 1.1 共識堆疊的機制

現代數學知識的建立方式，可以描述為一種**共識堆疊（consensus stacking）**的過程：

一個新定理被提出後，它首先接受同行評審——通常是幾位該領域的專家在數週到數月內審閱。若評審通過，定理被發表。此後，它開始被其他研究者引用、使用、延伸。如果沒有矛盾或反例浮現，它逐漸獲得社群的廣泛接受，最終成為後續研究可以放心引用的「既定結果」。

這個機制的認識論結構是：

> **可靠性 ≈ 同行認可的人數 × 時間 × 被引用後下游結果的自洽性**

沒有任何一個定理在這個機制下得到「確定無誤」的地位。所有的「確定」都是機率性的，只是機率大小不同。

### 1.2 機制的缺陷

共識堆疊機制有幾個系統性的認識論缺陷：

**缺陷一：評審人數極少。** 一篇複雜的數學論文，實際上從頭到尾仔細驗證過每一個步驟的人，可能只有個位數。王虹與Zahl的127頁三維掛谷猜想證明，在整個數學界中真正完整驗證過的人極有可能不超過十人。

**缺陷二：專業壁壘限制可見度。** 高度技術性的證明所需的背景知識極深，使得有資格評審的人本身就是極少數。評審者的稀缺使得多重獨立驗證在實踐中難以實現。

**缺陷三：錯誤可以沉睡多年。** 數學史上不乏被廣泛引用多年後才被發現存在漏洞的定理。Vladimir Voevodsky——菲爾茲獎得主——曾發現自己發表多年的論文中存在未被注意的錯誤。這個經歷直接促使他投入形式化數學的研究，最終推動了Homotopy Type Theory的發展。他的結論是：人類同行評審對複雜證明的可靠性，比數學社群普遍認為的低得多。

**缺陷四：引用繼承錯誤。** 當你引用一個定理並以它為基礎建立新結果，你繼承了那個定理的所有潛在錯誤，而不自知。錯誤在引用鏈中靜默傳播，直到某個人試圖追根溯源或發現下游矛盾。

### 1.3 人類證明的本質

傳統數學論文中的「證明」，在認識論上更準確地應該被描述為：

> **一個草圖，加上一個宣稱——宣稱作者相信這個草圖可以被擴充成完整的形式推導。**

這個草圖假設讀者能夠自行填補「顯然」「易知」「類似地」「省略」這些標記背後的步驟。而這些步驟的填補，依賴讀者的直覺與訓練，不依賴任何形式驗證。

在這個意義上，傳統數學證明是**說服性的**，不是**封閉性的**。它試圖讓讀者相信一個完整證明存在，而非直接提供這個完整證明。

---

## 二、計算機驗證的認識論地位

### 2.1 確定性的結構性優勢

計算機的認識論優勢不在於聰明，而在於**確定性（determinism）**與**機械性（mechanism）**。

一個人類數學家閱讀一個推論步驟，會在「感覺對」的地方停下來，繼續往下讀，而不追問這個「感覺對」是否有形式基礎。這不是懶惰，而是認知效率——人類的工作記憶有限，必須在「細節」和「大局」之間取捨。但這個取捨留下了間隙。

Lean 4等形式化系統不做這個取捨。它對每一個推論步驟要求明確的形式基礎：每個命題必須是一個已知類型，每個推論必須是一個已知規則，每個「顯然」必須被展開。系統的回應是二元的：接受或拒絕。沒有「大概接受」，沒有「應該可以」，沒有「讓這個小問題過去」。

這使得機器驗證的證明在一個非常具體的意義上**比傳統證明更真**：

> 傳統證明：「存在一個完整推導，我相信我可以展開它。」
> 機器驗證的證明：「我已經展開了一個完整推導，機器確認了每一步。」

這兩種命題的認識論地位是不同的。前者是對後者的**存在性宣稱**，後者是對前者的**建構性實現**。

### 2.2 間隙的可見化

形式化系統的另一個重要認識論貢獻，是使間隙**可見**。

在傳統論文中，一個邏輯間隙通常以某種形式的「省略」出現——「顯然可知」「類似地推導」「細節留給讀者」。這些標記在視覺上佔用極小空間，容易被忽視。

在Lean 4中，每一個未被填補的步驟都會以**編譯錯誤**的形式出現——明確、可定位、無法繞過。你不能「省略」一個步驟繼續往下走；你必須填補它，否則整個證明不被接受。

這個性質對橋接問題有直接意義：如果你試圖在Lean 4中從一個問題的解答跳到另一個問題的宣稱，類型系統會在跳躍的位置停下來，要求你提供橋接項（bridge term）。橋接的缺席不是可以被「感覺上對就算了」的——它是一個硬性錯誤。

### 2.3 信任層的縮短

在傳統引用鏈中，你的信任必須延伸到整個引用歷史：

> 你的定理 → 引用A → A引用B → B引用C → ... → 某個幾十年前的基礎結果

這個鏈條中任何一個環節的錯誤，都會默默地傳播到你的結果中。

在Lean 4驗證的框架下，信任只需要延伸到：

> 你的定理（機器驗證） → Lean 4的可信核心（約數百行代碼，被極仔細審查）

這不是消除了信任，而是**極大縮短了信任鏈**，並且讓剩餘的信任底層（核心代碼）是具體的、可定位的、可被獨立檢查的。

---

## 三、AI推理能力的認識論意義

### 3.1 AI不是純工具

在過去，計算機在數學中的角色主要是**計算工具**——它做人類指定的運算，快但不推理。這種角色不改變數學認識論的基本結構：數學家仍然必須提供所有的邏輯結構，計算機只是加速特定的數值步驟。

AI在數學中的當前角色已經開始不同。OpenAI的系統在協助解決Erdős單位距離猜想時，不只是執行人類指定的計算——它**參與了核心推理步驟的發現**。這個區別在認識論上是重要的：AI開始能夠在搜索龐大的推理空間、識別有希望的結構、提出人類數學家未曾嘗試的路徑。

這意味著AI開始具備協助**橋接**的能力——不只是執行橋接，而是**發現橋接應該長什麼樣子**。

### 3.2 「無法自行驗證」藉口的瓦解

傳統數學實踐中有一個隱含的合理性聲明：「這個定理太複雜、太長、需要太多前置背景，我個人無法在合理時間內從頭驗證它，所以我引用它。」這個聲明在過去是完全合理的——要求每個數學家獨立重新推導所有前置工作是不現實的。

但這個合理性聲明的根基，隨著AI能力的增長，開始動搖：

如果AI可以在對話時間內幫助重新推導大量中間步驟，如果AI可以識別哪些步驟是「省略了實質工作」的，如果AI可以建議Lean 4形式化的路徑——那麼「無法自行驗證」的理由在技術上變得越來越站不住腳。

這不是說這個理由立刻消失。對於最前沿的技術結果（如王虹與Zahl的127頁論文），AI目前仍然無法完整重新推導。但趨勢的方向是明確的：AI能力增長的速度，使得「無法獨立驗證」的邊界持續後退，越來越多的命題進入「可以由AI協助從公理重新推導」的範疇。

### 3.3 時代宣告的精確內容

本文的「時代不同了」並不宣稱：

- AI是完美無誤的（它不是）
- 計算機能處理所有數學問題（它不能）
- 傳統同行評審已死（它仍然有用）

本文宣稱的是：

> **新的認識論標準現在技術上可行，且在邏輯間隙的數量和透明度上優於舊標準。舊標準之所以被沿用，部分是惰性，部分是工具限制——後者正在消除。**

在這個意義上，「用AI與計算機驗證從公理出發的推導鏈」不再只是理想，而是越來越可操作的實踐。數學社群是否選擇採用，是一個關於意願和制度的問題，不是關於可行性的問題。

---

## 四、命題橋接準則

### 4.1 定義

在上述認識論框架下，本文提出以下準則：

**命題橋接準則（Propositional Bridge Criterion, PBC）：**

> 當數學社群——在論文、綜述、或公開傳播中——宣稱「問題P₂的解決延伸、完成、或推廣了問題P₁」時，必須提供一個明確的橋接說明，精確陳述P₁與P₂之間的命題關係。此關係可以是：蘊含（P₂ → P₁或P₁ → P₂）、歸約（P₁等價於P₂的特例）、推廣（P₁是P₂在特殊條件下的版本）、或其他精確的邏輯形式。
>
> 若無法提供任何此類精確關係，則必須明確聲明：P₁與P₂之間的聯繫是**歷史性的或動機性的**，而非邏輯繼承關係，且相關的公開宣稱應相應調整。

### 4.2 準則的適用範圍

PBC適用於以下任何一種情形發生時：

**情形一：研究對象被替換。** 例如，從「針可以在其中連續旋轉的集合」（動態）到「包含所有方向靜止線段的集合」（靜態）。對象的改變需要橋接說明。

**情形二：測量工具被替換。** 例如，從Lebesgue測度（面積）到Hausdorff維數。工具的替換改變了「問題的性質」，需要說明為何新工具是舊問題的自然延伸或等價形式。

**情形三：定義域被推廣或限制。** 例如，從n=2到n=3到n≥4的掛谷猜想。每個維度的推廣雖然使用相同名稱，但在形式化系統中是不同的命題，需要明確的蘊含關係。

**情形四：問題框架被改寫。** 例如，從「最小面積問題」到「維數下限問題」。框架的改寫可能保留問題的精神，但改變了問題的形式內容。

### 4.3 準則不要求什麼

重要的是說清楚PBC**不要求**：

- 橋接定理必然存在（有些問題演化確實只是歷史命名，不需要邏輯橋接）
- 研究者必須提供自己結果的完整前置推導（引用仍然是合法的，只需標注其認識論地位）
- 現有數學文獻必須全面重寫（PBC是前向標準，不是歷史清算）

PBC要求的只是：**沉默被禁止**。要嘛提供橋接，要嘛明確說明沒有橋接、並說清楚這意味著什麼。

### 4.4 Lean 4作為PBC的自然執行機制

Lean 4的類型系統為PBC提供了一個天然的技術執行層：

當你試圖從一個命題推導另一個命題時，類型檢查器要求你提供明確的橋接項（bridge term）。如果橋接項不存在，推導失敗，以編譯錯誤的形式報告。這個報告不是建議，是硬性阻斷。

在這個意義上，將數學問題的演化鏈條形式化到Lean 4，就是**自動執行PBC**：橋接要嘛在代碼中存在，要嘛在編譯時報錯。這迫使數學家在代碼層面明確處理，而不是在敘事層面模糊略過。

---

## 五、認識論位移：從「說服共識」到「封閉推導」

### 5.1 兩種認識論模式

傳統數學實踐中有兩種認識論模式，以前常被混用，在新的框架下需要被清楚分開：

**模式一：說服共識（Convincing Consensus）**
目標：讓足夠多的專家相信一個命題為真。
工具：論文、演講、同行評審、引用積累。
判準：社群普遍不提出反例，且結果被廣泛引用。
可靠性：機率性，隨社群規模和時間增長但永遠不達確定。

**模式二：封閉推導（Closed Derivation）**
目標：從公理出發，通過機器驗證，產生一個沒有未填補步驟的推導。
工具：形式化語言（Lean 4等）、AI輔助生成推導步驟、機器檢查。
判準：Lean 4接受推導，核心代碼在邏輯上封閉。
可靠性：以核心代碼正確性為前提的條件確定性。

這兩種模式並非對立或互相排斥——一個結果可以同時通過兩者。但它們提供了**不同類型的知識保證**，不應被等同。

### 5.2 「更真」的精確意義

本文宣稱計算機驗證的證明「在某些意義上比傳統證明更真」。這需要精確限定：

「更真」不是指計算機比人更有數學洞見，也不是說計算機的底層假設更基本（ZFC公理系統的選擇仍是一個未決的哲學問題）。

「更真」的精確意義是：

> **在已選定的公理框架下，機器驗證的推導對「完整推導存在且已被展開」這個事實，比傳統論文提供了更強的認識論保證。**

傳統論文說：「存在一個從公理到結論的完整推導，我相信我能給出它。」
機器驗證說：「這個完整推導已經被展開，機器在每一步都確認了它。」

第二個陳述比第一個更強，因為它去掉了「相信」這個認識論缺口。

### 5.3 剩餘的不可消除信任底層

即使在封閉推導模式下，仍有一個不可消除的信任底層：

**第一層：公理系統的選擇。** ZFC集合論、類型論（Lean 4使用的CIC）或其他基礎系統的選擇，是一個無法從系統內部驗證的哲學決定。哥德爾不完備定理告訴我們，足夠強的系統無法從內部證明自身一致性。

**第二層：可信核心的正確性。** Lean 4的可信核心（trusted kernel）約有幾百行代碼，被極仔細審查且有多人獨立驗證。它不是完美的，但它是目前可達到的最短、最可檢查的信任底層。

**第三層：AI系統的推理正確性。** 當AI參與生成推導步驟時，它可能引入錯誤。但這個錯誤會在Lean 4的類型檢查中被捕獲——如果AI給出了一個錯誤的步驟，機器不接受。AI的錯誤不能繞過機器驗證靜默傳播。

這三層信任底層比傳統引用鏈的信任底層**短得多、透明得多、可定位得多**。這不是消除了信任，而是使信任更集中、更可審查。

---

## 六、引用的重新定位

### 6.1 引用作為認識論依賴

在傳統數學實踐中，引用一個定理意味著：

> **我的結果的認識論地位，與被引用定理的認識論地位綁定。若被引用定理為假，我的結果可能也為假。**

這是引用作為**認識論依賴**的使用方式。這種使用方式有其必要性——沒有人能在有限生命內從頭驗證所有前置工作——但它也有前述的系統性風險：繼承錯誤、信任鏈過長、間隙靜默傳播。

### 6.2 引用作為歷史標注

在新的認識論框架下，引用可以被重新定位為**歷史標注**：

> **「掛谷（1917）提出了此問題；Besicovitch（1928）提供了關鍵構造。」這些引用告訴讀者問題的歷史脈絡，不再意味著我的結論的認識論地位依賴Besicovitch 1928的正確性——因為我已經從公理重新推導了相關部分。**

在這種使用下，引用成為歷史和動機的記錄，而非邏輯依賴的聲明。兩者可以並存——論文可以同時引用歷史文獻（告訴讀者問題從哪裡來）和提供機器驗證的推導（告訴讀者結論為何成立）。

### 6.3 過渡期的實踐建議

在大多數數學還沒有被形式化的當前過渡期，以下實踐可以提高認識論透明度：

**建議一：標注引用的認識論類型。** 明確區分「引用作為歷史背景」和「引用作為邏輯依賴」。若是後者，指出是否有形式化驗證，若無則標注為「待驗證」。

**建議二：對關鍵承重命題進行AI輔助重新推導。** 論文中最核心的中間定理，不要只引用——用AI輔助從更基礎的地方重新推導一遍，作為附錄或補充材料。

**建議三：應用PBC於所有問題演化宣稱。** 每當論文宣稱「本文推廣/延伸/完成了某個問題」，提供橋接說明。

**建議四：標記形式化狀態。** 論文應標注其核心結果的當前形式化狀態（未形式化 / 部分形式化 / Lean 4完整驗證），讓讀者知道認識論保證的程度。

---

## 七、掛谷問題作為案例研究

### 7.1 問題演化鏈的完整圖像

掛谷問題提供了一個命題橋接準則的典型案例，也展示了傳統引用機制如何在敘事層面掩蓋類型替換。

演化鏈如下：

**節點1（1917）：** 掛谷針問題——連續旋轉的最小面積，動態類型，Lebesgue測度。
**節點2（1928）：** Besicovitch回答節點1——面積下確界為零，同時引入靜態Besicovitch集作為構造工具。
**節點3（1928+）：** Besicovitch集的Hausdorff維數問題——靜態類型，Hausdorff測度，被命名為「掛谷猜想」。
**節點4（1971）：** n=2情形被證明（Davies）。
**節點5（2025）：** n=3情形被王虹與Zahl證明。

橋接缺失位置：節點2→節點3。

節點2是對節點1的回答，且引入了靜態Besicovitch集。節點3是對靜態Besicovitch集性質的新問題，不是對節點1的繼續追問——節點1已被回答。從節點1到節點3的「同一問題」敘事，需要一個橋接定理說明為何問Hausdorff維數是問面積問題後的自然繼承；這個橋接從未被提供。

### 7.2 引用鏈的認識論分析

本文（即今日EveMissLab的掛谷系列論文）在論證中引用了以下命題：

- Besicovitch（1928）：存在測度為零的Besicovitch集
- 命題M：掛谷針集的Lebesgue測度嚴格大於零
- 王虹與Zahl（2025）：三維Besicovitch集的Hausdorff維數為3

前兩個命題的核心論證，在理論上可以由AI從測度論公理重新推導，而不依賴對1928年或2013年原始文獻的引用。王虹與Zahl的結果目前超出了可由AI直接重新推導的範圍——它依賴極深的技術積累，目前仍需引用作為認識論依賴。

這個區分本身就是一種有用的認識論分層：哪些命題是「可以重推」的，哪些是「目前只能引用」的，應該被明確標注。

### 7.3 對PBC的具體應用

將PBC應用於掛谷問題的演化鏈：

**宣稱一（需要橋接）：** 「王虹與Zahl解決了掛谷1917年提出的針旋轉問題。」
橋接說明：此宣稱需要說明，解決Besicovitch集維數問題如何回應（或不回應）1917年的面積問題。
現有橋接：缺席。
正確陳述：「王虹與Zahl解決了現代掛谷集合猜想的三維情形（Besicovitch版本）。此猜想由掛谷1917年問題所啟發，但在對象定義和測量工具上均有改變，兩者之間的精確命題關係尚未被形式化。」

**宣稱二（歷史命名，不需橋接，需聲明）：** 「現代掛谷猜想延續了掛谷1917年問題的精神。」
說明：若此宣稱僅指歷史和動機聯繫，則無需橋接，但需明確標注這是歷史命名而非邏輯繼承。

---

## 八、對現有數學實踐的影響與前景

### 8.1 不是顛覆，是提升精度

本文的主張容易被誤讀為對傳統數學的否定。這不是本文的意圖。

傳統數學通過共識堆疊機制積累的知識體系是真實的、有價值的、大體上可靠的。它的可靠性已通過時間和應用得到廣泛驗證。本文不否定這個體系，只是指出它的認識論地位與機器驗證的封閉推導不同，且新工具的出現使得要求更高的標準成為可能。

這是一個**精度的提升**，不是範式的顛覆。就像顯微鏡的出現讓人們看到肉眼看不到的結構，而不是說肉眼觀察是錯的——新工具提供了更精細的分辨率，使更高的要求成為可行。

### 8.2 形式化作為長期基礎設施

Lean 4的Mathlib庫正在持續擴展，越來越多的數學定理被形式化。這個過程是緩慢的，但方向是確定的。長期來看，數學知識庫的形式化程度會持續增長，使得「從公理出發的機器驗證」成為越來越常規的選項。

在這個長期趨勢下，PBC不只是一個學術方法論建議，而是未來數學寫作標準的預示：當形式化成為常態，橋接的有無就會自動在代碼中呈現，不需要任何人額外要求——類型系統已經在要求了。

### 8.3 AI輔助形式化的加速

AI的加入進一步加速了這個趨勢。將一個數學命題從非形式語言翻譯成Lean 4代碼，過去是一項需要專門訓練的艱難工作。AI的輔助正在降低這個門檻。當AI可以幫助數學家更快地構造Lean 4形式化，整個形式化生態的擴展速度就會加快，命題橋接的可要求性也會隨之提升。

---

## 附錄：本文與EveMissLab掛谷系列論文的關係

本文是EveMissLab同日工作的三篇論文中的第三篇，也是方法論層面最高的一篇。

第一篇（《未定義的接觸》，SMP論文）：在掛谷問題的**問題內部**，揭示接觸協議（GPP vs SMP）是一個未被宣告的選擇，不同協議生成不同的幾何對象。這是PBC在問題定義層面的具體應用。

第二篇（《掛谷鏈的斷裂》，橋接論文）：在掛谷問題的**演化鏈條**上，識別從1917年動態問題到2025年靜態Hausdorff維數證明之間的橋接缺口。這是PBC在問題歷史敘事層面的具體應用。

本文（《引用即歷史》，方法論論文）：將PBC從掛谷問題的具體案例提升為通用準則，並置於AI時代數學認識論位移的更廣框架中。

三篇論文的方法論核心一致：**前提顯化（Premise Explicitation）**——將被視為透明背景的選擇（接觸協議、對象替換、敘事橋接、引用的認識論地位）抓出來，命名，並問其形式後果。

---

*哲學結語：數學一直自詡為最確定的知識。這個自詡在一個精確的意義上是對的——在已選定的公理下，邏輯推導是確定的。但數學知識的建立過程——同行評審、共識形成、引用積累——從來都不是確定的，只是足夠可靠。AI與計算機驗證的出現，第一次讓「更確定」成為可操作的選項，而不只是哲學上的理想。這不是讓數學更數學，而是讓數學更誠實地面對自己的認識論基礎。*

---

*草稿狀態・可能含錯誤・非發表用*
*EveMissLab / Neo.K*