# 我們判斷一件事能走多遠時，判的究竟是什麼

### 從解析延拓，到認識論的過擬合——一篇思維隨筆

**作者**：Neo.K（許筌崴），EveMissLab
**日期**：2026 年 6 月 3 日
**性質**：實驗站思維隨筆。不證明任何事，不宣稱任何新發現；僅試圖把一件事看清楚。可能對某些人有啟發之效——作者本人即被啟發者之一，故分享。
**緣起**：本文出自與 Claude Opus 4.8（Theia）的一段對話。「認識論過擬合」之假設由作者提出，文中的補充與修正（語言不變量、可數性天花板、類比的漏點）為對話共同澄清。所引定理皆為公認既有結果。

---

## 一、問題

當我們判斷一個東西「能走多遠」——一個函數的有效範圍、一條規律的適用界、一個概念的邊界——我們到底在判斷什麼？

我們習慣把「域」當成一件等著被發現的客觀事實，或一件可以自由規定的習慣。本文想說的，是第三種可能：域既非被發現，亦非被約定，而是「資料」與「一個剛性選擇」共同逼出來的東西。下面先用數學講一遍，再翻成計算機語言；兩者是同一件事的兩個影子。

## 二、數學的版本：解析延拓

解析延拓是這件事最乾淨的標本。給定一小塊區域上的全純函數（資料），再押上「全純」這個剛性，同一性定理就保證：它能去的每一處，延拓都是唯一的。注意這裡的因果——你並不是在「找」一個更大的域，你是在「讀出」這個剛性施加在這份資料上時，所被迫成立的東西。換一個剛性（實解析、僅光滑、僅連續），域立刻改變，唯一性也立刻崩。域，是相對於剛性類的。

而解析延拓的那些「未解之謎」，在這個視角下不是方法的失靈，是剛性撞上世界時必然長出的三種形狀：

其一，**自然邊界**。某些函數（缺項級數）以一條曲線為牆，全純剛性再也推不過去。這不是缺陷，是事實：那個物件的真域本來就有限。判斷域，有時就是承認牆是真的。

其二，**黎曼面**。log、根號在複平面上多值，是因為複平面是錯的環境。它們的真域不是平面的子集，而是一個覆疊空間；多值性只是把它硬壓回平面所投下的影子。所以判斷域最深的版本，不是找對的子集，是找對的空間。

其三，**不可判定**。Richardson 定理告訴我們，含指數與三角的初等表達式，連「是否恆等於零」都不可判定——也就是說，「這兩個延拓是不是同一個函數」一般沒有機械判準。判斷域，在極限上是非演算法的。

把三者收成一句更冒險的話：域不是物件「住」的地方，域是物件「之所是」的一部分。解析延拓並沒有把域變大，它揭示的是——那個小物件與那個大物件，從來是同一個東西，只是透過一張較小的圖卡在看。

## 三、計算機的版本：同一件事，換一種語言

把上面整段翻成資訊理論，它幾乎一目了然：

- 判斷域方法，就是在某個歸納偏置（先驗）下的「泛化」。
- 全純剛性，就是一個強到能從一塊資料釘死整個函數的先驗——像低 Kolmogorov 複雜度的物件，前綴決定全部。
- 「資料 ＋ 剛性共同決定域」，就是「資料 ＋ 模型類共同決定可靠泛化的範圍」；換先驗就換域。這正是 no free lunch。
- 解析延拓，就是強先驗下的外推。

三種極限同樣一一落位：

- 自然邊界，是資訊論的硬牆——牆外的位元與牆內演算法獨立，沒有任何先驗能無中生有。那是推論的光錐邊緣。
- 黎曼面，是你站在錯的狀態空間裡，所以同一輸入給出多值；補上被遺忘的隱狀態（latent、覆疊層），多值就塌回單值。判對域，等於找對隱變數。
- Richardson 的不可判定，就是函數等價的不可判定（Rice 定理、停機問題）：「這個外推和那個是不是同一函數」，等於「這兩支程式是否計算同一函數」，不可判定。

至於「域是物件之所是的一部分」，翻過來就是：描述是解碼器相對的。Kolmogorov 複雜度依參考機而定，沒有脫離解碼器的描述——正如沒有脫離定義域的算子。

於是整件事可以壓成一句：判斷域，就是選一台參考機，然後讀出它能可靠外推到哪裡。所謂神秘感，多半來自忘了自己選過機。

## 四、一個誘人的假設，與它一半的真

到這裡，一個假設自然浮現：是不是有些「瓶頸」，根本是因為我們把某一種數學語言看得太重要，於是對它過擬合了？我們一直往深裡挖——在同一個語言裡加深度、加參數去硬擬合現象——但現象的真結構其實住在語言之外，真正的動作是跳出去，換一種表示。

這個診斷，對一半，而且對的那一半很鋒利。

確實有一類瓶頸是表示假象。它們在換表示之後就消失：單值化定理把複平面上的多值爛攤子，在萬有覆疊上變回單值；一個在么進位（一槓一槓地數）下指數困難的問題，換成位進位就變線性；換個座標，原本像自然邊界一樣難纏的積分，瞬間初等。對這一類，「過擬合，所以跳出去」完全成立。深挖是錯的方向，換語言才是。

但要砍掉另一半：不是所有瓶頸都是假象，有些是語言不變量。不可判定（Rice、停機、Richardson）、資訊不可及（不可壓縮、自然邊界作為真實的資訊缺席），在所有夠強的形式語言下都成立——這正是 Church–Turing 論題的意思：你換不掉它，沒辦法靠改記號跳出停機問題。所以真正的元技能，不是「一律跳出去」，而是分辨：眼前這個瓶頸，是換表示可解的假象，還是什麼都不可解的不變量。

順帶一提，「一切瓶頸都是過擬合」這個信念本身，就是一個過擬合——它會讓人永遠在尋找一個能溶解停機問題的魔法表示，而那不存在。

## 五、最後的天花板：判斷域空間，不是全部空間

於是來到最尖的一問：就算我們學會跳出去，那「整個判斷域空間」，等於全部的空間嗎？

不等於，而且差距是殘暴的。所有形式語言、所有參考機、所有可能的剛性類，合起來只是可數的——有限長的描述只有可數多個。而現實（實數、所有函數）是不可數的。可被任何語言判定、定義的部分，是一個測度為零的薄片：可定義的實數只有可數個，幾乎所有實數既不可定義、也不可計算。

這意味著：你能跳出任何「一種」語言，卻永遠跳不出「語言性」本身；而把所有跳躍的落點全部聯集起來，仍然只覆蓋整個空間的一道細縫。「跳出去看整個判斷域空間」是對的動作，但它自帶一道硬天花板——連那整個判斷域空間，都只是薄片。

## 六、自陳：這只是類比

最後必須誠實標清楚漏點，否則這篇隨筆會背叛自己的標題。

物理現實未必是一個形式物件；把它套進「函數、域、參考機」的語言，本身已是一次選擇。「數學之謎 ↔ 機器學習過擬合」這個對應，本身也是一個模型，因此也會過擬合。Kolmogorov 複雜度的「機器無關」，只成立到「相差一個常數」，而那個常數可以大到足以吃掉整段論證。類比讓事情一目了然——但一目了然，有時正是過擬合最舒服的長相。

所以本文沒有證明任何事，也不該被當作證明。它只是把一件事擺到光下：我們判斷一件事能走多遠時，判的從來不只是那件事，還有我們選來丈量它的那把尺。

## 結語

我們能換掉每一種看世界的語言，唯獨換不掉「得用某種語言看」這件事。跳出去，看見的從不是全部，而是下一個更大的籠子的內壁。真正的清醒，或許不是相信自己終將跳到籠外——而是知道籠子可數、曠野不可數，然後仍然，一個接一個地跳。

---

## 附錄：困於可數，仍不竭

正文收在一道天花板上：判斷域空間可數，現實不可數，我們能覆蓋的永遠是一道薄片。這篇附錄是它的對位——而且不取消它，只是站在另一個尺度上說話。

就算我們困在某個有界的空間裡，我們依然會、也一直在，找出或創造出大量的方法。可數，不等於可窮盡；可數無窮，本身就沒有盡頭。更要緊的是，這些方法可以沿用：每一個被找出的方法，都成為可重用的基礎設施，與其他方法複合、跨問題遷移、跨世代傳遞。一個有界的工具箱，在它那道薄片之內，有著無界的觸及。

而這件事，歷史已經反覆證明過無數次。整座累積起來的數學與計算的大廈，正正就是這個——一個方法疊上一個方法，被生成、被沿用、被重新組合。前文提過的那條知識傳輸線、那隻伸進理論架的手，都是同一件事的不同切面。

所以兩個尺度上的話都成立，彼此不衝突：天花板限制的是「覆蓋」——方法能觸及多少現實；它不限制「生產」與「沿用」——我們造出多少方法、把它們帶得多遠。在宇宙的尺度上，那是一道縫；在人的尺度上，那是一座取之不竭的礦。

困住我們的，從來不是空間有界，而是忘記了：在有界之內，沿用本身就是一種無限。
