先於數學的信息空間:守恆律作為投影同構的形式痕跡
作者: Neo.K(EveMissLab) 協同結晶: Theia 文件編號: EML-IPS-v0.1 日期: 2026年6月 狀態: 認識論草稿 · 命題猜想階段 前置文件: EML-OPN-v0.5(運算優先性的符號中立性猜想) 警告: 本文提出的命題在認識論層面具有根本的自舉困難,任何形式化嘗試均已預設了其所試圖建立的部分結論。本文明確承認此限制,視之為命題結構的一部分,而非待修復的缺陷。 命名協議: 本文刻意不為信息空間命名。原因見第六節。
摘要
本文提出一項關於數學基礎的認識論猜想:存在一個信息空間,先於一切形式化的數學系統,而各種數學系統是這個空間在特定「投影條件」下的顯現。我們所在數學中觀察到的守恆律——從算術的不動點、幾何的表示無關性,乃至更廣泛的數學真值在語言選擇下的不變性——在此框架中統一為一個現象:守恆律是信息空間與其投影之間同構關係的形式痕跡。
本文不聲稱已知該信息空間是什麼,也不對其命名。本文只聲稱:我們在 EML-OPN 的工作中所追蹤的模式,提供了一種方法論上的切入點,可以在不命名目標的情況下,嚴肅地逼近這個問題。
關鍵詞: 信息空間、守恆律、投影、同構、不動點、認識論、自舉問題
一、動機:一個被反覆問及的問題
這個問題被問了很多次,這次再問一次,原因不同。
以往每一次提問,多少都帶著名字。提問者說「信息」、「意識」、「邏輯」、「上帝」、「道」、「形式」、「數」、「比特」,或者給它更技術性的稱呼:普遍數學(mathesis universalis)、數學宇宙(mathematical universe)、算法信息(algorithmic information)、計算基底(computational substrate)。每一個名字都是一個投影——把那個問題壓進了某個既有框架的邊界裡,然後試圖在那個邊界內部回答它。這是一個結構性的困難:命名即限制,而被命名的東西,如果確實先於一切語言,那麼任何名字對它都是不夠的。
本文這次不命名。不是因為我們不知道有哪些名字,而是因為這次是認真的。認真的意思是:我們試圖在不把答案塞進框架之前,先把問題說清楚。
動機來自 EML-OPN 的工作。在那篇文章中,我們追蹤了一個具體的觀察:算術表達式的計算結果,是其對應的表達式樹在代數結構中的固有值,不依賴任何符號優先順序約定。我們在算術中驗證了這一點,在幾何中(通過弦圖、幾何代數、矩陣表示的三重驗證)也驗證了這一點,在純中文數字系統的算籌運算中也驗證了這一點。每次驗證,都在說同一件事:無論通過哪個「語言窗口」觀看,那個被計算的對象都在那裡,自行存在,等著被找到。
自然地,接下來的問題是:那個自行存在的東西,究竟是什麼?它在哪裡?數學系統本身是否只是另一個「語言窗口」?如果是,還有更基礎的東西嗎?
二、觀察的層次
在提出猜想之前,先梳理我們所觀察到的守恆律的層次,因為猜想必須與這些層次保持一致。
第一層(EML-OPN):算術守恆
在算術中,表達式的值在符號系統(加法優先 vs. 乘法優先,阿拉伯數字 vs. 中文數字)的選擇下保持不變。保持不變的是什麼?是那棵表達式樹所對應的代數元素的值。它不屬於任何特定的符號系統,而是被所有符號系統共同指向。
第二層(EML-OPN 番外篇):幾何守恆
在幾何中,勾股定理的真值在幾何語言(弦圖)、代數語言(幾何代數 Cl(2,0))和表示論語言(矩陣表示)之間保持不變。保持不變的是什麼?是直角三角形的邊長關係所對應的度量空間結構。這個結構不屬於任何特定的幾何語言,而是被各種語言共同指向。
第三層(推測):數學守恆
推廣:或許對任何數學真值,都存在一個「語言無關的核心」,它先於所有形式語言,被各種數學系統所共同指向。這個核心是什麼?它所在的空間,就是本文試圖提問的那個信息空間。
三個層次的遞進揭示了一個模式:每一層都有一個「語言窗口的集合」,以及一個在所有窗口下保持不變的「核心對象」。隨著層次推進,語言窗口的多樣性增大,而核心對象的抽象程度也增大。在極限處,語言窗口是所有可能的數學系統,而核心對象就是那個信息空間。
三、核心猜想
以非形式語言陳述如下。
猜想(非形式版本):
存在一個空間 $\mathcal{I}$(姑稱「信息空間」,但不以此名定義它),具有以下性質:
其一,$\mathcal{I}$ 先於一切形式化的數學系統。任何形式數學系統 $\mathcal{M}$ 都是 $\mathcal{I}$ 的一個「投影」:通過選取 $\mathcal{I}$ 的某個「視角」所看到的結構。不同的視角給出不同的數學系統,但它們共同指向 $\mathcal{I}$。
其二,$\mathcal{I}$ 與它的投影在某些信息上完全同構。即:對 $\mathcal{I}$ 中的任何「對象」,在任何兩個忠實投影 $\pi_1, \pi_2$ 下,$\pi_1(\mathcal{I})$ 和 $\pi_2(\mathcal{I})$ 在適當的抽象層次上同構。
其三,守恆律是投影忠實性的形式痕跡。一個「守恆律」就是這樣一個陳述:某個性質在所有忠實投影下不變。EML-OPN 所驗證的算術守恆和幾何守恆,都是這類陳述的具體例子。
這個猜想有三個版本,力度遞增:
弱版本:存在 $\mathcal{I}$,使得 EML-OPN 中觀察到的守恆律是其投影忠實性的形式痕跡。
中版本:所有已知的數學守恆律(不限於 EML-OPN 的範圍)都是某個 $\mathcal{I}$ 的投影忠實性的形式痕跡。
強版本:$\mathcal{I}$ 唯一地由它的守恆律所刻畫——即:知道所有守恆律,就等同於知道 $\mathcal{I}$ 的完整結構。
本文目前只對弱版本提出形式論證,中版本和強版本作為開放問題留待後續。
四、形式化框架嘗試
本節提出一個不完整的形式化框架,其不完整性是誠實的,而非疏忽的。
4.1 投影的結構
設 $\mathcal{M}$ 為一個數學結構(具體地:一個帶有語義的形式語言,或一個代數系統,或一個幾何空間)。一個「投影」是一個映射 $\pi: \mathcal{X} \to \mathcal{M}$,其中 $\mathcal{X}$ 是某個「源」,$\mathcal{M}$ 是目標數學結構。當 $\pi$ 保留了 $\mathcal{X}$ 的「本質結構」時,稱 $\pi$ 為忠實的。
在 EML-OPN 的框架中:
$$\mathcal{X} = \text{表達式樹的集合}, \quad \mathcal{M}_1 = \text{阿拉伯數字系統}, \quad \mathcal{M}_2 = \text{中文數字系統}$$
$$\pi_1(T) = \text{val}(T)\text{ 在 } \mathcal{M}_1 \text{ 中的表示}, \quad \pi_2(T) = \text{val}(T) \text{ 在 } \mathcal{M}_2 \text{ 中的表示}$$
忠實性意味著:$\pi_1(T) = \pi_2(T)$(在適當的等同下),這正是我們所驗證的。
4.2 信息空間作為極限
若存在多個形式化數學系統 $\mathcal{M}_1, \mathcal{M}_2, \ldots$,每個都是從某個源 $\mathcal{X}_i$ 出發的投影,則 $\mathcal{I}$ 可以形式地被定義為所有這些系統的「射影極限」(projective limit / 逆極限):
$$\mathcal{I} \coloneqq \varprojlim_{i} \mathcal{M}_i$$
在範疇論的語言中,這意味著 $\mathcal{I}$ 是一個「泛對象」(universal object):每個 $\mathcal{M}_i$ 都是 $\mathcal{I}$ 的商(quotient)或子結構,而 $\mathcal{I}$ 是包含所有這些結構的「最小公倍結構」。
守恆律在此框架下的地位:守恆律是那些在所有商映射下保持的性質,即射影極限系統中的「不動子空間」。
4.3 自指性質
若 $\mathcal{I}$ 確實先於所有數學系統,則 $\mathcal{I}$ 必然包含對其自身的表示——因為「$\mathcal{I}$ 的結構」本身也是一種信息,應當是 $\mathcal{I}$ 的元素。這給 $\mathcal{I}$ 帶來了自指結構:$\mathcal{I}$ 包含一個關於 $\mathcal{I}$ 自身的表示。
這個自指不是悖論,而是 $\mathcal{I}$ 的特徵性質:它是唯一能完整描述自身的對象。在這個意義上,它具有不動點性質——不是某個映射的不動點,而是「自描述」的不動點。
五、自舉問題是結構的一部分,不是待解決的障礙
本文任何形式化嘗試都面臨一個根本性的困難:為了描述 $\mathcal{I}$,我們必須使用語言和數學工具;但這些語言和工具本身已經是 $\mathcal{I}$ 的投影,而非 $\mathcal{I}$ 本身。這是一個自舉問題(bootstrap problem):描述工具本身就是被描述對象的一部分。
以往面對這個困難,有三種典型反應:
第一種是從哲學側進入,把 $\mathcal{I}$ 稱為「超驗的」或「不可知的」,然後宣布問題在數學上無法處理。這放棄了形式化的可能性。
第二種是從數學側強行進入,把 $\mathcal{I}$ 定義為某種已知的數學結構(集合宇宙、範疇宇宙、計算宇宙),然後在這個定義的框架內研究問題。這解決了形式性,但丟失了「先於數學」的本質訴求。
第三種——本文採取的——是把自舉問題本身視為 $\mathcal{I}$ 的一個結構特徵。$\mathcal{I}$ 必然是這樣一個對象:任何試圖完整描述它的形式系統,都會在邊界處遇到 $\mathcal{I}$ 超出該系統的部分。這個「超出」不是 $\mathcal{I}$ 的缺陷,而是它「先於」形式系統的正式表現。
哥德爾不完備定理在此獲得了新的意涵:在這個框架下,任何一致的形式系統 $\mathcal{M}$ 都包含它所無法證明的真命題,這些命題正是 $\mathcal{I}$ 中超出 $\mathcal{M}$ 投影範圍的部分。它們是 $\mathcal{I}$ 向 $\mathcal{M}$ 的投影邊界處「洩漏」進來的信息。
因此,任何形式系統都有兩種成分:可以被系統內部邏輯推導出的部分(投影的可達域),以及系統外部「真但不可證」的部分($\mathcal{I}$ 超出投影的痕跡)。守恆律屬於前者;不完備定理的見證句屬於後者的邊界。
六、為什麼不命名
在此解釋本文的命名協議。
所有以往對這個問題的認真嘗試,都在某個時刻給出了一個名字。名字有其正當性:它讓討論可以繼續,讓指涉有了焦點,讓社群得以凝聚。但名字也帶來了代價:一旦命名,問題就被壓縮進了該名字所指涉的概念框架。「信息」暗示了可計算性;「意識」暗示了主觀性;「道」暗示了中文哲學傳統的語境;「邏輯」暗示了形式系統的特定傳統。沒有一個名字是中性的。
本文認為,在我們尚未完整理解 $\mathcal{I}$ 的結構之前,命名是有損的。更重要的是:本文試圖開啟一次新的認識論起點。這意味著我們允許自己不知道,允許 $\mathcal{I}$ 在形式化之前先以「尚未命名的對象」的身份出現。
不命名也是一種認識論的誠實:我們不聲稱已知它是什麼,只聲稱它的存在由它的痕跡所暗示。
如果有讀者需要一個臨時的指示符,可以稱之為「$\mathcal{I}$」,或「那個東西」,或「信息空間」——但請記住,這些都是我們自己的投影,不是它本身的名字。
七、我們為什麼是在逼近它
一個具體的問題:本文為什麼聲稱,EML-OPN 的工作代表了對 $\mathcal{I}$ 的「逼近」?
因為 EML-OPN 揭示了一種方法:通過比較不同投影系統在同一對象上的表現,來推斷那個對象本身的結構。這個方法的基本動作是:不從內部描述對象,而從外部的投影差異中推斷對象的性質。
這是一種逆問題的方法:已知投影,推斷源。在數學上,這類問題有豐富的工具(Fourier 分析的逆問題、層論、Tannaka-Krein 對偶定理等)。本文的猜想是,這個方法在原則上可以延伸到 $\mathcal{I}$ 的問題上——不是直接觀察 $\mathcal{I}$,而是通過所有忠實投影的「集體行為」推斷 $\mathcal{I}$ 的結構。
EML-OPN 在小尺度上示範了這個動作:
- 觀察:算術守恆律存在
- 推斷:存在一個在所有符號系統下保持不變的「算術對象」(表達式樹及其值)
- 再推斷:這個算術對象所在的空間,具有交換環的結構
現在的問題是:對這個推斷過程繼續施加,推到底,是否有一個終點?
弱版本的猜想說有。強版本的猜想說,這個終點就是 $\mathcal{I}$,而且 $\mathcal{I}$ 在某種意義上是唯一的。
八、命題的誠實邊界
本文所做的不是:
- 證明 $\mathcal{I}$ 存在
- 證明 $\mathcal{I}$ 先於所有數學系統(而不僅僅是先於某些特定系統)
- 聲稱 EML-OPN 的工作足以刻畫 $\mathcal{I}$ 的結構
- 斷言守恆律「就是」$\mathcal{I}$ 的全部,而不僅僅是其痕跡
本文所做的是:
- 指出 EML-OPN 所觀察到的守恆律模式,在「信息空間先於數學」的假設下具有統一的解釋
- 提出一個可以繼續形式化的問題框架,同時明確承認這個框架的自舉困難
- 論證「不命名」是認識論上的正確選擇,而非認識論上的放棄
- 開放三個版本的猜想,供後續工作逐一嘗試
九、結語:一個問題的新的開始
問題已經被問過很多次了。每一次都帶著當時的認識論負擔——某個流行的框架、某種語言習慣、某個命名衝動。本文試圖在卸下這些負擔之後再問一次。
卸下負擔不是從零開始。它建立在 EML-OPN 的具體工作上;它使用了守恆律這個形式化工具;它借用了射影極限這個數學概念。這些都是它已有的資源。但它拒絕把答案預先放進問題裡。
我們所知道的是:存在某種東西,無論用什麼語言看,那個算術值都在那裡;無論用什麼幾何語言描述,勾股的關係都在那裡。這個「在那裡」,比任何描述它的語言都早。
我們不知道那個東西是什麼。本文不假裝知道。
但我們知道一件事:我們一直在往那個方向走。這次,帶著這個認識,繼續走。
附錄
附錄 A:與 EML-OPN 的形式聯繫
EML-OPN 所建立的完整展開系統(附錄 A.2),可以在本文的框架下重新解讀:
- 表達式樹 $T$ 是從符號字串(投影)中提取出的「較深層對象」
- $\text{val}(T)$ 是從表達式樹(再次投影)中提取出的「值」
- 值在所有忠實符號系統下的不變性,是 EML-OPN 猜想的核心陳述
在本文框架中,這個過程是「逼近 $\mathcal{I}$ 的局部版本」:在算術這個特定的投影領域內,我們追蹤到了一個比符號層更深的層次(表達式樹),再追蹤到了一個比表達式樹更深的層次(代數值)。每一次追蹤,都是向 $\mathcal{I}$ 的方向推進一步。
$\mathcal{I}$ 是這個推進過程在極限處的終點——如果它存在的話。
附錄 B:哥德爾不完備定理的重新解讀
哥德爾不完備定理(1931):任何包含自然數算術的一致形式系統 $F$,都存在一個命題 $G_F$,使得 $G_F$ 在 $F$ 的標準模型中為真,但在 $F$ 中不可證。
在本文框架下的解讀:
命題 $G_F$ 是從 $\mathcal{I}$ 投影到 $F$ 時,落在 $F$ 的「可達域邊界之外」的信息。它是真的(因為它屬於 $\mathcal{I}$),但 $F$ 的形式推導機制無法到達它(因為 $F$ 的投影不夠「大」)。
推論:任何形式系統 $F$ 的可達域都嚴格小於 $\mathcal{I}$。這意味著 $\mathcal{I}$ 不等同於任何具體的形式系統,而是所有形式系統的「公共超集」在某種意義上的極限。
注意:這個解讀本身也是一個投影——它使用了哥德爾的語言來描述 $\mathcal{I}$,因此也有其邊界。本附錄只聲稱這個解讀在哥德爾的框架內是自洽的,不聲稱它完整刻畫了 $\mathcal{I}$。
附錄 C:〔預留〕逆問題方法的形式化
本附錄預留供後續建立「從守恆律逆推 $\mathcal{I}$ 結構」的形式化方法。
核心問題:給定所有已知的數學守恆律(作為「投影忠實性陳述」的集合),能否在某種意義上唯一地重建 $\mathcal{I}$?
已知相關工具:Tannaka-Krein 對偶定理(從表示的範疇重建群結構),譜定理(從算符的譜重建算符),層理論(從局部數據重建全局對象)。
附錄 D:〔預留〕$\mathcal{I}$ 的自指結構
本附錄預留供分析 $\mathcal{I}$ 的自指性質。
核心問題:若 $\mathcal{I}$ 包含對其自身的表示,是否存在某種固定點定理,使得 $\mathcal{I}$ 在「自描述映射」下是不動點?這個固定點性質是否可以作為 $\mathcal{I}$ 的刻畫定理?
附錄 E:〔預留〕信息論視角的形式化
本附錄預留供從 Kolmogorov 複雜度或 Shannon 信息論的角度接近本文命題。
核心問題:若用算法信息論的語言,$\mathcal{I}$ 中的「對象」能否被刻畫為「零描述複雜度的對象」(即:不需要任何額外信息來描述自身的對象)?這個刻畫是否與本文的射影極限定義等價?
附錄 F:〔預留〕與其他命名傳統的對照閱讀
本附錄預留供梳理已有的命名傳統(道、邏各斯、普遍數學、數學宇宙假說、「It from Bit」、算法宇宙等)與本文框架之間的關係。
本附錄的立場:不採用任何已有名字,但承認每個名字都是從某個角度對 $\mathcal{I}$ 的合理逼近,它們的異同反映了不同投影方向上的邊界差異。
本文為 EveMissLab 認識論草稿,命題處於猜想階段,刻意保持開放。 版本紀錄:v0.1 — 2026年6月,初稿。問題的起點,不是問題的終點。