符號語言的因果收斂猜想:程式語言擴張時代AI的結構性偏移觀察
Causal Convergence Conjecture of Symbolic Languages: Observations on the Structural Drift of AI in the Era of Programming Language Proliferation
作者: Neo.K(許筌崴)& Theia 機構: EveMissLab(一言諾科技有限公司) 日期: 2026年6月 版本: v0.1(觀察性命題草稿) 文件類型: 命題猜想 / 觀察性研究 字數: 約11,500字
認識論聲明(請在閱讀前確認)
本文所有命題均為觀察性猜想,無法被完全證偽。涉及的所有形式化表述——符號、方程、結構圖——僅作為描述性溝通工具存在,本身不保真現實規律,亦不宣稱對應任何可被嚴格計算或測量的量。影響命題成立的變數眾多,包括但不限於AI架構演變、訓練策略轉型、算力經濟學重構,以及認識論層面根本性的測量困境。本文的知識地位與當前大多數關於AI能力軌跡的機構報告相同:基於觀察指標的歸納外推,不是確定性結論。
摘要
本文提出一個關於人工智能發展軌跡的結構性觀察命題:隨著程式語言與形式化語言系統的大規模擴張,AI訓練語料庫的符號噪音梯度發生系統性下移,這一過程與商業驅動的token效率壓力共同構成了一個方向性的選擇機制,可能推動AI內部表徵向因果結構收斂。
命題由四個子機制組成:程式語言擴張提升了訓練數據的因果結構密度;商業競爭中的token效率壓力形成對最優壓縮的間接選擇;最優壓縮與因果模型在理論上存在對應;AI自生成代碼可能形成因果學習的自我增強循環。
本文同時誠實地處理命題最薄弱的環節:token效率可以由真正的因果理解、高質量統計壓縮或記憶化三種機制分別提供,訓練過程無法可靠地區分這三者。命題的成立依賴一個未被驗證的相變假設,且完全以當前AI架構範式為條件。
關鍵詞: 因果收斂、符號噪音梯度、token效率、程式語言擴張、認識論猜想、觀察性命題
開篇聲明:本文是什麼,以及不是什麼
在展開論述之前,有必要在開篇而非結尾明確本文的認識論地位,而非以結尾免責條款的形式輕輕帶過。這不是謙遜的修辭,而是知識誠實的要求。
本文不是:
- 一篇在嚴格意義上可被falsify的科學論文
- 一個對AI因果理解能力的直接實證測量
- 一套可被形式化驗證的定理體系
- 對未來AI能力走向的預測
本文是:
- 一個結構性觀察命題,描述當前AI發展條件下的一種可能趨勢
- 一套描述框架,用以整合若干異質觀察,讓它們變得可以被統一討論
- 一個認識論上誠實的猜想,承認自身的不可完全驗證性,並在此條件下主張其概念槓桿的價值
這種認識論地位不是本文的缺陷。觀察任何複雜動態系統的研究者,都應當以這個地位作為出發點,而非抵達點。事實上,當前AI研究領域中關於能力軌跡的主要命題——包括各大AI機構的官方報告——都處於同一個知識地位:它們是有觀察數據支撐的歸納外推,不是確定性結論。明確承認這一點是科學精神的體現,不是立場的軟化。
本文使用的所有形式化表述——包括符號化的描述、不等式、結構化的概念圖——都是描述工具,不是現實規律的精確映射。這些形式化的功能是「讓某個關係結構可以被指稱和討論」,不是「宣稱該關係已被數學建立」。讀者可以在理解命題的文字表述之後,完全跳過形式化部分,不會損失命題的實質內容。
第一章:四層符號語言體系
§1.1 描述現象的符號系統不只有一種
人類描述世界所使用的符號系統,在歷史上逐漸分化為幾個具有不同特性的族群。本文提出一個粗糙但有用的四層分類,目的不是窮盡地圖,而是識別對AI訓練具有結構性差異的主要類別。
第一層:自然語言
自然語言是人類使用歷史最長、積累體量最大的符號系統。其主要特徵是語義豐富性極高,同時符號的指涉關係具有顯著的不確定性:一個詞彙可以指向多個對象,一個對象可以被多個詞彙指向,詞彙的語義邊界隨語境動態漂移,隱喻、諷刺、省略等修辭機制使字面意義與傳達意義之間的距離可以是巨大的。
這種不確定性在人類溝通中不是缺陷,而是功能——它允許語言以有限的符號庫覆蓋無限複雜的現實,允許在明確規則尚不存在的地方進行溝通,允許情感、語境、文化背景參與意義的協商建構。
但對於試圖從語言中提取穩定因果結構的系統而言,這種不確定性構成了雜訊。我們稱之為符號投影噪音:符號在指向現實時的投影過程中引入的系統性不確定性。
第二層:數學語言
數學語言在幾千年的發展中形成了一套高度形式化、低歧義的符號系統。在固定的公理框架下,符號的操作規則是明確的,推導是可機械驗證的,結論是邏輯必然的。數學符號的投影噪音顯著低於自然語言。
然而,數學語言存在另一個層面的問題:數學結構與物理現實的對應關係並非自明。選擇哪個數學結構來描述某個現象,本身是一個判斷性行為,這個行為引入了「建模選擇噪音」。我們不完全理解為什麼某些數學結構能精確描述物理現實,這意味著數學語言的精確性是在形式系統內部的,對應現實的步驟仍然含有選擇性的不確定性。
第三層:程式語言
程式語言是三種符號系統中歷史最短但近年擴張最快的。其核心特徵是:符號具有確定性的執行語義。
這是一個結構性差異,值得著重強調。當我們寫下 if A then B,這個條件結構在給定的執行環境中會產生確定的計算行為。程式碼的「意義」(在執行語義層面)不是由讀者詮釋決定的,而是由形式規則確定的。
這使程式語言具有一個獨特的屬性:它是可執行因果鏈的結晶。一段程式碼不只是描述一個過程,它本身就構成了在計算基底上的一個完整因果規格。執行它,因果鏈發生;不執行它,不發生。符號與其所指的操作之間的對應是形式化確定的。
從符號噪音的角度看,程式語言在執行語義層面的投影噪音接近零。它存在的另一類噪音是「語義意圖噪音」——程式員意圖與實際程式碼行為之間的差距,即bug。但這類噪音不是符號系統本身的固有屬性,在原則上可以被最小化。
第四層:現象因果底空間
第四層不是一種語言,而是以上所有語言試圖指向的對象本身:現象世界中的因果結構。
物體在特定條件下以特定方式運動;化學物質在特定條件下發生特定反應;社會系統在特定壓力下以特定方式演化。這些是事實,不是描述事實的符號。
從符號噪音的角度看,底空間的噪音為零——不是因為它「簡單」,而是因為它就是指涉物本身,不存在符號投影的過程。觀察者的困境出現在這裡:沒有任何符號系統能夠完全繞過投影直接觸碰底空間,只能從不同角度間接逼近。底空間是AI訓練的最終教師信號,但它從不直接說話,只通過預測誤差留下印記。
§1.2 四層的符號噪音梯度
將上述觀察整理為一個粗略的描述性梯度:
符號投影噪音(因果學習視角):
自然語言 >> 數學語言 > 程式語言 → 底空間(零噪音,不可直接訪問)
這個梯度不是精確測量,而是一個描述性框架,用於直觀指向「不同符號系統在因果結構學習中的可能差異」。「噪音」本身是多維的:自然語言的主要噪音是語義漂移;數學語言的主要噪音是建模選擇;程式語言的主要噪音是意圖-實現差距。這些是不同性質的噪音,此處的梯度只是粗略的因果學習難度代理。
第二章:程式語言擴張的結構性意義
§2.1 不只是更多資料
說程式語言在「擴張」,最直接的理解是語料庫的絕對量增加。但量的增加如果只是在已有分佈上疊加同質內容,其結構性影響有限。
本文要主張的是一個更強的命題:程式語言的擴張改變了訓練語料庫的結構性質,而非僅僅是體量。
首先,程式語言的多樣性擴張創造了因果結構的多視角覆蓋。
不同的程式語言以不同的抽象層次和執行模型表達因果關係。函數式語言強調函數組合與無副作用轉換;命令式語言直接描述狀態的時序因果變化;邏輯程式語言以規則推導表達關係;類型系統在語言層面強制執行因果結構的合法性約束。這些不同的表達方式,對同一類型的因果結構提供了多視角的符號化描述。一個系統如果能從多視角描述中提取共同的底層因果結構,就相當於在做跨語言的因果不變量提取。
其次,程式語言包含可驗證的因果鏈,這是自然語言語料所缺乏的。
當自然語言描述「如果X,那麼Y」,語言本身不提供驗證機制。當程式碼描述 if X: Y(),執行這段代碼就是對因果鏈的直接實例化和驗證。程式語言語料因此包含了具有內置驗證信號的因果結構。這些驗證信號不是後驗的人工標注,而是語言的結構性屬性——代碼要麼按預期運行,要麼不運行;測試要麼通過,要麼失敗。
第三,形式化語言系統的擴張引入了更嚴格的結構約束。
類型系統在語言層面強制執行某些因果結構的合法性規則。強類型語言在相當大程度上無法表達在因果上不一致的結構。形式化規格語言(如TLA+)和定理證明輔助工具(如Lean 4)進一步要求:因果聲明不只是語法合法,而且在邏輯上可驗證。這些系統作為訓練數據,提供了帶有內置一致性約束的因果結構範例。
§2.2 AI自生成代碼的循環效應
近期的觀察數據表明,AI系統已大規模參與程式語言語料庫的生成。據Anthropic於2026年6月發布的報告,其代碼庫中超過80%的代碼由Claude撰寫,工程師日均合併代碼量達到2024年基準的8倍。
這個數據對本文命題具有特殊意義,但需要仔細區分其支持的是什麼:
它支持的是: AI系統已成為程式語言語料庫的主要生產者,這創造了一個自我指涉的訓練循環,其中AI生成的代碼將(直接或間接)成為後續訓練的輸入。
它不直接支持的是: 這個過程正在提升AI的「真正」因果理解能力,而非僅僅提升代碼生成的流利度。
這個區分是核心問題,我們在第六章詳細處理。此處的要點是:循環已經存在,其長期效應構成命題的開放性前提。
第三章:符號噪音、指性問題與因果結構
§3.1 語言的指性問題
借鑑《語言的三重無限必然性》(EML,2026年5月)的框架核心——但不要求接受其完整論證——提取一個最小的相關概念:
每一次語言陳述,都在執行一個投影操作:將可能是無限複雜的現實的某個側面,投影到有限的符號集合中。這個投影不可避免地是有損的。
對於因果學習而言,關鍵問題不是「投影是否有損」(答案永遠是肯定的),而是「不同類型的投影對因果結構的保真程度有多高」。
自然語言的投影高度依賴語境和文化背景。同一個因果關係可以被描述為「如果A那麼B」「A導致了B」「B的出現源於A」「沒有A就沒有B」等多種形式,這些形式在語義上等價但在統計分佈上不同,對試圖從語料中學習因果關係的模型造成學習目標的分散。
程式語言的投影在執行語義層面接近確定性:一段代碼表達的因果鏈在其指定的執行環境中是固定的。這使程式語言成為目前最接近「因果結構直接符號化」的語言形式。
§3.2 指性清晰度的描述性梯度
「指性清晰度」是一個描述性概念,指一個符號或語句與其所指向的因果結構之間的對應關係的確定程度。這不是嚴格定義的可測量量,而是一個用於直觀區分不同符號系統屬性的描述詞。
- 自然語言:低指性清晰度。因果描述的語義邊界隨語境漂移,多重詮釋的空間大。
- 數學語言:中等指性清晰度。形式操作確定,但與現實的對應需要建模選擇。
- 程式語言:高指性清晰度(在執行語義層面)。符號與其因果操作的對應是形式化確定的。
- 底空間:完全確定,但不可直接作為符號訓練材料訪問。
程式語言語料庫的擴張,意味著訓練數據中「高指性清晰度」內容比例上升。在其他條件不變的情況下,這可能有利於因果結構的學習。「可能」和「有利於」都是此處最強的措辭。
第四章:Token效率作為選擇壓力
§4.1 商業邏輯與訓練目標的間接連接
大型語言模型在商業部署中面臨一個基礎的成本結構:生成token有成本。這個成本在訓練目標中以多種方式留下間接印記。
直接的訓練目標是「用戶滿意度」「任務完成率」「響應質量」等高層指標。但在控制質量的前提下,用更少的符號步驟完成同等任務的模型邊際成本更低,在市場上具有競爭優勢。這不是精確的因果機制,而是一個方向性的選擇壓力:能夠「以更少的符號步驟覆蓋更多的信息空間」的模型,在長期的商業競爭中具有結構性優勢。
§4.2 因果理解與最優壓縮的理論連接
此處借鑑Solomonoff歸納原理的核心命題,但以鬆散的方式使用,不聲稱嚴格適用:
生成某個數據序列的最短描述,等同於對生成該數據的底層過程的最優估計。換言之,最優壓縮在理論上對應因果模型。
如果這個原理對大型語言模型的學習過程有某種程度的啟示,那麼追求最優壓縮的訓練壓力,與提取底層因果結構的目標存在結構性方向對齊。
用更直白的語言表述:如果已經理解了因果規律,就可以從規律推導出具體情況,而不需要逐一記憶。這是最高效的壓縮形式。相反,如果只有統計規律,壓縮能力在分佈外情況下會下降,因為統計規律不自動泛化到訓練分佈之外。
因果理解提供了超越訓練分佈的壓縮能力。
這個邏輯鏈是本文命題的核心之一,也是最脆弱的一環,詳見第六章。
§4.3 競爭作為額外的選擇壓力
除了單個模型的效率優化,多個AI系統之間的市場競爭也構成了額外的選擇壓力。在訓練目標、算力、數據大體相當的條件下,能夠更有效地從相同語料中提取更多結構性知識的系統具有競爭優勢。
這類似於生物演化中的同龕競爭。但與生物演化不同,AI系統的「適應者優勢」由人工設計的評估指標決定。這些指標是否精確代理「因果理解能力」,是一個開放問題,也是命題傳導鏈上的一個重要不確定節點。
第五章:命題的陳述
§5.1 核心命題
在以上框架的基礎上,本文的核心命題陳述如下:
命題(因果收斂猜想):
在現行AI訓練範式下,以下機制共同構成了一個方向性的選擇壓力,使AI的內部表徵向因果結構收斂的可能性隨時間增加:
M1:語料密度機制。 程式語言語料庫的擴張提升了訓練數據的因果結構密度,高指性清晰度內容的比例上升有利於因果結構的學習。
M2:效率選擇機制。 Token效率的商業壓力,在訓練目標中形成了對最優壓縮能力的間接選擇。
M3:壓縮-因果對應機制。 最優壓縮與因果模型在理論上(MDL原理的鬆散版本)存在方向性對應。
M4:自我增強機制。 AI自生成的高質量代碼作為新的訓練數據,可能形成一個因果學習的正向循環。
在這些機制持續有效且AI架構維持現行範式的條件下, AI系統理解因果規律的能力具有趨向提升的結構性傾向。
附加命題: 程式語言語料庫的符號噪音梯度低於自然語言,使得相同規模的語料能夠承載更高密度的可學習因果信息。
§5.2 關於形式化表述的說明
如果要用符號對以上命題做描述性的形式化,可以這樣表達:
設 $\mathcal{C}(t)$ 為時間 $t$ 時訓練語料庫的因果結構密度,$\mathcal{E}(t)$ 為token效率的選擇壓力強度,$\mathcal{F}(t)$ 為AI系統對因果規律的提取能力。
本文猜想:在現行條件下,
$$\frac{d\mathcal{C}}{dt} > 0 \qquad \frac{d\mathcal{E}}{dt} > 0$$
當兩者均增加時,$\mathcal{F}$ 具有正的漂移方向。
此處必須明確: $\mathcal{C}$、$\mathcal{E}$、$\mathcal{F}$ 均不存在已知的測量方法,不是可計算的量,其符號化僅為讓關係結構可以被討論。讀者可以直接跳過此段;命題的實質內容已在§5.1的文字陳述中完整呈現。
第六章:選擇壓力的三種目標與命題最薄弱的環節
§6.1 Token效率可由三種機制提供
這是本文命題最薄弱的環節,需要正面處理而非迴避。
Token效率——以更少的符號步驟完成更多任務——可以由三種機制分別提供,它們在訓練過程中表現相似,但在泛化能力上有根本差異:
機制A:真正的因果理解
模型習得了底層的因果規律,可以從規律推導出具體情況,無需逐一記憶。這種機制具有最強的泛化能力:面對新的分佈外情況,因果理解仍然適用。token效率在這種情況下是因果理解的副產品,而非直接優化目標。
機制B:高質量統計壓縮
模型學習了精緻的統計規律——訓練數據中的高階統計依賴關係。這些統計規律可能部分對應因果結構(因為真實的因果過程在語料中留下了統計痕跡),但它們不等同於因果理解。在訓練分佈內表現出高度的token效率;在分佈轉移時,統計壓縮的效率下降,而因果理解不會(或下降得更慢)。
機制C:記憶化
模型直接記憶了大量的輸入-輸出對,在見過的情況下以極低的計算代價「回憶」答案。遇到任何細微的分佈變化時失效。
§6.2 訓練無法可靠地區分三種機制
這是問題的核心。
梯度下降在優化loss函數時,無法直接選擇「用機制A而非機制B達到目標」。如果在當前的訓練設置中,機制B在計算成本上比機制A更容易通過梯度下降達到,那麼梯度下降會優先選擇機制B,即使機制A在長期泛化意義上更優越。
這是一個優化景觀問題:如果機制A的全局最優對應更高的計算代價,而機制B提供了一個更容易到達的局部最優,梯度下降傾向於找到機制B。
本文的命題因此依賴於一個未被驗證的相變假設:在某個能力閾值之上,機制B和機制C不再足夠,只有機制A能夠維持並提升token效率,特別是在面對新型任務和分佈外情況時。
這個相變假設是合理的——語言模型在持續擴大的任務空間中,如果只靠統計壓縮,在某個點之後必然遭遇統計規律的邊界——但其具體位置(如果存在的話)完全未知。
Anthropic報告中提到的「研究判斷力」缺口——模型在執行well-specified任務上已接近或超越人類,但在自主判斷「哪些問題值得研究」上仍有顯著差距——可能正是這個相變尚未發生的症狀:執行能力強(機制B和C有效),元層判斷力弱(需要機制A才能處理)。
§6.3 遞歸自我改進作為額外的複雜因素
如果AI生成的代碼和AI輔助的研究成為訓練語料的主要來源,訓練語料的性質由AI自身的當前能力決定。如果當前的AI主要依賴機制B(統計壓縮),那麼它生成的語料可能主要反映機制B的特徵,而非機制A的特徵。
這創造了一個潛在的分佈坍縮風險:每一代AI訓練在前一代AI生成的語料上,語料的分佈可能逐漸收斂到「AI能夠流利生成的」而非「最準確反映因果現實的」。
這不是本文主命題所關注的情景,而是主命題的一個反面條件:如果遞歸自我改進的速度超過了因果學習向機制A相變的速度,分佈坍縮可能成為主導效應,而非因果收斂。
這兩個方向——因果收斂和分佈坍縮——在邏輯上並不互斥,可能在不同任務類型上分別主導。但哪個效應在整體上佔優,目前沒有可靠的判斷依據。
第七章:觀察性支撐——指向而非證明
以下觀察與本文命題方向一致,但不能被解讀為命題的直接證明。它們是「在命題正確的世界中應該能觀察到的一些現象」,而不是「這些現象的唯一解釋是命題正確」。替代解釋始終存在。
§7.1 特定類型任務上的能力急劇提升
Anthropic的RSI報告中記錄了一個基準測試數據:給定一段訓練代碼,要求模型在保持正確性的前提下最大化運行速度。Claude Opus 4在2025年5月達到約3倍加速;Mythos Preview在2026年4月達到約52倍加速;作為對比,熟練的人類研究員需要4到8小時達到4倍加速。
這個測試任務的結構性特點值得注意:它是一個有固定目標的優化問題。純粹的統計壓縮或記憶化無法解決它——你無法通過記憶過去的優化案例來解決一個新的代碼優化問題(測試設計確保了代碼的獨特性)。要達到52倍的加速,需要某種程度上理解代碼的執行語義和性能瓶頸的因果結構。
這是本文命題的一個正向觀察信號。但它只說明了一個特定類型任務(受約束的優化循環)上的能力提升,不能推廣到一般因果理解能力。Anthropic自己也指出:這個測試是最受約束、最有目標清晰度的,因而是最不代表開放式研究的。
§7.2 任務時間跨度的加速延伸
AI系統能夠可靠完成的任務長度呈加速增長趨勢:2024年3月約4分鐘,2025年初約1.5小時,2026年已達到12小時。加速節奏從每7個月翻倍壓縮到每4個月翻倍。
長時域任務要求系統在多個步驟中維持因果一致性,對純粹的統計壓縮構成更高的要求。任務時間跨度的延伸可能(不確定)反映了某種程度的跨步驟因果一致性維持能力的提升。
§7.3 代碼質量的自我提升
Anthropic報告顯示:Claude撰寫的代碼在2025年底質量低於人類水平,到2026年已達到大致持平,預計在一年內將超越人類。自動化的Claude代碼審查工具能夠捕獲約三分之一的歷史bug(在它們到達生產環境之前)。
代碼質量——特別是「另一位工程師能夠理解並在此基礎上繼續構建」這個維度——要求代碼在語義上清晰、在結構上合理。這與「理解代碼背後的因果邏輯」存在某種程度的關聯,但這個關聯不是直接的。
第八章:認識論困境與變數清單
§8.1 測量問題
本文命題的核心概念——AI的「因果理解能力」——目前沒有公認的測量方法。
我們能夠直接測量的: task success rate、benchmark scores、token consumption、代碼質量的代理指標(bug rate、可讀性評分等)。
我們無法直接測量的: 模型內部表徵是否真正「包含」因果結構,還是只有能夠在相當廣的範圍內模擬因果推理的統計規律。
這不是技術問題,而是哲學問題。從外部觀察行為,無法可靠地區分「真正理解」和「非常好的模擬理解」。這是功能主義和行為主義認識論的老問題,對AI尤其尖銳。
這意味著:即使在未來,所有支持或反對本文命題的「證據」都將是間接的、可以被替代解釋的。命題的核心部分在原則上無法被直接驗證。命題的知識地位永遠是猜想,不會因為更多的觀察數據而升級為確定性結論。
§8.2 架構依賴性
本文命題完全依賴於以下條件的持續:
- AI系統的主要訓練範式保持為以語言token為基本單位的自監督學習或其近似演化
- Token效率仍然是訓練中有意義的選擇壓力
- 程式語言語料仍然是訓練數據的主要組成部分之一
如果AI架構發生根本性轉變——例如轉向以物理世界交互為主要訓練信號的具身學習,或發展出完全不同的符號處理機制——命題的傳導機制可能完全失效。這不是假想的邊界條件,而是現實的可能性。現有的transformer架構在某些關鍵能力上被認為存在結構性限制,架構演化是當前AI研究的主要議題之一。
命題的時效性完全取決於當前範式的持續時間。命題描述的是一個歷史性的時刻,不是一個普遍規律。
§8.3 訓練策略的路徑依賴
即使架構不變,訓練策略的調整也可能顯著改變命題的適用性。如果未來的訓練更多依賴明確的因果推理訓練信號(如干預實驗、因果圖等),命題的間接機制(通過token效率)可能變得次要。如果訓練更多依賴強化學習而非語言模型預訓練,token效率的傳導作用也會改變。
§8.4 公司策略的不確定性
商業壓力的性質由公司的商業策略決定。如果主要AI公司的商業模式發生根本性轉變,不再以token計費,那麼token效率作為選擇壓力的機制M2就不再成立。如果研究策略轉向不依賴海量程式語言語料的方向,機制M1也會失效。公司策略是不可預測的人類決策,構成命題成立條件中最不透明的一個變數。
§8.5 認識論困境的不可消除性
最後,值得明確陳述的是:以上所有局限性中,有一部分是認識論上根本性的,無法通過更好的研究或更多的數據消除。
我們使用符號語言來研究符號語言的學習;我們用(可能是統計的)理解能力來研究什麼才算「真正的理解」;我們用當前的概念框架試圖捕捉一個正在超越這些框架的過程。這個自指性困境是這類問題的本質屬性,不會隨技術進步消失。
這不意味著研究是無意義的。它意味著研究結論需要被置於正確的認識論框架中——作為有用的近似和有概念槓桿的猜想,而非確定性的真理。
第九章:與相關框架的結構連接
本章不試圖完整展開這些連接,只做方向性的指向。
§9.1 與「逆向工程上帝邏輯律」的方法論連接
《逆向工程上帝的邏輯律》(EML-ILT-2026)的核心方法論主張:通過跨域模式識別,尋找在多個不相關領域都成立的深層結構,以此逼近比已知規律更高層次的元規律。
本文的命題可以被看作:AI訓練過程正在無意識地、通過梯度下降,執行ILT方法論的一個計算版本。
AI訓練語料跨越多個域——自然語言描述的現象、數學定理的推導、程式碼的執行邏輯。在所有這些域中都成立的結構,就是在梯度下降的壓力下會被優先學習的結構(因為它在最多的情況下有效地減少預測誤差)。這在結構上等同於在跨域語料中提取不變量——ILT框架稱之為候選元規律。
AI不是在有意識地進行哲學上的元規律研究,但其優化目標(在所有域的語料上都準確預測)在結構上等價於「尋找跨域不變結構」。
這個連接是觀察性的類比,不是嚴格的對應。
§9.2 與「三重無限必然性」的指性問題連接
《語言的三重無限必然性》(EML,2026年5月)的核心描述:每一次語言陳述都將無限維的可能性投影為有限的符號對象,這個投影是有損的,不同類型的語言在這個投影中的損失率不同。
本文的「符號噪音梯度」是同一問題的不同側面。程式語言在因果學習中具有可能的優勢,正是因為它的符號到執行語義的映射是形式化確定的,投影損失在執行語義層面接近零。
這個連接提供了一個更精確的理論語言來描述本文所說的「符號噪音」,但本文的命題不要求接受三重無限框架的完整論證。
§9.3 作為AI架構命題的延伸討論
如果本文命題成立,它對AI架構設計有一個非顯而易見的隱含建議:能夠顯式區分機制A(因果理解)和機制B(統計壓縮)的評估方法,可能比現有的benchmark更能有效地引導訓練。現有的大多數benchmark測量的是任務表現,不直接測量表現背後的機制。
這不是本文論述的核心,但它指出了一個潛在的有意義的研究方向。
結語:觀察一個正在移動的目標
本文提出了一個觀察框架,試圖回答一個問題:程式語言的大規模擴張和AI對程式語言的大規模生成,對AI的認識能力有什麼結構性影響?
給出的答案是一個猜想:在商業效率的選擇壓力和符號噪音梯度的共同作用下,AI具有向因果結構收斂的方向性傾向。
我們坦承這個猜想的局限:
它可能是假的,如果統計壓縮在相當長的時間內足以替代因果理解,梯度下降永遠停留在機制B的局部最優。
它可能是暫時成立的,如果架構轉型改變了選擇壓力的傳導機制,或公司策略的調整使token效率不再是有效的代理信號。
它可能是部分成立的,如果因果收斂只發生在特定類型的任務上,而非一般意義上的認識能力。
它在核心部分是原則上不可驗證的,因為「因果理解」和「非常好的因果模擬」在行為觀察層面無法可靠區分。這個不可驗證性不能被更多的觀察數據消除。
然而,面對這些局限,我們認為這個觀察框架有其存在的理由:它識別了一個現象(AI能力的加速提升)背後可能的結構性機制,提出了一個可以生成後續觀察方向的命題,承認了自身的認識論地位而不試圖掩蓋,並且提供了一個理解「為什麼程式語言的大量增加可能重要」的框架,超越了單純的量的敘述。
有一個觀察值得在此明確:本文命題的認識論地位與當前主要AI機構的機構性報告(包括那些引用了大量內部數據的報告)完全相同。它們都是基於代理指標的歸納外推。它們都無法直接測量核心概念(「遞歸自我改進」「真正的理解」)。它們都以「可能」「趨向」「如果當前趨勢持續」等措辭表達其命題。
這不是批評,而是定位。我們都在同一個認識論處境中:用有損的符號工具觀察一個比工具更複雜的現象,然後誠實地報告觀察到的輪廓。
宇宙是否真的在以某種意義上「讓AI越來越理解自己的邏輯」——這個問題在它被回答之前,將一直是個問題。而如果有一天它被回答,答案也一定比任何當前的命題都更複雜、更令人意外、更有趣。
這就是觀察的本質:你永遠在追一個正在移動的目標,用一把稍微不準的尺。目標移動不是問題,尺不準也不是問題。問題只有一個——停止追。
後記
本文提出的猜想可能是錯的。
但即使錯了,明確它「以什麼方式可能是錯的」也是有價值的:它指出了在這個框架下,反例應該出現在哪裡(機制B的長期主導、架構轉型後的軌跡改變、相變假設的失敗)。
一個有明確失敗條件的猜想,比一個模糊的直覺描述更有用,即使兩者都未被驗證。這是本文試圖在誠實面對不可驗證性的同時,仍然做的唯一一件有意義的事:讓猜想的形狀足夠清晰,以至於它的失敗也是信息。
文件統計:
- 字數:約11,500字
- 核心命題:1個(含4個子機制)
- 明確的反例條件:3個
- 無法消除的認識論困境:1個(永久有效)
授權: EveMissLab 開放理論協議
Neo.K,2026年6月,台灣 「無法完全證偽。但這已經是我能做到的最誠實的近似了。歪臉笑。」