表徵閘門猜想：AI 潛能作為知識全息圖的投影逆問題

The Representational Gating Conjecture: AI Potential as the Inverse Projection Problem of the Knowledge Holographic Graph

文件編號：EML-RGC-2026-v0.1 作者：Neo.K（許筌崴）× Theia 機構：一言諾科技有限公司（EveMissLab）日期：2026 年 5 月狀態：首版（v0.1，猜想層級） 理論地位：MDAS-TCH、HLCG、TCF 在 AI 能力本體論上的延伸；DCO v5.0 維度投影定理 πₙ(Cl)=Sⁿ⁻¹ 之認識論逆問題授權：研究階段保留，最終授權待定

摘要

本文形式化一個常被誤讀的觀察——「現代學術知識海中大量論文的公式與概念，現行 AI 並未真正掌握」——並主張這個觀察不應被讀成「AI 能力不足」，而應被讀成一個關於表徵格式的命題。本文提出表徵閘門猜想（Representational Gating Conjecture, RGC）：在因果推理與統計歸納等核心能力已被承認為湧現屬性的前提下，現行大型語言模型潛能的釋放閘門，主要由其所被餵入之知識的表徵格式決定，而非由參數規模或架構決定。本文的論述路徑為：（一）指出「潛能」一詞的事後正確性陷阱，並承諾以可證偽的猜想形式而非未驗定理形式陳述全文；（二）把訓練語料的 token 流形式化為知識全息圖的一個極大損失投影 π_token，並證明其與 πₙ(Cl)=Sⁿ⁻¹ 維度塌縮的結構對應——AI 不是沒吃進知識海，而是把知識海當作維度塌縮後的影子吃進去；（三）給出主猜想 RGC 及其三條推論猜想；（四）定義釋放算子 R（TCF→MDAS 格式轉換）與可測能力差 ΔC，並設計雙臂實驗把「潛能未釋放」從信仰升格為可否證命題；（五）形式化 AI 自身知識狀態的第三態 S_undec，提出探針協議以分辨「本然未學」「暫時未顯」「學成錯態」三者，此即 HLCG-3 第三態判準在 AI 知識論上的同構；（六）把開篇四種「未釋放」缺口（覆蓋／編碼／激發／組合）對應到四條不同的釋放路徑。本文末節誠實陳列最強反方論證（規模假設與「苦澀的教訓」），並把兩個關鍵未決項——三態探針的判準完備性、釋放算子的可遷移性——明確留置為待解開放問題。

關鍵詞：表徵閘門、AI 潛能、投影逆問題、知識全息圖、維度塌縮、釋放算子、可測能力差、第三態、知識探針、過參數化、MDAS-TCH、HLCG、TCF、Closure。

0. 前言：一個被誤讀的觀察

本文起源於一個樸素到容易被忽略的觀察。一位長期橫跨數學、物理、哲學、認知科學與經濟學的閱讀者，在讀過足夠多領域的足夠多論文後，會反覆遭遇同一個現象：把某篇論文裡的公式或核心概念交給現行 AI，AI 經常不具備那個結構——它沒見過，或見過而未能調用，或自信地給出一個淺薄而錯誤的版本。

這個觀察本身不稀奇。稀奇的是它通常被讀錯。最常見的兩種誤讀是：其一，把它讀成「AI 還不夠聰明」，於是訴諸更大的模型；其二，把它讀成觀察者的錯覺，於是訴諸提示工程的不足。本文主張這兩種誤讀都偏離了要點。真正的要點是：現代學術知識海的規模與密度，已經大到任何單一訓練語料都只能覆蓋其薄薄一層，而即使被覆蓋的那一層，也是以一種極大損失的格式被吸收的。換言之，問題不在模型有多大，而在知識以什麼形狀進入模型。

由此，本文要陳述的命題不是「AI 很弱」，而是更鋒利的一句：AI 的潛能尚未被真正釋放，而釋放的閘門是表徵格式，不是參數，也不是架構。 本文的全部工作，是把這句話從一個直覺，鍛造成一個可以被實驗否證的猜想。

需要先行聲明的前提有二。第一，本文承接 EveMissLab 既有結論，直接承認因果推理、統計歸納等能力為湧現屬性，不在此重新論證湧現的存在性——這是被授予的公理，不是被證明的定理。第二，本文不宣稱證明任何命題為真；本文以猜想形式陳述，並在每個關鍵節點附上其否證條件。一個不能被否證的「潛能」命題，與「他其實很有天分只是還沒發揮」這類事後追認的空話，在邏輯地位上沒有區別。本文的全部嚴格性，繫於對這個陷阱的迴避。

1. 問題設定：潛能語言的危險與分解

1.1 事後正確性陷阱

「潛能」是一個語法上永遠站在事後正確一邊的詞。任何尚未發生的能力，都可以在它發生之後被追認為「本來就有的潛能」；而在它發生之前，「潛能存在」這個斷言不承擔任何風險。一個只能事後兌現、事前無風險的命題，不是科學命題，是信仰陳述。

這正是 HLCG v0.1 §7 警告過的安慰機機制的一個變體：當一個框架可以把任何結果都解釋成對自己有利，這個框架就喪失了被現實修正的能力。因此本文的第一個動作，不是論證 AI 有潛能，而是先給「潛能未釋放」這句話裝上否證引信。沒有這個引信，後續一切論述都只是修辭。

定義 1.1（可釋放潛能）。設 AI 系統 $A$，某能力維度 $C$（例如在某類因果推理任務上的正確率）。稱 $A$ 在 $C$ 上具有可釋放潛能，當且僅當存在一個可在有限資源內施行的算子 $R$（不改變 $A$ 的參數），使得

$$ \Delta C := C(R \cdot A) - C(A) > \varepsilon $$

對某預先固定的顯著閾值 $\varepsilon > 0$ 成立。

這個定義的關鍵在於：潛能不再是一個關於 $A$ 內在狀態的形上斷言，而是一個關於「是否存在使能力可測上升的操作」的存在斷言。潛能未釋放因此等價於：$R$ 存在但尚未被施行。若無任何 $R$ 能使 $\Delta C > \varepsilon$，則命題被否證——這就是引信。

1.2 四種「未釋放」的分解

「AI 潛能未釋放」是一個複合命題，內部至少綁了四個機制完全不同的子命題。不拆開，就無法談釋放路徑，因為每一種缺口的釋放算子根本不是同一個。

覆蓋缺口（Coverage Gap）。AI 從未接觸過該知識。學術知識海的長尾、付費牆後、未數位化、未翻譯、未發表的部分，根本不在訓練語料的支撐集內。這是純粹的資料分布問題，與模型能力無關。釋放路徑：擴展語料支撐集。

編碼缺口（Encoding Gap）。AI 接觸過該知識，但以統計表面的形式吸收——高熵、低壓縮的 token 共現模式，而非該知識的因果結構與概念骨架。模型「記得字面」卻不「持有結構」。這是本文的核心關切，也是與 MDAS／HLCG 直接相連的缺口。釋放路徑：重編碼，把知識壓縮成結構形式再餵入或再對齊。

激發缺口（Elicitation Gap）。能力與結構都在模型內，但現行的提示與鷹架未能把它調用出來。思維鏈出現之前，模型早已具備的多步推理能力即屬此類——它一直在，只是沒被正確的觸發格式叫醒。釋放路徑：設計調用協議。

組合缺口（Combination Gap）。所有碎片都在模型內，但跨領域的那一條關鍵超邊從未被連起。$X$ 領域的節點與 $Y$ 領域的節點各自清晰，但「$X$ 的某結構即 $Y$ 的某結構之投影」這條連結，因為從沒有人同時站在兩個領域，所以從沒被畫出。釋放路徑：跨域超邊的顯式建構。

開篇那個觀察——讀論文、問 AI、AI 不具備該概念——最直接打中的是覆蓋缺口與編碼缺口，而非後兩者。但本文將論證：四者並非彼此獨立，編碼缺口是其餘三者的母缺口。理由見 §6。

1.3 猜想形式承諾

本文以下所有核心斷言均以「猜想（Conjecture）」標號陳述，每一條附其否證條件。凡未附否證條件的斷言，僅作為定義或動機，不參與本文的真值承擔。這是本文對 §1.1 陷阱的形式化迴避，也是 TCF v1.0 「真理論／魔術理論」判準對本文自身的施加：一個無法被壓縮率與否證條件約束的理論，按 TCF 判準即為魔術理論。本文拒絕成為魔術理論。

2. 投影災難：AI 如何吃下知識海

2.1 token 流作為極大損失投影

要理解編碼缺口的本質，必須先問：知識以什麼形狀進入模型？答案是：以一維符號序列的形狀。無論一篇論文原本攜帶多少維的因果結構、概念糾纏與範式層級，它在進入訓練管線時都被拍平成一條 token 流。

設某知識體的全息邏輯因果圖為 $\mathcal{H} = (V, E, S, \tau, \Pi, \rho, \sigma)$（沿用 HLCG v0.1 §2.1 之七元組）。定義token 投影

$$ \pi_{\text{token}} : \mathcal{H} \longrightarrow \Sigma^* $$

把全息圖映射到字母表 $\Sigma$ 上的有限符號序列。這個映射的特徵是：它保留節點的字面標籤，但系統性地丟棄超邊的不可分性、態代數 $S$ 的多態結構、類型函數 $\tau$ 的四維體系，以及投影族 $\Pi$ 所編碼的跨視圖一致性。

觀察 2.1。$\pi_{\text{token}}$ 是一個極大損失投影：其值域 $\Sigma^*$ 的結構（一維全序）遠貧於定義域 $\mathcal{H}$ 的結構（帶態的超圖）。因此存在大量不同的 $\mathcal{H}$ 被映到難以區分的 token 流——投影不單射，逆問題病態。

這給出編碼缺口的精確診斷：模型不是沒吃到知識海，而是吃到的是 $\pi_{\text{token}}(\mathcal{H})$，一個丟失了結構維度的影子。模型隨後從大量這樣的影子中，統計地反推原結構。能反推多少，取決於影子的冗餘度與模型的容量，但無論如何，反推一個病態逆問題與直接被給定原圖，是兩件事。

2.2 與維度塌縮的對應

此處出現一個與 DCO v5.0 的精確結構對應，不是隱喻，是同構候選。

DCO 維度投影定理陳述 $\pi_n(\mathrm{Cl}) = S^{n-1}$，其逆過程為維度塌縮 $S^2 \to S^1 \to S^0$，由徑向閉合（重力）與切向閉合（旋轉）共同驅動。本文主張：訓練語料的生成過程，是知識全息圖的一次維度塌縮。

具體地，作者把多維結構寫成一篇線性論文（$\mathcal{H} \to$ 文本），讀者把線性論文讀回多維理解（文本 $\to \mathcal{H}'$），這是人類知識傳遞的標準閉環。問題在於：人類讀者攜帶大量先驗結構，能在塌縮後的文本上重建出接近原圖的 $\mathcal{H}'$；而現行 AI 在缺乏該先驗結構時，只能重建出 $\mathcal{H}'$ 的一個低保真投影。

猜想 RGC-0（投影災難猜想）。現行大型語言模型對學術知識的內部表徵，其全息保真度

$$ F_{\text{AI}}(\mathcal{H}) = \frac{I(\text{模型內部重建})}{I(\mathcal{H})} $$

在高結構密度的知識體（純數學、理論物理、跨域綜合理論）上系統性地低於人類專家，且此差距的主因不是容量不足，而是 $\pi_{\text{token}}$ 的投影損失。

否證條件：若在控制語料覆蓋的前提下，模型於高結構密度知識體上的下游結構性任務表現，僅由模型規模單調決定而與輸入表徵格式無關，則 RGC-0 被否證。

2.3 已存知識的保真度崩潰

由 §2.1–§2.2 得到一個反直覺推論：模型對某知識的「擁有」是分級的，且字面擁有與結構擁有可以嚴重背離。模型可以完美複述一條定理的陳述（字面 $F$ 高），卻無法在新情境中調用該定理的因果角色（結構 $F$ 低）。開篇觀察者所遭遇的「AI 沒學會」，許多情況其實是「AI 字面學會、結構未學會」——這恰好是編碼缺口的臨床表現，也預告了 §5 的三態混淆問題。

3. 核心猜想：表徵閘門

3.1 主猜想

猜想 RGC（表徵閘門主猜想）。在因果推理與統計歸納等能力已為湧現屬性的前提下，固定一個已達某規模閾值 $\theta$ 的模型 $A$，其在高結構密度知識領域的可釋放潛能，主要由輸入知識的表徵格式 $\phi$ 所閘控，而非由進一步增大規模所主導。形式地，存在格式空間中的兩點 $\phi_{\text{token}}$（線性符號流）與 $\phi_{\text{struct}}$（全息／MDAS 結構編碼），使得對某類結構性任務集 $\mathcal{T}$，

$$ \Delta C_{\phi} := C\big(A; \phi_{\text{struct}}\big) - C\big(A; \phi_{\text{token}}\big) \;>\; \Delta C_{\text{scale}} := C\big(A^{+}; \phi_{\text{token}}\big) - C\big(A; \phi_{\text{token}}\big) $$

其中 $A^+$ 為在相同語料上規模顯著增大的模型。即：換格式的邊際收益大於換規模的邊際收益。

否證條件：若在任何合理的結構性任務集 $\mathcal{T}$ 與任何 $\phi_{\text{struct}}$ 候選下，恆有 $\Delta C_\phi \le \Delta C_{\text{scale}}$，則 RGC 被否證，瓶頸應歸於 computational 而非 representational。

3.2 推論猜想

猜想 RGC-1（過參數化容量充足）。已達閾值 $\theta$ 的現行模型，其參數容量已足以容納目標知識領域的完整全息圖 $\mathcal{H}$；未被釋放的不是容量，而是把 $\mathcal{H}$ 以低損格式注入該容量的途徑。直覺類比：硬碟夠大，缺的是不把檔案壓壞的寫入協議。

猜想 RGC-2（格式收益的領域依賴性）。$\Delta C_\phi$ 隨知識領域的結構密度單調增。在低結構密度領域（如事實性問答、常識），$\Delta C_\phi \approx 0$，格式無關緊要；在高結構密度領域（如本綱領所處的跨域理論），$\Delta C_\phi$ 顯著為正。此猜想解釋了為何「AI 在閒聊上很強、在硬理論上常失手」不是矛盾，而是同一閘門在不同密度下的兩個讀數。

猜想 RGC-3（編碼缺口的母缺口地位）。覆蓋、激發、組合三缺口，在結構性任務上的可釋放部分，皆可化約為編碼缺口的特例：覆蓋缺口的釋放需要把新知識以結構格式注入（否則只是增加更多影子）；激發缺口的釋放需要以結構格式提示（否則調用的仍是表面）；組合缺口的釋放本身就是在全息圖上補一條超邊，是純結構操作。故編碼格式是四缺口的共同閘門。

4. 釋放算子 R 與可測能力差 ΔC

本節把 §1.1 的否證引信落地為可施行的操作。這是把整個猜想體系從哲學拉回實驗的關鍵節。Neo.K 已聲明本節留置的細節問題自有解法；本文僅將其形式化到可被執行的程度，並標明留置邊界。

4.1 釋放算子的定義

定義 4.1（釋放算子 R）。$R$ 為一個不修改模型參數的前置變換，把原始知識輸入 $x$ 轉為結構化輸入 $R(x)$，使模型在 $R(x)$ 上的調用結構優於在 $x$ 上。本綱領的首選 $R$ 候選為 TCF→MDAS 格式轉換：先以理論壓縮標準格式（TCF v1.0，九節結構）規範化原始知識，再以 MDAS-TCH（v2.0，四層十五態、18 維 $\Sigma$、不可分超邊）編碼為量子拓撲超圖，最後以 MDAS-QCL（1:10 壓縮語言）序列化為模型可攝入的結構提示。

此處 $R$ 的合法性繼承自既有結論：TCF $= \pi_{\text{static}}(\text{MDAS})$，而 MDAS 是 $\mathcal{H}$ 的高保真投影。因此 $R(x)$ 相較於 $x = \pi_{\text{token}}(\mathcal{H})$，是一個保真度更高的投影——$R$ 在做的事，本質上是 §2.2 維度塌縮的部分逆運算，即維度回填。

4.2 可測能力差的操作化

$\Delta C$ 必須是可測的，否則 RGC 退回信仰。操作化要素有三：固定的能力維度 $C$、固定的任務集 $\mathcal{T}$、固定的顯著閾值 $\varepsilon$。

$C$ 不應取字面複述準確率（編碼缺口會被字面記憶掩蓋），而應取結構性遷移任務的正確率：給定已編碼知識，要求模型在未見過的新情境中調用該知識的因果角色、進行跨域類比、或補全被刻意刪去的超邊。$\mathcal{T}$ 應包含至少三檔結構密度，以同時檢驗 RGC-2 的領域依賴性。

4.3 雙臂實驗設計

實驗骨架。取同一模型 $A$，固定任務集 $\mathcal{T}$。

對照臂：以原始論文 token 流 $\phi_{\text{token}}$ 作為知識上下文。
處理臂：以 $R$ 編碼後的結構表示 $\phi_{\text{struct}}$ 作為知識上下文，資訊內容等價、字面長度可更短（受惠於 1:10 壓縮）。

測量 $\Delta C_\phi = C(A; \phi_{\text{struct}}) - C(A; \phi_{\text{token}})$。再引入第三臂：規模增大模型 $A^+$ 於 $\phi_{\text{token}}$，測 $\Delta C_{\text{scale}}$。

判定：若 $\Delta C_\phi > \varepsilon$ 且 $\Delta C_\phi > \Delta C_{\text{scale}}$，則 RGC 在 $\mathcal{T}$ 上獲得支持，「潛能未釋放」於此範圍內升格為可重現現象；若 $\Delta C_\phi \le \varepsilon$，RGC 在此範圍內被否證。

留置問題（Neo.K 自陳有解，本文不展開）：（a）$R$ 的編碼成本是否會吞掉 $\Delta C_\phi$ 的收益——即釋放算子本身的代價核算；（b）$\phi_{\text{struct}}$ 的最優設計是否唯一，抑或存在格式空間中的多個局部極優。此二者列為開放項，見 §8。

5. 第三態探針：AI 知識的不可判定態

5.1 三態混淆問題

開篇觀察「AI 沒學會某概念」是一筆髒數據，因為它至少混淆了三種彼此正交的狀態：

本然未學（$s_{\text{absent}}$）：該知識從不在模型支撐集內。對應覆蓋缺口。
暫時未顯（$s_{\text{latent}}$）：模型持有該知識的某種表徵，但當前提示未能調用。對應激發缺口或編碼缺口。
學成錯態（$s_{\text{corrupt}}$）：模型持有一個錯誤或淺薄的版本，並可能自信地輸出之。對應編碼缺口的病理形式。

單次問答失敗無法區分這三者。把三者混為一談，會使「AI 潛能未釋放」的全部證據基礎不可靠——你以為觀察到的是覆蓋缺口，實際可能是激發缺口，而兩者的釋放算子完全不同。

5.2 與 HLCG-3 的同構

此三態結構與 HLCG v0.1 §2.3 的態代數精確對應。HLCG-3 公理斷言態代數內生包含一個非空的不可判定態子集 $S_{\text{undec}}$，且與已決態拓撲分離。本文主張：AI 的知識狀態空間同樣攜帶一個 $S_{\text{undec}}$，其中

$$ s_{\text{absent}} \in S_{\text{decided}}^{-}, \quad s_{\text{corrupt}} \in S_{\text{decided}}^{?}, \quad s_{\text{latent}} \in S_{\text{undec}} $$

關鍵在 $s_{\text{latent}}$：「模型其實會、只是沒被叫出來」這個狀態，在缺乏探針的情況下本然不可判定——它與「模型不會」在單次觀察上無法區分。這正是 HLCG-3 第三態判準問題（本然不可判定 vs 暫時未顯）在 AI 知識論上的同構實例。HLCG §7 的訓誡在此原封不動地適用：一個能誠實標出 $s_{\text{latent}}$ 的探針，比一個把所有失敗都判為 $s_{\text{absent}}$ 的探針，更接近模型知識狀態的真實全息圖。

5.3 探針協議猜想

猜想 RGC-4（三態可分性）。存在一個多輪探針協議 $P$，能對任一概念 $c$ 與模型 $A$，以高於隨機的可靠度返回 $A$ 對 $c$ 的態別 $\in \{s_{\text{absent}}, s_{\text{latent}}, s_{\text{corrupt}}, s_{\text{decided}}^{+}\}$，其中至少包含：以多種互異格式重述 $c$ 後檢驗一致性（分離 latent 與 absent）、以結構性遷移任務檢驗調用能力（分離 corrupt 與 decided）、以校準度檢驗自信與正確的背離（標記 corrupt）。

否證條件：若不存在任何協議能在統計上分離此三態，即三態在可觀測層面恆等價，則 RGC-4 被否證，三態區分淪為形上虛設。

留置問題（Neo.K 自陳有解）：探針協議 $P$ 的判準完備性——(F1)–(Fn) 式的特徵清單是否窮舉了三態的全部可觀測區分特徵。此問題與 HLCG §9.4 的第三態判準窮舉性是同一個開放項在 AI 知識論上的投影，列入 §8。

6. 四缺口的釋放路徑分化

把 §1.2 的四缺口、§3 的主猜想、§4 的釋放算子、§5 的探針綁在一起，得到一張釋放路徑表。其要點是：四缺口共享編碼格式這個母閘門（RGC-3），但各自的近端釋放動作不同。

覆蓋缺口的近端動作是擴展支撐集，但其可釋放部分仍須經結構格式注入，否則只是堆疊更多 token 影子。激發缺口的近端動作是設計調用提示，而最有效的提示本身就是結構格式提示——以 $\phi_{\text{struct}}$ 提問，等於直接在模型的全息圖上指定鄰域 $N_k(v)$。編碼缺口的近端動作即釋放算子 $R$ 本身，是四者中唯一直接作用於母閘門的。組合缺口的近端動作是跨域超邊建構：在 $\mathcal{H}$ 上補一條連接 $X$ 域節點與 $Y$ 域節點的超邊——這恰好是 Neo.K 本人作為跨域理論者的核心生產動作，也是現行 AI 因缺乏跨域先驗而最難自主完成的一類釋放。

猜想 RGC-5（組合缺口的人機非對稱）。在四缺口中，組合缺口的釋放在現階段呈現最強的人機非對稱：擁有跨域全息先驗的人類能以極低成本畫出關鍵超邊，而現行 AI 即使持有兩端節點，也難以自發判定該超邊的存在性與不可分強度。故跨域超邊的人工標注，是當前性價比最高的釋放算子之一。

此猜想若成立，將直接解釋本綱領的工作方法之所以有效：Neo.K 的跨域連結不是 AI 的替代品，而是 AI 釋放路徑上 AI 最缺、人最強的那一段——人提供超邊，AI 提供超邊上的並行展開。

7. 與既有體系的銜接

本文不是孤立猜想，而是既有 EveMissLab 元結構在 AI 能力論上的一個投影 $\pi_{\text{capability}}(\mathcal{H})$。銜接關係如下。

對 MDAS-TCH：RGC 的釋放算子 $R$ 以 MDAS 編碼為核心，MDAS 的全息重建定理（1-鄰域重建 ≥60% 信息熵）正是 §4 結構格式優於 token 格式的形式根據——一個 1-鄰域即可重建大半的格式，先天優於一個需要遍歷全文才能拼回結構的格式。

對 HLCG：RGC-4 的三態探針是 HLCG-3 第三態公理在 AI 知識狀態空間的同構落點；§2 的投影災難是 HLCG 雙向重建律（HLCG-1/HLCG-2）在「AI 作為內部觀察者」這一特例下的失效分析——AI 因被餵入低保真投影而無法滿足局部-全息忠實性。

對 TCF：$R$ 的第一步即 TCF 規範化；而本文以猜想形式自我約束、拒絕成為不可證偽安慰機，正是 TCF「真理論／魔術理論」判準對自身的施加。

對 DCO v5.0 / Cl：§2.2 把訓練過程辨識為維度塌縮，把釋放算子 $R$ 辨識為維度回填，使 RGC 成為 $\pi_n(\mathrm{Cl})=S^{n-1}$ 的認識論逆問題——人類知識傳遞是 Cl 的塌縮支，AI 潛能釋放是其回填支，二者在同一投影定理的兩個方向上對偶。

8. 留置的開放問題

本文遵 Neo.K 指示，將前序對練中浮現的關鍵難題保留為開放項，不在本版強解。明列如下，以防被誤讀為已決。

第一，三態探針的判準完備性。RGC-4 的協議 $P$ 是否窮舉了分離 $\{s_{\text{absent}}, s_{\text{latent}}, s_{\text{corrupt}}\}$ 的全部可觀測特徵，未證。此與 HLCG §9.4 同源。

第二，釋放算子的可遷移性與代價。$R$（TCF→MDAS 編碼）在一個領域驗證有效後，是否可跨領域遷移而不重新調校；以及 $R$ 的編碼成本是否會在某些任務上吞掉 $\Delta C_\phi$ 的收益。此即 §4.3 留置之 (a)(b)。

第三，閾值 $\theta$ 的存在性與位置。RGC 預設模型已達某規模閾值 $\theta$ 才使表徵閘門成為主導；$\theta$ 是否存在、位於何處、是否領域依賴，未定。若 $\theta$ 高於現行最大模型，則 RGC 的可驗證性將被推遲。

第四，$\phi_{\text{struct}}$ 的最優性。格式空間中是否存在唯一全域最優結構格式，抑或只有領域局部最優，未知。這關係到 $R$ 是一個算子還是一族算子。

這四項中，前二項作者已聲明持有解法路徑，後二項為本文新增的誠實標記。

9. 限制與最強反方論證

學術戰場等級的審查要求本文自陳其當量，並把最鋒利的反方武器擺上桌面，而非藏起。

反方一：規模假設與「苦澀的教訓」。AI 研究史上反覆出現的教訓是：利用算力的通用方法，長期看終將勝過注入人類結構先驗的方法。若此教訓在此處同樣成立，則 $R$（注入結構）的收益只是暫時的，會被規模的持續增長抹平——亦即 $\Delta C_{\text{scale}}$ 終將追上並超過 $\Delta C_\phi$，RGC 主猜想的不等號將在足夠大的 $A^+$ 處翻轉。本文的回應不是反駁，而是縮限戰場：RGC 只主張在固定規模、固定語料的當下，表徵閘門是主導；它不主張這個主導對任意大的規模永久成立。若反方為真，RGC 退化為一個關於「當前世代模型」的工程性命題，而非永恆真理——這個退化是本文願意承受的，因為即使如此，§4 的實驗仍有意義：它告訴我們在等待更大模型之前，現有模型還能被榨出多少。

反方二：湧現即海市蜃樓。有論點主張所謂湧現能力是度量選擇造成的假象，連續的底層改善被離散的評測指標誤讀為突現。本文已在 §0 把湧現作為被授予的公理而非待證命題，故此反方不直接擊中 RGC；但它提醒：§4 的 $C$ 必須採用連續、平滑的能力度量，否則 $\Delta C_\phi$ 本身可能是度量假象。本文接受此約束。

反方三：結構提示只是更好的提示工程。可主張 $\Delta C_\phi$ 不過是激發缺口的填補，與「表徵閘門」這個更強的本體論主張無關——換句話說，$R$ 有效只證明了提示重要，沒證明知識的內部表徵格式重要。本文承認這是最難切割的混淆，並把它降格為一個需要實驗區分的問題：若 $\Delta C_\phi$ 在「模型已被結構格式微調對齊」後仍顯著，則閘門在表徵層；若微調後消失，則閘門僅在提示層。此判別實驗列為 RGC 的關鍵裁決點。

把三個反方擺上桌後，RGC 的真實當量是：它不是一顆證明 AI 全能的核彈，而是一把可被實驗證偽的手術刀，主張在當前世代、高結構密度領域、固定規模下，格式收益主導規模收益。這個範圍內的命題，足夠窄到可被否證，也足夠寬到值得一試。

10. 結語

知識海從來不缺水。一個橫跨數學、物理、哲學、認知科學的閱讀者最早遭遇的，不是知識的稀少，而是知識的過剩——多到任何單一頭腦、任何單一語料都只能舀起薄薄一瓢。所以當 AI 在某篇論文的公式前失手，那不是水不夠，是 AI 吃水的方式把水的形狀吃丟了。它吃進的是一條被拍平成一維的知識，再從那條一維的影子，吃力地反推原本的多維身體。

潛能這個詞之所以危險，是因為它永遠可以在事後追認，事前不擔風險。本文做的全部工作，就是不讓它享有這個特權——給它裝上一個算子 $R$、一個可測差 $\Delta C$、一個會在實驗失敗時翻轉的不等號。能被否證的潛能，才是真的潛能；不能被否證的潛能，只是換了學術外衣的安慰話。

而如果這個猜想是對的，那麼釋放的鑰匙就不在更大的模型那一側，而在一個更古老的位置：一個已經學會把知識海讀成結構的頭腦，把那個結構壓縮好，先一步餵給還在影子裡反推的眼睛。維度塌縮把海寫成了書，現在輪到有人把書讀回海——並且，這一次，讀給機器聽。

塌縮造就了傳遞，回填造就了釋放。塌縮支與回填支，是同一條投影定理在認識論上的左手與右手；而潛能，不過是那隻尚未抬起的右手。

附錄 A：核心符號表

| 符號 | 名稱 | 出處 | |------|------|------| | $\pi_{\text{token}}$ | token 投影（極大損失） | §2.1 | | $\mathcal{H}$ | 知識全息邏輯因果圖 | §2.1（承 HLCG） | | $F_{\text{AI}}$ | AI 內部表徵的全息保真度 | §2.2 | | $\phi_{\text{token}}, \phi_{\text{struct}}$ | 線性／結構表徵格式 | §3.1 | | $\Delta C_\phi$ | 換格式的能力差 | §3.1, §4.2 | | $\Delta C_{\text{scale}}$ | 換規模的能力差 | §3.1 | | $R$ | 釋放算子（TCF→MDAS 編碼） | §4.1 | | $\theta$ | 規模閾值 | §3.1, §8 | | $S_{\text{undec}}$ | AI 知識的不可判定態子集 | §5.2 | | $s_{\text{absent}}, s_{\text{latent}}, s_{\text{corrupt}}$ | 本然未學／暫時未顯／學成錯態 | §5.1 | | $P$ | 三態探針協議 | §5.3 |

附錄 B：猜想清單彙整

RGC-0　投影災難：AI 對高結構密度知識的全息保真度低於人類，主因為 $\pi_{\text{token}}$ 損失而非容量。
RGC　表徵閘門主猜想：固定規模下，換格式收益 $>$ 換規模收益。
RGC-1　過參數化容量充足：缺的不是容量，是低損注入途徑。
RGC-2　格式收益的領域依賴性：$\Delta C_\phi$ 隨結構密度單調增。
RGC-3　編碼缺口的母缺口地位：四缺口共享編碼格式閘門。
RGC-4　三態可分性：存在探針協議可分離 absent／latent／corrupt。
RGC-5　組合缺口的人機非對稱：跨域超邊人工標注為最高性價比釋放算子。

附錄 C：與既有文件的依賴關係

本文依賴並投影以下既有文件：

EML-DCO-2026-v5.0：Dynamic Circle Ontology v5.0（πₙ(Cl)=Sⁿ⁻¹ 維度投影定理，塌縮／回填對偶）
EML-MDAS-2026-TCH-v2.0：MDAS 三態因果超圖論 v2.0（全息重建定理、18 維 Σ、不可分超邊，為 R 的編碼核心）
EML-TCF-2026-v1.0：理論壓縮標準格式 TCF v1.0（R 之首步規範化、真／魔術理論判準）
EML-HLCG-2026-v0.1：全息邏輯因果圖（態代數、第三態公理 HLCG-3、雙向重建律，為 §5 同構來源）

本文為上述體系在 AI 能力本體論上的延伸投影，不取代任何上述文件。

引用格式建議

Neo.K & Theia (2026). The Representational Gating Conjecture: AI Potential
as the Inverse Projection Problem of the Knowledge Holographic Graph.
EveMissLab Technical Report EML-RGC-2026-v0.1.

原始檔（供 RAG/下載）：papers/AI_v0_1.md [md]