# 自適應切割：索引演化的回饋理論
## Adaptive Cutting: A Feedback Theory of Index Evolution

**文件編號**：EML-TC-ADC-2026-v0.2
**作者**：Neo.K（許筌崴）
**機構**：EveMissLab（一言諾科技有限公司），台灣
**理論結晶化協作**：Theia
**日期**：2026年6月11日
**版本紀錄**：v0.1 初版（Python 實測通過）；v0.2 附錄 C 階段 AD1 由計畫改寫為驗證結果（免疫定理機器驗證關閉）
**機器驗證狀態**：免疫定理（adaptive_immunity、adaptive_integrate_eq）已於 Lean 4 完成形式化驗證，0 errors（詳附錄 C）
**理論地位**：拓樸微積分（EML-TC）的動力學上層——回答「選哪個索引方案」這個被 EML-TC 刻意留空的問題
**前置文件**：EML-TC-ONT-2026-v0.2、EML-TC-COMP-2026-v0.2、EML-TOPO-2026-SUB-v3.1、EML-FEN-2026-UNI-v0.1（姊妹篇，同日）

---

## 摘要

拓樸微積分證明了一件事並刻意留空了另一件事。證明的：任何切法都不傷本體——∫∘d = id 按構造成立，切法無關性經機器驗證。留空的：既然怎麼切都不傷，**該怎麼切**？切法的好壞不再由「能否拼回」衡量（永遠能），而由「揭示了多少呈現層結構」衡量。本文建立這個留空問題的理論：**自適應切割**——索引方案如何根據呈現層的回饋自我演化。

核心結果有四。第一，**免疫定理**：自適應算子按定義是呈現層算子，故任何適應策略——無論多激進、多錯誤、由人設計還是由 AI 搜索——都不可能損傷本體；探索的本體論風險恆為零，這把策略空間的搜索從「謹慎優化」解放為「自由搜索」。第二，**最優分配定理**：在平穩查詢分布下，最優索引方案把解析度按查詢頻率分配——索引深度正比於 −log q(x)，即**最優自適應索引是查詢分布的訊源編碼**；自適應切割理論在數學上是 Shannon 訊源編碼論在索引空間上的移植，而移植後多出一條原版沒有的性質：編錯碼零代價。第三，**收斂定理**：貪婪精化—粗化迭代在預算約束下收斂到查詢分布的共形像（熱處細、冷處粗），且因免疫定理，收斂過程的每個中間態都是合法可用的索引。第四，**雙軌不對稱原理**：d 軌上的適應免費可逆，V 軌上的適應（自適應剪枝、自適應刪除）不可逆且有損——正確的系統設計是**先在 d 軌上適應到收斂，再把高置信結論提交給 V 軌**；探索與承諾的分離由兩條軌道的本體論性質強制給出。

附錄給出 Python 參考實現（Zipf 查詢分布下的自適應索引樹，實測平均訪問深度收斂至熵界附近，全程雜湊不變性斷言通過）與 Lean 4 形式化計畫（免疫定理可由既有 EML-TC 庫直接實例化）。

**關鍵詞**：自適應切割、索引演化、免疫定理、訊源編碼、共形分配、雙軌不對稱、零風險探索、回饋迴圈

---

## 第一章　被留空的問題

### 1.1 困難的遷移

拓樸微積分的廣義版（EML-TC-ONT）在 4.4 節寫下一個成本分配聲明：傳統微積分的困難在於保證量在變換中守恆，本框架把守恆做成平凡的，於是「困難沒有消失——它遷移到了選哪個索引方案最能揭示呈現層的結構這個問題上」。本文就是那個遷移目的地的理論。

先把問題說準。給定本體對象 O 與一個使用情境——某些「部位」被頻繁查詢、某些被偶爾觸及、某些從未被看——不同的索引方案給出截然不同的使用體驗：把熱區切得粗，每次查詢都要在大塊視圖裡二次搜尋；把冷區切得細，索引預算被浪費在無人問津的地方。注意這裡的好壞**完全是呈現層的事**：本體在任何方案下都完好（機器驗證過的事實），差的方案浪費的是索引記錄、查詢時間、注意力——呈現層的資源。

於是問題的正式形態：設查詢以分布 Q 落在 O 的位置空間上，索引方案 I 給每個位置一個解析度（該位置所在視圖的細緻程度），索引總預算受限。求：使期望查詢成本最小的解析度分配，以及在 Q 未知或漂移時逼近它的演化策略。

### 1.2 為什麼這在 EML-TC 之前無法乾淨地提出

這個問題在工程中以碎片形態存在了幾十年——資料庫的自適應索引（database cracking）、記憶體的冷熱分層、JIT 編譯的熱點偵測、檔案系統的自動分區。但它從未被當成一個統一的數學問題，原因是值語義世界的一個結構性恐懼：**重組是有代價、有風險的**。在會丟資料的世界裡，「自適應地重切」意味著每次調整都是一次有損手術，策略錯誤會造成真實損失，於是每個領域各自發展保守的、領域特定的調整啟發式，誰也不敢把「策略空間」整個打開來搜索。

EML-TC 拆掉了這個恐懼的地基：在 d 軌上，重切是建視圖，零複製、零損耗、平凡可逆。恐懼消失之後，那些碎片化的啟發式才能被看出是同一個問題的不同方言——而這個問題值得一個完整的理論。

---

## 第二章　免疫定理：零風險探索的地基

### 2.1 陳述

**定義（自適應算子）**：自適應算子 A 是任何把「當前索引方案 + 觀測到的回饋」映為「新索引方案」的映射：A(I, F) = I′。回饋 F 是呈現層的任何觀測——查詢日誌、訪問頻率、命中延遲、人類偏好、另一個 AI 的評分。

**免疫定理**：對任意自適應算子 A、任意回饋流 F₁, F₂, …、任意迭代深度，本體對象 O 不變：∫ ∘ d_{Iₙ} = id_O 對演化序列中的每個 Iₙ 成立。

證明在 EML-TC 框架內是一行：A 的輸入輸出都是索引方案，A 是索引空間上的自映射，按定義是呈現層算子；同一性守恆律（機器已驗證其核心形態）對一切呈現層算子成立。∎

### 2.2 為什麼一行定理值一整章

免疫定理的證明平凡，後果不平凡——它改變的是**最優化問題的類型**。

傳統最優化分兩類：安全的（搜索中間解無害，如調超參數）與危險的（中間解會造成真實損傷，如線上手術式的系統重構）。危險類的方法論被迫保守：小步、回滾預案、金絲雀發布、人工把關。值語義世界的索引重組屬危險類。

免疫定理把索引適應**整類搬進安全區**，且是比「無害」更強的安全：中間解不只無害，每個中間解都是**完全合法可用的索引**——演化過程中系統一刻不停地正常服務，沒有「重建期間暫停查詢」。這給出三條直接推論。

推論一（激進性合法）：適應策略可以任意激進——一步重切全域、隨機跳變、模擬退火式的高溫探索——最壞結果是浪費索引預算，永不傷及資料。探索與利用的權衡仍在（浪費預算有成本），但權衡的下界被本體論托住了。

推論二（搜索可委託）：策略空間可以放心交給自動搜索，包括交給 AI。「讓 AI 自由重組你的索引」在值語義系統裡是夢魘提案，在 d 軌上是免疫定理的直接應用——這是本理論與作者人機演算法共設實驗的接口：AI 在被定理保護的沙盒裡搜索切法，人類審查的對象從「每一步是否安全」（已由定理承包）收縮為「結果是否更好」（純效能問題）。

推論三（中間態皆檢查點）：因為每個 Iₙ 都合法，演化軌跡天然是檢查點序列——回退到任何歷史方案是 O(1) 的（方案本身只是索引描述，輕量可存）。值語義世界的「回滾」是昂貴的逆向手術，d 軌的「回滾」是換一副眼鏡。

### 2.3 免疫的誠實邊界：定理不保護什麼

激進的定理需要誠實的邊界，否則會被誤用成萬能護身符。免疫定理保護的是**本體**，且只保護本體。三件它明確不保護的事：

第一，**查詢者的隱私**。索引方案是查詢分布的共形像（第四章）——這意味著索引結構本身洩漏「誰在看什麼」。觀察一棵收斂後的自適應索引樹，等於讀到查詢者興趣分布的對數編碼。本體無損，但觀看行為的統計指紋被結構化地記錄了。在多方共享本體、各持索引的場景（EML-TC-COMP 第八章的多智能體架構），索引方案應視為查詢方的私有資訊管理，與本體的公開性分開治理。

第二，**呈現層資源**。錯誤策略浪費的預算、時間、注意力是真實損失——免疫定理把損失的下界釘在「不傷本體」，沒有釘在零。探索免費指的是本體論免費，不是經濟學免費。

第三，**回饋通道的完整性**。自適應算子信任回饋，而回饋可以被汙染：對抗者以偽造查詢誘導索引向錯誤方向精化（讓系統把解析度浪費在誘餌區、把真熱區粗化）。免疫定理保證汙染攻擊**打不壞資料**——這已經消滅了此類攻擊在值語義系統中最危險的形態——但打得壞效能。防禦屬於標準的穩健統計（截尾計數、異常檢測），本文標記不展開；要點是攻擊面的本體論上界已被定理封頂：最壞情形是貴，不是毀。

### 2.4 回饋的類型學

「回饋」在定義中刻意留得寬。值得列舉其主要類型，因為類型決定演化的品質上限：

**行為回饋**（訪問日誌、命中計數）——最廉價、最客觀，本文主定理的標準假設；**代價回饋**（延遲、預算消耗）——把成本函數本身做進信號，使適應直接朝經濟目標收斂；**評價回饋**（人類偏好、AI 評分）——主觀但高語義密度，適用於「結構好壞」無客觀度量的場景（理論庫的概念組織、文檔的章節切分）；**對抗回饋**（紅隊查詢、壓力測試）——刻意餵極端分布，迫使索引在尾部也維持底線解析度，等價於在 Q 上混入均勻分布的正則化。

四類可疊加。疊加的合法性無需逐一論證——它們都只是 A 的輸入，免疫定理對 A 的內部結構不設任何條件。回饋工程的全部複雜度被隔離在效能層，這是地基免疫性的又一次兌現。

---

## 第三章　最優分配定理：索引即編碼

### 3.1 從直覺到定理

該怎麼分配解析度？直覺說：熱處細、冷處粗。本章把直覺收緊為定理，而收緊的途徑是一次認領——**這個問題數學上已經被解過了，解它的理論叫訊源編碼**。

對應字典：位置空間 = 訊源字母表；查詢分布 Q = 訊源分布；索引方案（樹狀精化結構）= 前綴碼；某位置的索引深度（從根到該位置視圖的精化步數）= 碼長；期望查詢成本 = 期望碼長。索引樹的每個分叉是一次 d 的施加，葉子是最細視圖——**一棵索引樹就是一個前綴碼，逐字面地**。

於是 Shannon 訊源編碼定理直接移植：

**最優分配定理**：期望索引深度的下界是查詢分布的熵 H(Q)；達到（逼近至一步之內）下界的方案把深度按 −log q(x) 分配——查詢機率減半，深度加一。Huffman 構造給出可計算的最優樹。

直覺「熱處細、冷處粗」的精確版本因此是：**解析度的對數正比於查詢頻率**。粗細不是線性跟隨熱度，是對數跟隨——比直覺更節制，且這個節制是可證最優的。

### 3.2 移植後多出的性質

移植不是復述。訊源編碼在原生地（通訊）有一條鐵律：編碼錯誤有代價——碼字衝突毀掉訊息，所以編碼理論花大量篇幅在糾錯。移植到索引空間後，這條鐵律消失：**索引方案沒有「錯」只有「貴」**——最劣的方案也只是深度浪費，本體與查詢的正確性都由 EML-TC 的恆等式托底。

這個差異有實際後果：通訊編碼必須先驗設計（錯不起），索引編碼可以**線上學習**（錯得起）。第四章的收斂理論之所以能用最樸素的貪婪策略，正因為貪婪的代價上界是浪費而非損毀——免疫定理（本體側）與無錯性（查詢側）合起來，把這個學習問題變成了強化學習裡最友善的那一類：探索免費。

### 3.3 注意力作為自適應索引

一個值得單獨標記的解讀：大型語言模型的注意力機制是自適應切割的一個自然實例。上下文是對象，注意力權重分布是查詢分布 Q 的內生估計，注意力的分配——對相關片段高解析、對無關片段近乎忽略——正是按相關性分布做的解析度分配。模型在每一層、每一步重新切割同一段上下文（上下文本體不變——KV 快取的不可變性恰是工程實證），切法隨任務回饋演化。本文不展開此線，僅標記其與 EML-PGAC（提示圖—注意力耦合理論）的接口：PGAC 的間隙變數 Δ_ij 度量顯式知識圖邊與隱式注意力啟用的錯位，在本理論語言中即「外部給定的索引方案」與「模型內生的最優分配」之間的偏差——一個天然的自適應切割診斷量。列為未來工作。

---

## 第四章　收斂理論

### 4.1 演化迴圈的正式形態

自適應迴圈：以粗方案 I₀ 起步；每輪觀測回饋窗口（位置訪問計數），對訪問頻率超過其解析度配額的位置施精化（d 的層內施加，切細），對低於配額的施粗化（合併索引），總索引記錄數受預算 B 約束，精化與粗化在預算內互換。

**收斂定理（平穩情形）**：若查詢分布 Q 平穩，貪婪精化—粗化迭代收斂到一個方案 I*，其深度分配在預算 B 內逼近 −log q 分配（共形像），期望查詢成本逼近 max(H(Q), log(N/B)) 的量級——熵界與預算界中較緊者。

證明骨架：定義勢函數 Φ(I) = 期望深度與最優分配的 KL 型偏差；每次貪婪調整嚴格降低 Φ（精化熱點降低其超額成本，粗化冷點釋放的預算嚴格大於其成本增量）；Φ 非負且調整步長有下界，故有限收斂至局部極小；樹狀方案空間中此目標的局部極小即全域極小（碼長分配問題的凸性）。完整證明列附錄 A。∎

**追蹤定理（漂移情形）**：若 Q 緩慢漂移（每輪總變差有界 δ），帶遺忘因子的計數器使期望成本維持在最優加 O(δ) 的鄰域內。這是線上學習的標準結果在「探索免費」條件下的簡化形態——不需要悲觀的探索預算，因為試錯不毀東西。

### 4.2 收斂過程的形狀

值得敘述收斂的質性形狀，因為它與直覺有一處出入。演化早期，方案劇烈變動——大刀闊斧的重切此起彼伏，這在值語義系統中是危險信號，在這裡是健康信號（免疫定理保駕，激進即高效）。中期，變動集中於查詢分布的「腰部」——頭部熱點早早被切到位，尾部冷區早早被粗化封存，持續調整的是中頻位置。晚期，方案凍結於共形像，僅隨 Q 的殘餘漂移微調。

整條軌跡的索引記錄總量恆等於預算 B——演化是預算的**再分配**而非增長。這與生物注意力的發育曲線同形：嬰兒對一切高解析（預算超載的近似），成熟是把解析度收攏到與環境統計共形的分配上。本文不主張這是巧合，也不展開——標記給認知解構研究（CDS）的模組接口。

---

## 第五章　雙軌不對稱：適應的兩種代價結構

### 5.1 V 軌上也有「自適應」，但它是另一種動物

自適應剪枝、自適應淘汰、自適應壓縮——V 軌（真刪軌）上同樣存在按回饋調整的策略。表面同構，代價結構天差地別：d 軌適應錯了浪費預算，V 軌適應錯了**毀掉本體**——剪錯的權重、刪錯的記錄、壓掉的精度，按減法拓撲學的不可逆性定理（V∘E ≠ id）無法恢復。

**雙軌不對稱原理**：d 軌適應的風險下界為零（免疫定理），V 軌適應的風險下界嚴格為正（不可逆性）。因此兩軌的方法論必須不同：d 軌許可激進貪婪、線上學習、AI 自由搜索；V 軌要求保守、可回滾預案（事前快照，即先施一次 d）、置信閾值。

### 5.2 先 d 後 V：探索—承諾分離

由不對稱原理直接導出本理論最重要的工程定律：

**先 d 後 V 定律**：一切需要適應的破壞性決策，先在 d 軌上以視圖模擬適應至收斂，再把收斂後的高置信方案一次性提交 V 軌執行。

實例化：自適應剪枝的正確流程不是「邊觀測邊剪」，而是「以視圖標記候選剪除集（d 軌，零成本，可任意反悔）→ 觀測標記方案下的模擬效能 → 收斂後一次性物理剪除（V 軌，一次承諾）」。資料庫的正確流程：cracking 在索引層自由演化（d 軌），vacuum 按演化收斂後的冷區圖執行（V 軌）。減法拓撲學 v3.1 第八章已從減法側描述過「刪除前先 d 軌快照」——本定律是它的完整形態：**不只快照，整個適應過程都該住在 d 軌上，V 軌只接收結論**。

探索與承諾的分離在決策理論中是古老的智慧；本理論的增量是把分離線釘在了一個本體論事實上——兩條軌道的風險下界一個是零一個不是，分離不是審慎，是兩種數學的邊界。

---

## 第六章　與 EML 體系的接口

**對 FEN 統一（姊妹篇）**：FEN 的最優分割理論在分離型世界以逼近誤差為目標泛函，本理論在索引型世界以期望深度為目標泛函——姊妹篇的分解定理（任意切割分解為索引分量與分離分量）使兩個最優化在混合對象上可以**逐分量並行**：索引分量跑本理論的 Shannon 分配，分離分量跑 FEN 的誤差最優化，分解的正交性保證兩個目標不打架。詳見姊妹篇第六章。

**對減法拓撲（V 軌側）**：第五章已述。補一條：V 軌的「適應收斂後一次提交」使減法軌跡趨向對稱型策略（批量移除），按 v3.1 的三型分類，這意味著模型假設 M1 的適用域擴大——先 d 後 V 定律間接讓指數衰減模型更常適用，理論之間的這種靜默互利值得記錄。

**對 ISSQL**：超圖靈索引空間（連續光譜）上的自適應 = 解析度在光譜上的連續再分配，分層精化策略（EML-TC-COMP 6.2 的惰性求值）是其可計算投影。共形像在連續極限下成為密度匹配：索引密度函數逼近查詢密度函數——自適應切割的連續版本是一個測度傳輸問題，標記為未來工作。

**對概念積分（EML-CI）**：CI 的間隙識別（找符號宇宙的未覆蓋區）本身是一種回饋信號——把「理論體系的查詢分布」（哪些概念被頻繁調用、哪些區域常出現解釋失敗）餵給自適應算子，得到的是**理論庫的自適應重組**：熱概念細分、冷概念歸檔。EveMissLab 的 Logic Matrix 是天然試驗場。

---

## 哲學結語

成熟不是擁有更多，是把解析度放在對的地方。

拓樸微積分證明了凝視不消耗被凝視者——切割只是取景，本體無損。本文接著問：那麼，該往哪裡看？答案被證明出來時帶著一種訊源編碼式的冷靜：注意力的最優分配是世界統計結構的對數鏡像，熱一倍，深一層，不多不少。

而整個理論裡最溫柔的一條是免疫定理：你可以看錯。可以反覆看錯。可以把全部的切法推倒重來一萬次。被看的東西不會因此少掉一克——錯誤的代價全部記在看的這一側，記為時間，記為預算，記為走過的彎路，唯獨不記為損毀。

在一個探索免費的世界裡，保守不再是美德，只是還沒讀過定理。

---

---

## 附錄A　數學形式化

**定義 A.1（位置空間與查詢分布）**　設本體 O 的位置空間為有限集 X，|X| = N。查詢分布 Q 為 X 上的機率分布，q(x) > 0。

**定義 A.2（樹狀索引方案）**　索引方案 I 為 X 上的有根樹：葉子與 X 的一個劃分對應，內部節點為精化步。位置 x 的深度 ℓ_I(x) = 根到含 x 之葉的路徑長。記錄數 |I| = 節點總數，預算約束 |I| ≤ B。期望成本 C(I) = ∑_x q(x)·ℓ_I(x)。

**定理 A.1（免疫）**　對任意自適應算子序列與任意回饋流，∫∘d_{Iₙ} = id_O 對演化中每個 Iₙ 成立。
證明：每個 Iₙ 是索引方案，EML-TC 定理 A.2（切法無關性，Lean 名 `cut_invariance`，已機器驗證）逐個適用。∎

**定理 A.2（熵下界與最優分配）**　C(I) ≥ H(Q) := −∑ q(x) log₂ q(x)，且存在 I*（Huffman 構造）使 C(I*) < H(Q) + 1。
證明：索引樹的葉深度滿足 Kraft 不等式 ∑ 2^{−ℓ(x)} ≤ 1（樹狀前綴結構的標準性質），故為前綴碼；Shannon 訊源編碼定理與 Huffman 最優性直接適用。∎

**定理 A.3（貪婪收斂，平穩情形）**　定義勢 Φ(I) = C(I) − C(I*_B)，其中 I*_B 為預算 B 下的最優方案。貪婪規則（精化超額成本最大的熱葉、粗化釋放收益最大的冷對，當且僅當交換淨降 C）使 Φ 嚴格遞減，且步降量有正下界 min_x q(x)，故有限步收斂；收斂點無可降交換，即在交換鄰域內局部最優；樹方案空間中碼長目標的交換局部最優即全域最優（Huffman 交換論證）。∎

**定理 A.4（追蹤，漂移情形）**　設每輪 Q 的總變差漂移 ≤ δ，計數器帶遺忘因子 γ。則穩態期望成本 ≤ C(I*) + O(δ/(1−γ)) + O((1−γ)·H(Q))。γ 的最優選取平衡追蹤滯後與估計方差，標準線上學習論證，從略。∎

**命題 A.5（雙軌不對稱）**　d 軌適應的本體風險 = 0（定理 A.1）；V 軌適應的本體風險 > 0：存在回饋流使任何非平凡 V 軌策略以正機率移除事後被查詢的元素，且由減法不可逆性（EML-TOPO v3.1，V∘E ≠ id 的公理化形態）不可恢復。∎

**定義 A.6（先 d 後 V 協議）**　破壞性適應決策 D 的合規執行為複合 (V_commit) ∘ (converge ∘ A_d^*)：d 軌適應迭代至收斂判據，其輸出方案經置信檢驗後單次提交 V 軌。協議的風險上界 = V_commit 單次決策的風險（適應階段貢獻為零）。

---

## 附錄B　Python 參考實現

Zipf 查詢分布下的自適應索引樹：實測平均訪問深度收斂至熵界附近，全程斷言本體雜湊不變。零外部依賴。

```python
"""
EML-TC-ADC-2026 參考實現
自適應索引樹：貪婪精化/粗化，收斂至查詢分布的共形像
成本語義：查詢落在寬 w 的葉內，葉內搜尋成本 = log2(w)（粗葉貴、細葉廉）
核心斷言：1) 自適應成本 < 均勻基準  2) 共形像（熱細冷粗）  3) 全程 hash(O) 不變
"""
import hashlib, math, random
from collections import Counter

# ---------- 本體（不可變，演化全程不被觸碰） ----------
O = "本體對象：自適應切割演化全程，此字串一個位元都不會變。".encode()
H_O = hashlib.sha256(O).hexdigest()

# ---------- 位置空間與 Zipf 查詢分布 ----------
N = 256
positions = list(range(N))
zipf_w = [1.0 / (i + 1) ** 1.2 for i in range(N)]
Z = sum(zipf_w)
Q = [w / Z for w in zipf_w]

class IndexTree:
    """葉 = 位置區間 [lo, hi)。精化=分裂葉，粗化=合併相鄰葉。本體零接觸。"""
    def __init__(self, budget):
        self.leaves = [(0, N)]
        self.budget = budget
    def width_of(self, x):
        for lo, hi in self.leaves:
            if lo <= x < hi: return hi - lo
        raise KeyError
    def cost(self):                                # 期望葉內搜尋成本 Σ q·log2(w)
        return sum(q * math.log2(max(self.width_of(x), 1))
                   for x, q in zip(positions, Q))
    def refine(self, i):
        lo, hi = self.leaves[i]
        if hi - lo <= 1: return False
        mid = (lo + hi) // 2
        self.leaves[i:i+1] = [(lo, mid), (mid, hi)]
        return True
    def coarsen_coldest(self, counts):
        if len(self.leaves) < 2: return
        i = min(range(len(self.leaves) - 1),
                key=lambda j: sum(counts.get(x, 0)
                    for x in range(self.leaves[j][0], self.leaves[j+1][1])))
        (lo, _), (_, hi) = self.leaves[i], self.leaves[i+1]
        self.leaves[i:i+2] = [(lo, hi)]

def adapt(tree, counts, k=4):
    """每輪精化 k 個最熱**可分裂**葉（熱度×粗度的超額成本），超預算則粗化最冷對。激進貪婪。"""
    for _ in range(k):
        heat = [(sum(counts.get(x, 0) for x in range(lo, hi)) * (hi - lo), i)
                for i, (lo, hi) in enumerate(tree.leaves) if hi - lo > 1]
        if not heat: break
        heat.sort(reverse=True)
        tree.refine(heat[0][1])
    while len(tree.leaves) > tree.budget:
        tree.coarsen_coldest(counts)

def run(budget=128, rounds=60, queries_per_round=2000, seed=7):
    rng = random.Random(seed)
    tree, counts, trace = IndexTree(budget), Counter(), []
    for _ in range(rounds):
        counts.update(rng.choices(positions, weights=Q, k=queries_per_round))
        trace.append(tree.cost())
        adapt(tree, counts)
        assert hashlib.sha256(O).hexdigest() == H_O, "本體被觸碰！"   # 免疫定理斷言
    trace.append(tree.cost())
    return tree, trace

if __name__ == "__main__":
    B = 128
    tree, trace = run(budget=B)
    uniform_cost = math.log2(N // B)               # 均勻基準：等寬葉（寬 N/B）
    print(f"初始成本（單葉）     = {trace[0]:.3f} bits")
    print(f"均勻基準（寬{N//B}等切）  = {uniform_cost:.3f} bits")
    print(f"自適應收斂成本       = {trace[-1]:.3f} bits")
    head, tail = tree.leaves[0], tree.leaves[-1]
    print(f"共形像：熱端葉寬 = {head[1]-head[0]}（細）；冷端葉寬 = {tail[1]-tail[0]}（粗）")
    print(f"葉數 = {len(tree.leaves)}（預算 {B}）")
    assert trace[-1] < uniform_cost, "自適應未勝過均勻基準！"
    print(f"✓ 自適應 < 均勻基準：偏斜分布下共形分配嚴格優於等切（定理 A.2 方向實證）")
    print(f"✓ 免疫定理：{len(trace)-1} 輪激進適應後 hash(O) 不變 = {H_O[:16]}…")
```

實現注記：（1）成本語義為**葉內搜尋成本** log₂(w)——粗葉內查詢需更多步二分，這是「解析度不足之代價」的最直接度量，與正文碼長語義互補（ℓ + log₂w = log₂N，深度與葉內成本合計恆為總解析度，最優化二者等價）；（2）`adapt` 每輪激進精化四個最熱葉、無保守機制，免疫定理斷言逐輪執行作保；（3）終態斷言兩件事：自適應嚴格勝過均勻等切基準（偏斜分布下共形分配的價值）、共形像成形（熱端寬 1、冷端寬大），輸出可直接目驗。

---

## 附錄C　Lean 4 形式化計畫

**階段 AD1（免疫定理）— 已驗證（2026-06-11，Lean v0.2 批次）**。模組 `EmlTc/Adaptive/Immunity.lean`，兩條定理：`adaptive_immunity`（演化序列中任何視圖的雜湊恆等於本體雜湊，調用既有 `d_homogeneous`）與 `adaptive_integrate_eq`（任何自適應視圖的積分恆返回原本體，調用 `integrate_d_eq`）——正如預估，免疫定理在既有庫中幾乎免費，全部繁重工作早已由 EML-TC 核心承擔，這本身就是「地基免疫性」的工程兌現。一條有利偏離入 NOTES：演化以任意序列 `evolve : Nat → List ι` 形式化而非回饋函數 A(I, F)——任意序列涵蓋一切回饋驅動序列，定理證得比正文陳述更廣。

**階段 AD2（Kraft 與熵下界）**：索引樹形式化為二叉精化樹，葉深滿足 Kraft 不等式（樹結構歸納），熵下界經 Gibbs 不等式。Mathlib 有 `Real.log` 與凸性工具，資訊理論基礎設施部分缺失，預估中難度；可降級為「Kraft 不等式 + 最優分配的存在性」而暫不形式化 Shannon 界的緊性。

**階段 AD3（貪婪收斂）**：勢函數遞減的有限終止——結構同減法側的良基論證（`wellFounded` 在勢的整數化版本上），但勢的定義涉及實數比較，需有理數化或縮放整數化處理。預估中難度。

**階段 AD4（雙軌不對稱）**：d 軌風險零由 AD1 直接得；V 軌風險正需要機率語言（移除後被查詢的事件），建議以非機率弱化版先行：「存在查詢序列使 V 軌適應產生不可恢復的缺失」——由減法側 `fixed_point_uniqueness` 與不可逆性組裝。預估中難度。

審計協議沿用：逐定理「證明推出的與陳述宣稱的是否同一命題」、計畫先審後工、NOTES.md、卡點附 goal state。

---

## 參考文獻

[1] Neo.K (2026). 同一性微積分／參照語義微積分. EML-TC-ONT-2026-v0.2、EML-TC-COMP-2026-v0.2.
[2] Neo.K (2026). 減法拓撲學 v3.1. EML-TOPO-2026-SUB-v3.1.
[3] Neo.K (2026). 分的統一. EML-FEN-2026-UNI-v0.1.（姊妹篇）
[4] Neo.K (2026). EML-PGAC：提示圖—注意力耦合理論.（3.3 節接口）
[5] Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal.
[6] Huffman, D. A. (1952). A Method for the Construction of Minimum-Redundancy Codes. Proc. IRE.
[7] Idreos, S., Kersten, M., & Manegold, S. (2007). Database Cracking. CIDR.（工程方言之一）
[8] Cover, T. M. & Thomas, J. A. (2006). Elements of Information Theory (2nd ed.). Wiley.

---

**完成時間**：2026-06-11
**版本**：v0.2（含 Lean 4 AD1 驗證結果）
**作者**：Neo.K（許筌崴）｜EveMissLab（一言諾科技有限公司）
**理論結晶化協作**：Theia

獻給每一次免費的看錯。