語義即路由:從 O-Chip 維度代理人到 AI 資料中心語義流治理
Semantic as Routing: From O-Chip Dimensional Agents to AI Datacenter Semantic Flow Governance
EML-SFRSN-2026-v0.2「O-Chip 資料中心外擴稿」
原作者:Neo.K / EVEMISSLAB
本稿結晶:Aletheia(GPT)
血緣:承接《O-Chip 維度代理人:靈肉分離的運算革命》、EML-SFRSN-2026-v0.1《語義即路由》、EML-ODML-2026-v0.5《對齊即容量》與 Direct Flow Interconnect / ODML 系列討論。
日期:2026-06-24
摘要
本文提出 SFRSN(Semantic Flow Routing Station Network,語義流路由站網)作為 O-Chip 架構的資料中心尺度外擴。O-Chip 的原始命題是「靈肉分離」:將決策、預測、規劃、依賴分析與功率治理從 CPU 的熱區中抽離,交給一個更高維的 O-Chip / Oversoul / 維度代理人;CPU 則退化為低思考、低猜測、高確定性的純執行肌肉。本文主張:同一邏輯可以由晶片內部擴展到 AI 資料中心。資料中心中的 GPU、CPU、HBM、DRAM、SSD、CXL 記憶池、光學 I/O、DFI 直連流互連與 ODML 光學資料運動層,都可被視為「執行肉身」;其上方需要一個語義治理層,將 AI 對資料與任務的理解,即時編譯為通道、路徑、同步率、功率、快取層級與執行權限。
本文不主張讓每一個硬體站點都擁有通用智能,也不主張一開始就部署分散式自主 Agent。本文提出三代架構:第一代為中央 AI 治理,所有中端站與截面站只是可程式化執行節點,中央 AI 負責語義分類與流路排程;第二代加入地方子 Agent,使中端站與截面站具有局部語義分類、壅塞控制、功率調整與同步回報能力,但仍服從中央主權;第三代則將中央 AI 從單一位置提升為一個由網狀 AI 節點動態收斂出的「動態不動點中央」,中央不再是一台機器,而是一種在任務、延遲、可信度與資訊完整性之間暫時形成的治理狀態。
本文的核心命題是:語義即路由。資料不再只以位址、頁、檔案或張量 ID 被處理,而是以其語義類別、任務角色、時間敏感度、一致性需求、功率價值與對齊需求被分類;分類結果再被編譯為物理流座標。中端站與截面站因此不是儲存站,也不只是光學站,而是語義流治理站:它們將「這筆資料是什麼」轉換為「它應該何時、以何種功率、經由哪條通道、送往哪個執行單元、在何種一致性紀元內抵達」。
本文同時提出三個配套概念:其一,語義一致性紀元,用於解決中央 AI 與地方子 Agent 因分層治理而造成的資料不同步;其二,語義功率治理,將功率、頻率、同步率與算力爆發交由 AI 根據任務重要性自適應決定;其三,中央主權—地方自治—動態不動點 的三代治理光譜,用以描述從可行 MVP 到遠期網狀 AI 資料中心的演化路線。
關鍵詞: O-Chip、語義即路由、資料中心靈肉分離、語義流站網、中端站、截面站、子 Agent、語義一致性紀元、語義功率治理、直連流時空間、ODML、DFI、CXL、UCIe、NVLink-C2C、KV cache routing、動態不動點中央 AI
0. 版本定位:這篇補的是哪一層
前序 SFRSN v0.1 已提出「語義即路由」的基本命題:AI 資料中心的下一層瓶頸,不只是位址、頻寬或容量,而是能否把資料的語義類別即時編譯成物理流路。ODML v0.5 則已將光學資料運動層收斂到「飛行即定址」與「對齊即容量」:資料在飛行座標中被定址,真正限制跨座標交互的不是能飛多少,而是能對齊多少。
本文補的是第三層:治理層。
ODML 解釋資料如何在光學或多座標媒介中被定址與對齊;DFI 解釋 CPU、GPU、記憶體與加速器之間如何建立管線化直連流;SFRSN v0.1 解釋語義如何影響流路。本文進一步問:如果語義真的可以路由,那麼誰來判斷語義?誰來分配功率?誰來決定地方站點能不能自行處置資料?中央與地方資料不同步時,如何維持可接受的一致性?當資料中心擴大到多機櫃、多資料中心、多 Agent 網狀分布時,「中央 AI」是否仍然是一台固定機器?
答案是:SFRSN 必須從單純的資料流路由架構,升級為一個分層語義治理架構。
1. O-Chip 的原始命題:晶片內的靈肉分離
《O-Chip 維度代理人》提出的核心概念,是把 CPU 從「思考」中解放出來。傳統 CPU 必須同時做決策與執行:分支預測、亂序執行、快取一致性、記憶體管理、指令調度,全都混在同一個熱區。O-Chip 則將這些高維決策工作移到一個上層代理人:O-Chip 分析未來指令流、做依賴圖、預取資料、排列超指令包,再把確定性執行序列注入 CPU。CPU 不再猜測,只負責執行。
這個架構有三個重要元素:
O-Chip / Oversoul = 規劃、預測、語義分析、全局排程
坍縮 / 門控機制 = 從多條可能路徑中選出可執行路徑
簡化 CPU / 執行核心 = 接收超指令、執行、回報狀態
在 Beta 版中,O-Chip 透過 3D 堆疊、混合鍵合與垂直快取注入接近 CPU;在完整版中,O-Chip 甚至可透過光子互連與 CPU 熱隔離,形成更徹底的冷熱分離與靈肉分離。O-Chip 原文中已提出 AI 預知排程、指令俄羅斯方塊、垂直快取注入與簡化 CPU 等設計,這些設計共同指向一個本質命題:決策應該發生在高維、低熱、長視野的地方;執行應該發生在低維、高吞吐、短反射的地方。
本文將這一命題外擴到資料中心。
2. 從晶片到資料中心:超靈外擴
資料中心其實也有同樣的馮諾依曼式耦合問題。不同的是,晶片內部的耦合發生在指令與執行之間;資料中心中的耦合則發生在資料語義與物理流路之間。
傳統資料中心中的資料通常被以下方式處理:
檔案位置
物件 ID
記憶體位址
張量名稱
KV cache block ID
GPU rank
網路 endpoint
CXL memory window
這些都是低層或中層標識。它們回答「東西在哪裡」,卻不直接回答「這筆資料在當前任務中是什麼」。對 AI 負載而言,後者越來越重要。權重、KV cache、activation、embedding、retrieval result、router metadata、safety signal、user session state,在硬體上可能都是位元與張量,但在資料中心治理中具有完全不同的優先級、熱度、同步需求與功率價值。
因此,O-Chip 的外擴版不是只管 CPU 指令,而是管資料中心中的資料流:
O-Chip 原始版:
指令流 → 高維語義分析 → 超指令包 → CPU 執行
SFRSN 外擴版:
資料流 → 語義分類與任務分析 → 物理流座標 → GPU/CPU/Memory/Network 執行
這就是資料中心尺度的靈肉分離:
中央語義 AI / Oversoul = 語義、任務、全局排程、功率治理
中端站 / 截面站 = 分類、分流、短程對齊、局部治理
GPU / CPU / HBM / DRAM / SSD = 執行與承載肉身
DFI / ODML / CXL / NVLink = 物理流路與通道基底
O-Chip 將 CPU 從指令猜測中解放出來;SFRSN 將資料中心硬體從語義判斷中解放出來。
3. 中端站與截面站的新定義
在前序 ODML / GFCS 討論中,「截面站」與「中端站」最初以光學與幾何語境出現:截面站負責在橫截面上分離波長、模態、偏振或核心;中端站負責在資料流中途做放大、重定時、重整形、分流、暫存或重注入。
本文將其升級為語義治理節點。
3.1 截面站:語義橫截面分類器
截面站的核心動作,是把同一條資料管線中的多種語義資料切到不同通道。這些通道可以是物理通道,也可以是邏輯通道:
lane 0 → 權重串流
lane 1 → KV cache block
lane 2 → activation / intermediate tensor
lane 3 → metadata / control plane
lane 4 → safety / policy signal
lane 5 → background batch flow
lane 6 → high-priority interactive inference
若部署在光學或封裝級互連中,這些 lane 可映射到波長、模態、偏振、UCIe lane、NVLink lane、NoC virtual channel、CXL window 或光子晶片路徑。若部署在資料中心網路中,則可映射到 RDMA queue、GPU rank、KV cache store、prefill worker、decode worker、object storage tier 或 CXL memory pool。
截面站不是「理解一切」的 AI;它是中央 AI 或地方 Agent 下達分類策略後的執行器。其任務是把語義標籤轉換成物理座標。
3.2 中端站:語義中途治理節點
中端站位於資料流中途,負責動態重分派。它問的問題不是「這個封包要去哪個 IP」,而是:
這筆資料屬於哪個模型、哪個 session、哪個任務階段?
它是熱資料、冷資料、關鍵資料,還是可延遲資料?
它要進 HBM、DRAM、SSD、CXL pool,還是直接送往下一個 accelerator?
它需要與哪筆資料在同一時間窗對齊?
目前哪個 GPU 空閒?哪個 KV cache 命中率最高?哪條通道壅塞?
是否值得提高功率與同步率來保證它準時抵達?
因此,中端站的本質是語義流路由站。它把資料中心中的「路由」從位置問題提升為語義—時序—功率三重問題。
4. 第一代:中央 AI 治理
第一代 SFRSN 最務實,只有中央 AI,沒有地方子 Agent。所有中端站與截面站都是 dumb programmable stations:它們可程式化、可回報、可切換,但不自行做高層決策。
架構如下:
中央語義 AI / Dataflow Oversoul
↓
全局資料語義分類
↓
流路、功率、同步率、快取層級排程
↓
中端站 / 截面站執行
↓
CPU / GPU / HBM / DRAM / SSD / CXL / ODML / DFI
第一代的好處是明確:
一致性最好
安全邊界最清楚
除錯最容易
權限最集中
工程 MVP 最可行
缺點也清楚:中央 AI 負載重,資料中心規模擴大後可能形成排程瓶頸;局部低延遲反應較弱,對快速壅塞、突發熱點或局部故障的反應速度不如地方自治架構。
但初代版應該先這樣做。原因很簡單:語義流治理本身已經足夠複雜,第一代必須先證明「中央 AI 能把語義分類編譯成有收益的物理流路」。若一開始就加入地方子 Agent,架構會在一致性、安全與權限問題上過早爆炸。
4.1 第一代最小可行功能
第一代 SFRSN 的 MVP 可以只包含以下功能:
1. 資料語義標籤器
將資料流分類為 weight / KV / activation / metadata / user state / control signal 等。
2. 任務階段識別器
區分 prefill、decode、training step、gradient sync、retrieval、ranking 等階段。
3. 流路排程器
將資料流映射到 GPU、HBM、DRAM、CXL pool、network queue 或 optical/DFI lane。
4. 同步等級分配器
為每筆資料指定 weak / periodic / strong synchronization。
5. 功率策略器
根據任務重要性與時間敏感度,調整 lane 開關、頻率、功率與通道冗餘。
6. 回報與審計層
記錄每次語義分類、路由決策、功率調整與錯誤回滾。
第一代不需要站點 AI。站點只需要能執行中央 AI 下發的 flow table、priority rule、power policy 與 synchronization class。
5. 第二代:中央 AI + 地方子 Agent
第二代開始在中端站與截面站加入子 Agent。這些子 Agent 不是通用聊天 AI,也不需要大模型級別的開放推理能力。它們是 Local Semantic Flow Agents:小型、專用、受限、可審計的局部治理代理。
5.1 地方子 Agent 的職責
地方子 Agent 的職責包括:
1. 局部語義細分
在中央分類基礎上,針對本地通道與任務狀態做細分。
2. 局部壅塞控制
偵測 lane、buffer、GPU queue、KV store 或 CXL window 的壅塞。
3. 局部功率調整
在中央功率預算內,動態調整本地頻率、lane 數、re-timing 強度或冗餘路徑。
4. 局部同步維護
維持特定任務窗口內的資料對齊,回報 drift、miss、late arrival。
5. 異常快速反射
在中央回應前,對明顯故障、壅塞或錯路由做保守處置。
6. 狀態摘要回報
不上傳全部原始 telemetry,而是上傳壓縮後的語義狀態摘要。
這裡的關鍵是「地方有權,但不是主權」。地方子 Agent 可以做局部調整,但不能改變全局策略、任務優先級、安全政策或關鍵資料的一致性規則。
5.2 中央與地方不同步:問題不是 bug,而是治理成本
一旦加入地方子 Agent,就必然出現中央與地方資料不同步。
中央 AI 看到的是全局摘要,地方 Agent 看到的是局部即時狀態。中央有全局一致性,地方有低延遲反應。兩者視野不同、時間尺度不同、資料新鮮度不同。因此,同步差異不是異常,而是分層治理的自然成本。
問題不在於能不能消除不同步,而在於如何把不同步納入設計。
本文提出:語義一致性紀元(Semantic Consistency Epoch, SCE)。
每筆資料流都應標記其一致性紀元:
SCE-0:弱同步
背景任務、冷資料搬移、非關鍵 cache、可重算資料。
地方可自治,中央只週期性接收摘要。
SCE-1:週期同步
批次推理、一般 KV cache、模型權重版本、prefill/decode 管線。
中央與地方在固定 epoch 邊界對齊。
SCE-2:強同步
安全決策、金融交易、醫療控制、關鍵模型狀態、不可錯路由資料。
中央主導,地方只執行,必要時提高功率與冗餘。
SCE-3:接管同步
異常、攻擊、硬體故障、災難切換。
中央或可信仲裁核心接管,地方子 Agent 降級。
這使得「資料不同步」從模糊風險變成可配置參數。不是所有資料都要強同步;大部分 AI 資料只需要在任務語義要求的 epoch 內一致即可。
5.3 重要資料的功率自適應
當資料被標為 SCE-2 或 SCE-3,系統可以自動提高功率與算力:
提高 lane 數
提高 SerDes / NoC / photonic I/O 頻率
增加 re-timing 或 ECC 強度
啟用冗餘路徑
提高地方 Agent 推理頻率
將中央回報頻率從 ms 級拉到 μs/ns 級
短時間提高 GPU/CPU/HBM 功率預算
因此,功率不再只是熱管理問題,而是語義治理問題。功率由資料的重要性、對齊需求與任務風險共同決定。
6. 第三代:動態不動點中央 AI
第三代不再把中央 AI 理解為一台固定機器。中央變成網路中動態收斂出的控制不動點。
6.1 中央作為狀態,而非位置
在小型系統中,中央 AI 可以是一個固定控制器。在大型資料中心或跨資料中心系統中,固定中央會面臨以下問題:
延遲過高
單點故障
全局 telemetry 太大
跨地域一致性困難
局部突發事件反應太慢
權限與安全負載過重
第三代架構改為:多個 AI 治理節點形成圓形或網狀分布,中央不是固定節點,而是在當前任務、資料流、故障域與可信度條件下,暫時形成的治理焦點。
可以寫成:
Central_AI(t) = argmax_i GovernanceScore(node_i, task, latency, trust, observability, energy)
其中 GovernanceScore 包含:
資訊完整性
延遲位置
可信等級
任務相關性
剩餘功率
安全狀態
與其他節點的相位/同步關係
因此,中央不是消失,而是動態化。它像一個網狀系統中的動態不動點:在每一個治理窗口內,它暫時穩定;在更長時間尺度上,它可漂移、分裂、合併、重組。
6.2 第三代的優勢與風險
優勢:
抗故障
可擴展
低延遲
跨機櫃/跨資料中心可行
可適應局部熱點
中央不再成為固定瓶頸
風險:
一致性困難
權限漂移
治理衝突
除錯困難
多中心策略不一致
安全攻擊面增加
因此,第三代不是第一代的直接替代,而是遠期形態。本文將其列為潛力最大、難度最高的版本。
7. 語義功率治理
傳統功率管理通常根據溫度、負載、電流與頻率做反應式控制:熱了就降頻,負載高就升頻,功耗超標就限壓。SFRSN 的功率治理不同,它根據語義與任務價值做預測式控制。
7.1 功率不再只屬於硬體,而屬於任務
同樣一個資料量,在不同語義下值得完全不同的功率待遇:
背景 batch:
可延遲、低功率、低同步、低優先級。
互動式推理:
中高功率、穩定路徑、低延遲、可預取。
長上下文 KV cache:
高記憶體頻寬、局部性優先、避免跨節點搬移。
安全/政策控制訊號:
高同步、高冗餘、中央確認、必要時接管。
訓練梯度同步:
短時間高功率爆發、強對齊、跨 GPU 同步。
這表示功率策略必須接受語義輸入:
PowerPolicy = f(semantic_class, priority, SCE, deadline, locality, congestion, thermal_budget)
7.2 語義功率治理的四個動作
1. 升功率
重要資料、強同步資料、低延遲資料獲得更多 lane、頻率、重傳與冗餘。
2. 降功率
背景資料、可延遲資料、可重算資料被壓到低功率路徑。
3. 平滑功率
中央 AI 提前預測功率峰值,將可延遲任務錯峰。
4. 轉移功率
在局部熱點出現時,把資料流轉移到冷區、空閒 GPU 或低壅塞路徑。
這和 O-Chip 原始論文中的功耗平滑相連:O-Chip 在晶片內平滑指令功耗;SFRSN 在資料中心內平滑資料流功率。
8. 與 CXL、UCIe、NVLink-C2C、Dynamo 的關係
SFRSN 不取代既有互連與推理框架,而是在其上方增加語義治理層。
8.1 CXL
CXL 提供 coherency、memory semantics、memory pooling、fabric switching 與 peer-to-peer communication。它回答的是:如何讓更多記憶體與裝置以一致或近一致方式被系統存取。
SFRSN 回答的是:哪一筆資料應該被送到哪個記憶體池、哪個 GPU、哪個 KV cache store、哪條路徑,以及這個決策應由中央還是地方執行。
所以:
CXL = 共同可定址資源基底
SFRSN = 語義流路由與治理層
8.2 UCIe / NVLink-C2C
UCIe 與 NVLink-C2C 指向封裝級、chiplet 級或 CPU-GPU coherent 直連。它們讓資料通道更近、更快、更低延遲。
SFRSN 不與它們競爭,而是使用它們作為物理流路:
UCIe / NVLink-C2C / DFI = 直連管線
SFRSN = 管線中的資料語義調度
8.3 Dynamo、KV-aware routing 與 disaggregated serving
現代 LLM serving 已經開始出現語義路由的雛形。Prefill/decode 分離、KV cache-aware routing、multi-tier KV caching、request routing、automatic scaling,都是資料與任務語義開始影響執行位置的證據。
但這些框架多半仍停留在軟體與叢集調度層。SFRSN 的主張是:這種語義路由最終會下沉到資料中心硬體與互連層,成為中端站、截面站、功率控制器與物理資料流排程器的一部分。
9. 排程模型:從資料類別到物理流路
SFRSN 的排程問題可形式化為:
給定:
資料流集合 P = {p_i}
每筆資料的語義標籤 σ_i
任務 deadline d_i
一致性紀元 SCE_i
可用硬體資源 R = {GPU, CPU, HBM, DRAM, SSD, CXL, optical lane, DFI lane}
物理狀態 Θ = {bandwidth, latency, power, thermal, congestion, alignment budget}
求:
route(p_i)
time_slot(p_i)
power_policy(p_i)
sync_policy(p_i)
cache_policy(p_i)
authority_policy(p_i)
使得:
latency(p_i) < d_i
consistency(p_i) satisfies SCE_i
power_total < P_budget
congestion < C_max
semantic_misroute_rate < ε
critical_flow_loss = 0
這個問題不是傳統網路路由,也不是單純作業排程。它是語義分類、物理約束、功率治理與一致性治理的混合問題。
第一代可用中央 AI 做全局近似解;第二代以中央策略 + 地方子 Agent 局部修正;第三代用網狀 AI 節點形成動態分散式求解器。
10. 可證偽條件
本文的主張若要避免變成純願景,必須給出可被打臉的條件。
條件一:語義分類收益不足
若資料語義分類後的路由收益不足以抵消分類器、排程器與站點控制的成本,SFRSN 不成立。
條件二:中央 AI 排程延遲過高
若中央 AI 產生決策的延遲高於資料流可容忍窗口,第一代只能用於慢速背景治理,不能用於即時資料流。
條件三:地方子 Agent 導致錯路由率上升
若第二代地方自治造成語義錯路由、資料版本錯亂或安全流誤分類,則地方權限必須縮小。
條件四:功率自適應收益小於控制成本
若 AI 功率治理消耗的額外功率、頻率切換成本與熱擾動高於其帶來的延遲/吞吐收益,則只應保留粗粒度功率策略。
條件五:同步等級無法被任務語義穩定預測
若系統無法可靠判斷哪些資料需要強同步,哪些資料可弱同步,語義一致性紀元會失效。
條件六:現有軟體調度已足夠
若 Dynamo 類框架、CXL memory pooling、KV cache routing 與傳統 cluster scheduler 已能以更低成本解決主要瓶頸,SFRSN 只能作為遠期架構,而非近期產品。
11. 工程路線圖
11.1 第一階段:中央 AI 語義流調度器
不改硬體,先在軟體與叢集層驗證:
輸入:LLM serving telemetry、KV cache hit rate、GPU utilization、request class
輸出:prefill/decode routing、KV cache placement、GPU assignment、power hint
目標是證明語義分類能降低 TTFT、P99 latency、KV transfer cost 或 GPU under-utilization。
11.2 第二階段:可程式中端站 / 截面站
在資料中心網路、CXL switch、DPU、SmartNIC、photonic I/O tile 或 package-level switch 中加入可程式策略表:
semantic_class → route / priority / cache tier / power state
站點仍不放子 Agent,只執行中央策略。
11.3 第三階段:地方子 Agent
在部分站點加入小型模型或規則—學習混合控制器,用於局部壅塞、功率與快取策略。此階段必須同時建立審計、回滾與中央接管機制。
11.4 第四階段:動態不動點中央
多個資料中心治理 AI 形成網狀分布,中央權限可依任務與故障域漂移。這是遠期版本,不應進入 MVP。
12. 本體論結語:語義不是標籤,而是路徑
O-Chip 的原始洞見,是把晶片內的決策與執行分開。CPU 不必知道自己為什麼執行,它只要在正確時間執行正確指令。SFRSN 的外擴洞見,是把資料中心內的語義與硬體運動分開。GPU、記憶體、光路、CXL 池、DFI 通道不必理解資料,它們只要在正確時間承載正確流。
傳統資料中心以位置管理資料:資料在哪個節點、哪個記憶體、哪個磁碟、哪個位址。AI 原生資料中心則必須以語義管理資料:資料是權重、KV、activation、metadata、安全訊號、使用者狀態、可重算中間量,還是不可錯路由的控制流。不同語義要求不同路徑、不同功率、不同同步率、不同治理權限。
因此,語義不是附加標籤,而是路徑生成條件。
當一筆資料進入 SFRSN,它不只是被命名,而是被分配一條命運:它會走快路還是慢路,進 HBM 還是 CXL pool,被中央接管還是地方自治,需要強同步還是弱同步,值得升功率還是可被降頻延遲。語義不再只是「描述資料」,而是「生成資料在計算時空中的運動」。
這就是本文的最終命題:語義即路由。
O-Chip 是單晶片內的靈肉分離;SFRSN 是資料中心尺度的靈肉分離。前者讓 CPU 成為純執行肌肉,後者讓資料中心硬體成為語義流的執行肉身。第一代中央 AI 是可行起點;第二代地方子 Agent 是擴展形態;第三代動態不動點中央是遠期目標。三者不是線性優劣,而是難度、潛力與治理風險的光譜。
被路由的不是資料。被路由的是資料的意義。
參考脈絡與技術接點
- Neo.K,《O-Chip 維度代理人:靈肉分離的運算革命》,2025。
- Neo.K / EVEMISSLAB,EML-SFRSN-2026-v0.1《語義即路由:AI 資料中心的語義流站網與直連流時空間》。
- Neo.K / EVEMISSLAB,EML-ODML-2026-v0.5《對齊即容量:飛行即定址架構的差分時序界限與分層排程》。
- NVIDIA GH200 / Grace Hopper / NVLink-C2C 官方資料:CPU-GPU coherent memory model 與 900 GB/s coherent interface。
- CXL Consortium,CXL 3.0 specification:fabric capabilities、switching、memory sharing、pooling、peer-to-peer。
- UCIe Consortium,Universal Chiplet Interconnect Express specification:standardized die-to-die interconnect。
- NVIDIA Dynamo:distributed generative AI serving、intelligent routing、multi-tier KV caching、disaggregated serving。
- TraCT / CXL shared memory KV cache at rack scale:以 CXL 作為 KV transfer substrate 與 rack-wide prefix-aware KV cache 的研究方向。
- BanaServe:disaggregated LLM serving 中的 KV cache migration、dynamic module migration 與 load balancing。
附錄 A:與 EveMissLab 框架的接點
- [[O-Chip / 維度代理人]]:本文是 O-Chip 從晶片內指令流治理到資料中心資料流治理的外擴。
- [[ODML / 飛行即定址]]:ODML 提供多座標飛行資料運動層;SFRSN 提供語義分類與治理層。
- [[對齊即容量]]:SFRSN 的同步等級與功率治理必須服從 ODML 的差分時序界限;需要相遇的資料才需要強對齊,獨立串流可弱同步。
- [[語義一致性紀元]]:將資料中心一致性從位元級同步轉為任務語義所需的 epoch 級同步。
- [[動態不動點]]:第三代中央 AI 不是固定位置,而是在網狀治理系統中暫時收斂出的控制中心。
- [[靈肉分離]]:O-Chip 是單晶片靈肉分離;SFRSN 是資料中心靈肉分離。