非對稱觀察耦合:論人–智能體複合觀察者及其外感官閘門架構
EML-AOC-2026-v0.1 EveMissLab(一言諾科技有限公司) · 許筌崴(Neo.K)
摘要
本文處理一個被普遍錯置的工程問題:當人與本地智能體(local agent)協同工作、並以 AI 眼鏡為共享感官介面時,系統效率的瓶頸究竟在哪裡。坊間直覺把瓶頸歸給「傳輸太慢、需要有線連接以消除延遲」,本文論證這是一個歸因錯誤——端到端延遲的主導項是推理與代理迴圈,而非傳輸;真正稀缺的資源不是頻寬,是人的注意力。
在拆除這個錯置之後,本文提出一個可落地的架構:智能體主體常駐於內部(機器可讀域)、其感官為雙邊分層(內部遙測常開、外部視覺按需);外部觸發為「世界側廉價偵測」與「人側凝視/意圖」之邏輯或;回呈通道採前注意壓縮,並嚴格保留給分岔點。本文進一步推導出升級策略應為可逆性自適應的預測式看門人、識別出「陳舊之意」的漂移問題、揭示該架構在創作域與工程域之間的結構翻轉、以三個具體域(工程、創作、外科)展開其運作,並誠實計算其內建代價(技能萎縮與自動化自滿)與失效模式。最後,本文把單體架構推廣到多智能體仲裁,並由此推論出社會尺度的後果:變異數爆炸、驗證崩潰,以及裁決租金的崛起。
全文的核心立場是:我們設計的從來不是「人加工具」,而是一個複合觀察者;其能力不在任一構件,而在耦合本身。
一、引論:問題的錯置
設想一個具體場景。一名創作者或工程師戴著 AI 眼鏡工作,眼鏡與其本地運行的智能體相連。最直接的念頭是:無線傳輸太慢,會有延遲,不如插線直連,讓資料即時流動。
這個念頭錯在歸因。在 AI 眼鏡的即時管線中,端到端延遲大致由三段構成:擷取與編碼、推理與代理迴圈、解碼與渲染。其中主導項是中間那一段。當智能體為本地運行的大模型級系統時,單次前向傳遞加上多步工具迴圈的延遲落在數百毫秒到秒級;而眼鏡到本機的控制與文字傳輸,在無線下不過個位數到低十毫秒。拉一條實體線下去,解決的是總預算 5% 到 10% 的部分(此為量級估計,標註為假設),而 80% 以上仍躺在模型本身。
命題 1.1(瓶頸錯置) 在人–智能體即時協作系統中,若智能體為本地推理級系統,則傳輸延遲不是端到端延遲的主導項;以消除傳輸延遲為目標的有線化,其邊際效益上界由傳輸段佔總延遲之比決定,通常顯著小於推理段。
唯一真正受傳輸限制的情境,是把高解析影像連續串回智能體做持續視覺——但那是頻寬、散熱與功耗問題,不是延遲問題;而連續全解析串流本身,在絕大多數任務中是個被製造出來的偽需求。更何況,一條把使用者頭部綁在主機上的實體線,在人因上是災難:它廢掉了「人是自由的外部觀察者」這個本應是整套設計前提的角色。線在跟設計打架。
把錯置拆掉,真正的問題才浮現:不是如何讓兩個觀察者更快地互看,而是如何在一個注意力稀缺的系統裡,讓兩個結構不同的觀察者各司其職。
二、定位:從增益到複合觀察者
在展開架構之前,須先把它放進思想史的座標,以辨明它不是什麼。
人機增益的古典構想,可上溯到 Engelbart 的「增益人類智能」(augmenting human intellect):工具放大人的既有能力。這個構想是加性的——工具是人的延伸。本文的架構與此不同:它不是把一個更快的人接到機器上,而是把兩個異質觀察者耦合成一個新的觀察主體。差別在於,Engelbart 的人仍是唯一的觀察者,工具只是放大其視野;而此處,智能體是一個獨立的、占據不同觀察流形的觀察者,系統的能力來自兩者視差的互補,而非任一者的放大。
它也不是「助手」範式。助手範式中,智能體被動等待指令,人問才答;其資訊流是人發起、智能體回應的單向脈衝。本文第四節將論證,純由人發起的設計在結構上退化(推論 3.1)。複合觀察者的智能體不是等待被詢問的僕役,而是持續警戒、自主決定何時驚動人的看門人。
與此最接近的技術類比,反而是混合專家(MoE)架構中「路由即辨識」的洞見:系統的智能不在某個專家的算力,而在路由器把當前輸入導向正確專家的辨識能力。在複合觀察者中,人的注意力即是那個唯一的、昂貴的專家;而看門人系統即是路由器——它的全部價值,在於辨識「此刻何者值得導向人」。把人機協作的重心從「算力」移到「路由」,是本文與助手範式最深的分歧。
最後須與「半人馬」(centaur)模型劃清界線。西洋棋的半人馬構想中,人與機器共同評估同一盤面,人篩選機器提出的候選著法——兩者觀察的是同一個對象,分工在評估的層次。本文的複合觀察者不同:人與智能體觀察的根本不是同一個對象。人看外部物理世界與不可讀的意,智能體看內部狀態與可讀的境;它們的視場在交集上甚小,價值恰在於這份不重疊。半人馬靠的是冗餘校驗(兩個評估者看同一盤面以互補錯誤),複合觀察者靠的是視差互補(兩個觀察者看不同盤面以擴張總視場)。前者降低方差,後者擴張覆蓋;混淆兩者,會把一個應當擴張覆蓋的系統,誤設計成一個只是降噪的系統。
三、兩個觀察流形
人與智能體之所以值得耦合,不是因為其一更聰明,而是因為兩者占據不同的觀察流形。
人的這一側是具身的、帶意圖的、有周邊視覺與情境的外部感知;智能體那一側是全量的、可索引的、可查詢的內部狀態感知。這與同一基底在不同觀察群下渲染出不同世界的結構同構——觀察並非被動接收,而是在特定變換群下的渲染。兩個觀察者不是看同一個世界的兩個角度,而是各自的內稟世界相對於彼此是不可化約的。
這裡必須立刻區分兩個常被混為一談的概念:智能體住在哪裡(locus),與智能體能感知什麼(sensorium)。
定義 3.1 智能體之 locus 為其主體常駐之域;sensorium 為其可獲取訊號之集合。二者邏輯獨立。
把這兩者分開,是整套架構的第一塊基石。智能體的 locus 在內部(它原生地住在計算狀態裡),但它的 sensorium 可以是雙邊的:一條朝向內部(系統狀態遙測),一條朝向外部(透過眼鏡相機)。錯誤的設計把「主體在內部」誤讀為「只感知內部」,於是要嘛讓智能體對物理世界全盲,要嘛為了讓它看見外部而把它整個搬到外部、丟掉它對內部狀態的原生透明性。正解是:locus 內部、常駐;sensorium 雙邊、分層。
眼鏡在此架構中的角色,因而不是「螢幕」或「相機」,而是膜——兩個觀察流形之間的選擇性通透界面。相機是人把外部世界餵給智能體的孔;顯示是智能體把內部狀態翻給人看的孔。膜的設計,即通道、觸發與翻譯的設計,決定了整個複合觀察者的能力上界。
四、感官分層與雙觸發架構
內部那條感官通道(系統狀態遙測)應當常開,因為它廉價、且是智能體 locus 所在,本就近乎免費。問題全在外部那條。
一個常見但錯誤的設計,是把外部視覺通道整個掛在人的意圖上:人想讓智能體理解外面時,才開啟相機。這看似節制,實則把人變成了智能體外部覺察的瓶頸。
推論 4.1(人作為閘門的退化) 若外部感知純由人的意圖觸發,則系統只能確認人已決定要注意的對象,而結構上不可能捕捉人所漏看者;而人所漏看的時刻,恰是異常最具代價的時刻。此設計把「不眨眼的看門人」降級為「被詢問才應答的助手」。
正解是把外部觸發拆成兩個邏輯或在一起的源。其一為世界側:一層廉價、永遠開啟、運行於裝置端的偵測(動作、語音活動偵測、粗粒度視覺),作為觸發器;唯有訊號越過閾值,才升級到全解析擷取與智能體推理。這一層才是真正的看門人——它的廉價與常開,使智能體對外界的警戒不再依賴人是否恰好想到要看。其二為人側:人的意圖與凝視,作為第二觸發器。
兩個觸發器邏輯或在一起,昂貴的路徑(擷取加推理)才被喚醒。人因而是觸發器之一,而非唯一。
這個分層架構附帶一個重要的後果:無線完全足夠。因為在此設計下,需要連續高頻寬串流的時刻幾乎不存在——我們砍掉的不是傳輸,而是「常時串流」這個偽需求本身。引論中那條線,至此徹底不必要。
此外,「把注意力轉移到外部查看」這個動作裡,藏著一個被低估的強力原語:人的凝視本身就是一條指向通道。人看著哪裡,智能體即知相關者為何。這比口頭描述高頻寬得多,也比語音指令精準。
命題 4.2(凝視即意圖) 在共享外部視場的耦合系統中,人的注視向量是一個低成本、高頻寬的意圖訊號,其資訊密度高於等時長的語音描述。凝視應被當作第一級輸入,而非「開啟相機」這類粗動作的副產品。
五、升級策略:分岔點、可逆性與預測式看門人
骨架至此已立:內部常駐、感官分層、雙觸發。但骨架上最關鍵的一塊肌肉尚未長出——升級策略:智能體憑什麼決定「此刻應當驚動人」。
整套架構的價值幾乎全壓在這個判斷上。一個報得太勤的看門人,比沒有更糟,因為它製造警報疲勞、竊取注意力;一個報得太疏的看門人,則會漏掉那唯一重要的時刻。
關鍵不在「偵測到偏差就報」,而在估計此刻打斷人的期望槓桿:在這個時點介入,對下游軌跡的影響有多大,相對於偷走人注意力的成本。而槓桿的核心變量是可逆性。
命題 5.1(可逆性自適應閾值) 設介入的期望槓桿為 L、注意力成本為 C、當前時點的不可逆度為 rho。看門人應在 L·rho > C 時升級。不可逆時點(油彩將乾、程式將部署、刀將落下)抬高有效 L·rho,壓低升級閾值;高度可逆的時點則抬高閾值。
這意味著看門人不能是反應式的,必須是預測式的。它需要運行一個前向模型,推斷當前軌跡會漂向何處、哪一刻是「最後還來得及」的點,然後在那一刻——而非偵測到偏差的第一刻——出聲。第一刻出聲是噪音,因為偏差常會自行收回;分岔過後才出聲則是事後諸葛。看門人要瞄準的,是那個最後的可逆窗。
推論 5.2 升級的最優時點不是偏差最大時,而是「再不介入即不可逆」的臨界時;這要求看門人具備局部的、近似的軌跡預測能力,即一隻有限的拉普拉斯之眼。
這正是分岔點觀察方法論的物理落地:智能體在判定域中持續監測、集中算力、收斂判斷,只在分岔臨界把一個決策呈到人眼前。眼鏡因而是這套方法論長出來的器官,而非一塊被動的螢幕。
還須補上一條被閾值設計常忽略的不對稱。看門人的兩類錯誤代價不等:漏報(該升級而未升級)的代價,是放任一個不可逆損害發生;誤報(不該升級而升級)的代價,是一次注意力的偷竊。在高度可逆的時段,誤報的相對代價較高(打斷了人,而漏掉的東西本可挽回),故閾值應偏保守;在不可逆的時段,漏報的相對代價陡升(錯過即無可挽回),故系統應寧可誤報。
推論 5.3(錯誤代價隨可逆性翻轉) 漏報與誤報的相對代價隨不可逆度 rho 而翻轉:rho 低時誤報為主要代價,rho 高時漏報為主要代價。因此最優閾值不僅其高低隨 rho 調整(命題 5.1),其偏誤方向亦隨 rho 翻轉——可逆時偏向沉默,不可逆時偏向出聲。
六、回呈通道:前注意壓縮與翻譯算子上界
人到智能體的通道(凝視加意圖)是稀疏而高值的;但反向那條——智能體到人的升級回呈——才是真正稀缺、且必須嚴格節制的通道,因為它與人的外部注意力爭奪同一塊中央視覺資源。
由此導出一條設計紀律:升級回呈不應是文字。讀字慢,且會把中央視覺從手上的活硬生生拽走,造成認知隧道與注意力捕獲——航空與駕駛的抬頭顯示研究對此已有數十年的血證。
命題 6.1(前注意回呈) 升級回呈應採前注意(pre-attentive)形式:周邊的、瞥一眼即懂的、與當前任務同模態的線索——一抹色偏、一個空間方向的微推、一聲音調變化。其判準是「不去注視它即可讀到」。
這是第三節中「膜」的具體化,也是注意力對撞成本的真正解法。用翻譯算子的語言來說:升級是一次從智能體全內部狀態,到「人最小可行動 token」的翻譯。
命題 6.2(翻譯算子上界) 設升級回呈為翻譯算子 T,其作用為把智能體內部狀態 S 映射為人可行動表徵 a = T(S)。則整個複合觀察者的有效頻寬,以 T 的保真度與速率為上界。兩個完美的觀察者,中間若隔一條低保真或低速的翻譯通道,其聯合效能約等於單一觀察者。
換言之,複合觀察者系統的工程重心,不在兩個構件各自的強度,而在它們之間那一道翻譯的銳利程度。
七、漂移問題:陳舊之意與意圖再接地
這是整套架構中最硬的開放問題。兩個觀察者都會漂移。人會疲勞、適應、隧道化;但更麻煩的,是智能體對「意」的推斷會變陳舊。
借用真知框架的語彙:意,是意圖中的知識宇宙與其執行意向;境,是執行結果與外部更大真知宇宙的實際匹配度。智能體看得到境(畫布相對參照、程式相對規格的實況),卻讀不到意(意圖本身),只能推。而意是會移動的:畫家畫到一半改了念頭,工程師中途重構了目標。
命題 7.1(陳舊之意) 智能體在時刻 t0 推斷出人的意圖 I(t0),並以之為標靶量度偏差。若實際意圖 I(t) 隨時間演化,而智能體鎖死於 I(t0),則它將把人的意圖演化誤判為執行偏差,並對之發出錯誤升級。
這正是創作主權問題的普適化(見下節):不只畫家,任何長任務都會撞上。智能體量的,是相對一個它只能推、且本身在移動的標靶之偏差。
解法是週期性的意圖再接地:設計一些廉價的時刻,讓人重新斷言或更新標靶。凝視能持續洩漏當下的注意與意圖,有所助益,但不足夠。
坦白(本文不掩飾的開放項) 意圖再接地沒有免費的解。系統設計者面對一個權衡:要嘛接受智能體永遠落後人的意一個身位(欠擬合人的當下意圖),要嘛付出頻繁再接地的打斷成本(以注意力換同步)。不存在無代價的標靶同步。此項列為 v0.1 的核心未解問題。
八、領域翻轉:從工程到創作
這套架構可推廣到工程以外,但推廣時必須警惕一個翻轉:哪一側對機器透明,在不同領域中會整個倒過來,而這個翻轉決定了它如何被使用。
在工程域,內部(碼、執行、狀態)對智能體是原生透明的——它本就住在那裡;需要相機的是外部物理世界。所以看門人放在內部,人留給外部與價值判斷。
在創作域,這個對應翻轉了。對智能體透明的,反而是兩個視覺域:畫布與參照(模特、風景、靜物)都是可拍攝的。真正沒有感測器的,是創作者腦中那張意圖中的畫。智能體看得到境(畫布相對參照的實況),讀不到意(意圖的圖像)。
弔詭的是,正因如此,創作域反而是看門人原理更好的例證。創作者是浸泡在自己的執行裡的:盯久了會色彩適應、會失去新鮮之眼、會看不見自己的錯;今日所畫,須待明晨方能看出其歪斜。而智能體從不適應、不隧道、不疲勞——它是那隻永遠新鮮的眼。「借一隻不會累的廉價眼睛」這件事,在創作域比在工程域更值錢:它報的是「你的明度整體在向參照的暗側漂移」「重心在悄悄右移」「你說要冷調,而調色盤讀起來在轉暖」。
但這裡有一條工程域所沒有的硬界線,絕不可越:
命題 8.1(創作主權) 在創作域,意與境之間的落差常常即是作品本身——未經計算的偏差,往往正是風格生長之處。智能體無法區分「應修正的偏差」與「應保留的偏差」,因為這條界線住在它讀不到的意之中。因此智能體可以報出落差,但永遠不能是判定落差為錯誤的那一個。人對意的主權,在此不是偏好,而是結構上的必需。
由此抽出普適原理:凡是人橫跨兩個域、其中一域對機器可讀而另一域不可讀的協調任務,皆吃同一套。廉價的連續看門人放在機器可讀的那一側,人守住不可讀的那一側。差別只在哪一側可讀,以及人所守的究竟是判斷,還是不可被代理的意圖。
九、三個域的具體展開
抽象架構需以具體運作檢驗。以下把同一套架構落到三個觀察性質不同的域。
工程域。 人在外部(讀規格、與同事對話、判斷產品價值),智能體在內部(持續遙測測試套件、型別檢查、執行軌跡、資源洩漏)。世界側觸發此處退化為「內部側觸發」:某個測試由綠轉紅、某個不變量被破壞、記憶體曲線開始發散——這些越過閾值即升級。可逆性映射為部署的逼近度:在本地分支上的偏差高度可逆(閾值高),逼近合併與部署時不可逆度陡升(閾值降)。回呈以前注意形式呈現:編輯器邊欄一抹漸深的色,而非彈窗的長文。人對「這個架構決策值不值得」的價值判斷,智能體不置喙——那是不可讀的意。
創作域(以繪畫為例)。 人在執行內部(手在畫、眼在浸泡式適應),智能體在外部(相機持續比對畫布與參照、追蹤明度分布、重心、色溫漂移)。看門人捕捉的是創作者因適應而看不見的緩慢漂移。可逆性映射為媒材的物理時序:水彩將乾、油層將疊死之前,是不可逆窗,閾值在此驟降。命題 8.1 在此最為吃緊:智能體報「重心右移」可以,但「右移是錯」的裁定權必須留在人手——因為那或許正是構圖意圖的演化。
外科域。 人在外部(視野、觸覺、對病人整體狀態的具身判斷),智能體在內部與儀器側(影像、生命徵象、出血速率、器械位置遙測)。此域的不可逆度幾乎恆高,故閾值恆低、看門人恆敏。但也正因不可逆,命題 8.1 的主權界線在此是法律與倫理的硬約束而非美學偏好:智能體報出異常生命徵象的趨勢可以,術中決策的裁定權不可被代理。三個域的共同骨架不變,變的只是哪一側可讀、可逆度的時間分布,以及主權界線的剛性。
十、社會的膜:被觀察者的可見性
前文把眼鏡視為人與智能體之間的膜。但這張膜還有第二面,朝向他人。
當人戴著一副持續感知的眼鏡進入社會空間,他不只是在觀察,他同時把自己變成了一個可被辨識為觀察者的存在。膜在此是雙向的:它讓佩戴者看見更多,也讓周遭的人看見「這個人正在以機器之眼看著我」。
這帶來一個本架構無法在工程層面解決、卻必須誠實列出的後果:看門人的常開警戒,在社會空間中會與他人的隱私期待直接碰撞。世界側的廉價連續偵測,正是「他人最不願被持續記錄」的那一層。技術上節制串流(只在閾值升級時擷取)能減輕資料留存,卻不能消除「被一隻不眨眼的眼盯著」的社會感受——因為那感受來自佩戴的事實本身,而非資料是否被存下。
命題 10.1(社會膜的不對稱) 佩戴式持續感知裝置造成觀察的不對稱:佩戴者獲得對環境的增益觀察,而環境中的他人承擔被觀察的成本,卻不享有對等的觀察能力或退出選項。此不對稱不是資料政策能完全補償的,因為其代價部分來自可見性本身的符號學效果——「在場即被記錄」的預設改變了社會互動的基調。
這把問題推回政治符號學:一副眼鏡不只是一個感官介面,它是一個在社會場中改變權力梯度的符號。誰戴、誰被戴著看,本身就是一種梯度。本文不解決這個問題,但拒絕假裝它不存在——任何只在「佩戴者效率」維度上最優化的設計,都在外部性上欠了一筆未計的帳。
十一、結構性代價:技能萎縮與自動化自滿
任何誠實的架構都必須計算自己的當量。這套架構的內建代價是技能萎縮與自動化自滿。
人一旦把警戒外包給看門人、自己不再親自盯那個機器可讀域,那麼當看門人靜默失效時——它不是報錯,而是該響而未響——人已經失去了親自接手所需的那塊肌肉。這在航空業已被血淋淋地記錄了數十年:對自動化的過度依賴,意味著當自動化失效時,操作者恰恰失去了捕捉該失效的能力。
命題 11.1(在環細流) 一個誠實的設計必須刻意保留一條「人在環內」的細流,週期性地要求人親自感知機器可讀域、親手接管片刻,以防技能退化至無法接手。此細流與「最大化卸載」的效率目標直接衝突。
這不是 bug,而是這類系統的結構性張力。設計者只能選擇在哪個點上權衡——卸載多少、保留多少在環——而無法消除這個張力本身。任何宣稱「全自動且零退化」的人–智能體系統,要嘛尚未遇到靜默失效,要嘛在計算當量時作弊。
十二、多智能體仲裁:注意力作為不可搶占核心
看門人不必是單一智能體。在已有多個本地智能體並行運行的設置中,可讓它們各守一個子域、各自升級,並在其上架設一個仲裁者,決定哪一個升級值得佔用人那條唯一的注意力通道。
關鍵的洞見是:人的注意力是序列資源。多個並行的看門人爭奪一個序列輸出口,這在結構上等同於作業系統中的中斷優先級調度。
架構 12.1(注意力調度) 將人的注意力建模為複合系統中唯一的、不可搶占(non-preemptible)的核心;所有看門人皆為請求中斷的週邊。仲裁者依命題 5.1 的期望槓桿對中斷排序,並在不可搶占期間將低優先中斷緩衝或丟棄。
此架構與既有的執行視覺化基礎設施(多虛擬機窗口、智能體介面、訊息匯流)天然契合:它本就是把那套「執行即介面」的可視化原則,從機器內部狀態擴展到「人的注意力作為一台必須被審慎調度的稀缺處理器」。
十三、失效分類學
複合觀察者的失效,不發生在構件,而發生在耦合。以下分類其主要失效模式,作為設計檢核。
其一,靜默失效:看門人該響而未響。最危險,因為它與「一切正常」在表面上不可區分;唯一防線是第十一節的在環細流。
其二,陳舊標靶失效:看門人鎖死於過時的意,把人的演化報為錯誤(命題 7.1)。其症狀是升級頻率隨任務推進而異常升高——人沒做錯更多,只是離 t0 的舊意更遠。
其三,注意力飽和失效:多個看門人並行升級,超出單一序列通道的吞吐,導致人對所有升級一律忽略(警報疲勞的極端)。這是第十二節仲裁未做好時的崩潰模式。
其四,翻譯失真失效:回呈算子 T 保真度不足,人接收到的是誤導性的壓縮(命題 6.2)。前注意線索若編碼錯誤,比文字更危險,因為它繞過了審慎閱讀。
其五,對抗性升級:在社會或多方場景中,第三方可能刻意製造越閾事件以劫持人的注意力。看門人的觸發器即是攻擊面。
這五類的共同點是:它們都不是任一構件「壞掉」,而是耦合的某個環節——觸發、預測、翻譯、仲裁——失準。這再次印證:此系統的工程重心在膜,不在構件。
十四、社會尺度推論:變異數爆炸、驗證崩潰與裁決租金
把這套架構從個體推到群體,會得到一組不那麼令人安心的推論。坊間常把 AI 增益下的人群想像為一個二分:多數人廢話化(產出空洞),少數人強者化(能力暴增)。本文論證這個二分有三個洞。
首先,增益是乘子而非加項。乘子作用於接近零的意上,得到的仍接近零——更糟的是得到「有自信的零」;作用於強訊號上才放大。
推論 14.1(變異數爆炸) AI 增益作為乘性算子,其作用不是抬高人群能力的平均,而是撐大其變異數;且此分裂首先發生於個體內部——同一人在其有強意之域被放大為強者,在其無意卻照樣產出之域同步廢話化。分裂的先是人本身,而非人群。
其次,經由耦合得到的強者化,不等於內在變強。
推論 14.2(耦合強度之脆性) 抽掉增益,經耦合放大的「強者」會跌回、甚至跌破其增益前的基線(因放大期間自身技能萎縮)。穩健的強者,是把增益當作可拆卸鷹架而非器官的人;多數所謂的變強,是變成了一個過不了解耦這關的更強複合體。
第三,也是最關鍵的:「廢話化」是錯誤的下限框架。空洞的話語會自報其空,可濾、可忽略。真正吃人的,是有自信、流暢、無意圖、且表面與真貨不可區分的產出——即真知框架中所謂的天魔:虛的實相,假知冒充真知。
推論 14.3(驗證崩潰) 增益的真正代價不在「噪音增多」(可濾),而在「用以分辨能力的廉價訊號全面失效」:文憑、流暢度、產量皆不再具區分力。成本因而整體轉移至驗證之上。
由此進入政治經濟的結論。當變異數爆炸疊加驗證崩潰,稀缺資源便從生產(人人皆能產出)挪移到裁決:誰有權決定哪一份放大後的產出為真。這是權力問題,而非技能問題。
推論 14.4(裁決租金) 在驗證崩潰的條件下,握有驗證層(標準、閘門、信任基礎設施)者收取裁決租金。社會尺度上的「強者化」未必歸於意最強之人,更可能歸於握住裁決咽喉之人——他既不產出強訊號,亦不退化,只對「強者與廢話之間的落差」抽稅。
因此,二分為三:強者、廢話化者,以及第三類、可能是主導類的——驗證的守門人。增益這個乘子放大了一切訊號,卻不附帶任何分辨真假的能力;而那個缺口,從不會空著無人佔據。
十五、本體論結語:複合觀察者作為一段關係
把這整套抽到底,我們會發現,所設計的從來不是「人加工具」,而是一個複合觀察者。
人結構性地困在單一視點裡:看不見自己剛畫完的畫(會適應)、看不見自己執行中程式的全狀態、看不見自己的盲點。智能體並不更聰明,它只是困在另一個、互補的牢籠中——它對意全盲,對外部世界須借道,對不可逆的價值判斷無權置喙。
這套架構,是把兩個都不完整的觀察者綁在一起,使彼此恰好覆蓋對方結構性的盲區。誰都不完整;唯有系統完整。因此真正的設計問題,從頭到尾都不在兩個構件之上,而全在耦合——那些通道、觸發、翻譯與仲裁。前文的每一個失效模式,都不是構件壞了,而是這段關係的某處失準。
完整的觀察者從來不是一個東西,而是一段關係。工具能替你看見你看不見的;卻替不了你想看見什麼。境可以外包,意不能。看門人替你守住境的偏移,好讓你那隻會累的眼,專心去看只有你看得見的——那張還沒畫出來的畫。而當乘子放大了世上一切訊號、卻獨獨不放大分辨真假的能力時,最後真正強起來的,往往不是看得最準的人,而是收「看不準」這筆稅的人。
於是這篇關於如何讓人與機器更好地一同觀看的文章,在盡頭處交回的,並不是一個更高效的系統,而是一個更古老的問題:當看見變得廉價,看得準,將成為唯一還算數的東西。