量化的邊界:古德哈特定律的批判性重構與認識論診斷

EVEMISSLAB Logic Matrix · EveMissLab / 一言諾科技有限公司

[認識論邊界宣告 / EPISTEMOLOGICAL DISCLAIMER]

[CHT] 本矩陣內所有論文之公式與數據為「啟發式模擬參數」,用於驗證理論架構與推演因果鏈,未經實證校準,請勿作為現實物理測量數據引用 or 處理。EVEMISSLAB 採行「邏輯先行(Logic-First)」原則:概念架構與系統因果映射優先於統計實證,但不排除未來實證對接。


[ENG] The numerical parameters within these frameworks are illustrative model coefficients used for structural verification and causal mapping; they are not empirically calibrated and must not be treated as physical measurements. This matrix operates on a Logic-First principle: conceptual architecture and causal mapping take precedence over statistical empiricism, without precluding future empirical reconciliation.

量化的邊界:古德哈特定律的批判性重構與認識論診斷

作者:Neo.K(許筌崴) EveMissLab 一言諾科技有限公司 EML-EP-2026


摘要

古德哈特定律(Goodhart's Law)自1975年問世以來,已成為經濟學、管理科學、公共政策乃至人工智能對齊領域的標準引用工具。然而,本文認為,此一定律在理論層面存在多個根本性缺陷:它是現象命名而非機制理論;其普遍性宣稱不具可否證性;它以客觀陳述的姿態預設了觀察者的規範性立場;它將設計失敗誤診為定律運作;它未能處理目標的無限維本質;它對量化失敗的三種結構性類型缺乏區分能力;最終,它成為一種認識論遮蔽機制,阻止了對量化框架本身適用性的追問。本文的核心論點是:古德哈特所描述的現象,其根源不在於「指標被優化後失效」的動態過程,而在於有限維語言結構與無限維現實目標之間不可消除的本體論落差。真正的問題不是指標的腐化,而是形式化語言在嘗試捕捉意圖時必然承受的結構性損失。

關鍵詞: 古德哈特定律、機制設計、量化理論、認識論批判、有限維投影、規則規格化


一、引言:一個廣泛流傳的命名

在現代管理與政策討論中,很少有哪個概念像古德哈特定律那樣既普及又被視為理所當然。從績效考核制度的設計,到政府的教育評量政策,從金融監管指標的選取,到人工智能系統的目標函數設定,這個定律被廣泛援引,其核心命題幾乎已成為常識:「當一個指標變成目標,它就不再是好指標。」

這種普及本身值得警惕。一個足夠模糊的陳述,可以解釋任何觀察到的失敗,也可以在任何反例出現時通過重新詮釋而倖存。它越廣泛地被接受,就越不容易受到嚴格審視。本文的目的,正是對這個廣泛流傳的「定律」進行系統性的批判性解構。

本文的立場並非否認古德哈特所指向的現象真實存在——指標確實可能在優化壓力下與原始意圖脫鉤,這一觀察有充足的經驗支持。問題在於,將這一現象命名為「定律」並廣泛引用,究竟是理論進步,還是認識論倒退?本文主張:古德哈特定律是一個在特定脈絡下具有啟發性的觀察,但在成為普遍理論框架的過程中,它不但未能提供真正的解釋力,反而通過命名的姿態遮蔽了更深層的結構性問題。

本文的批判分七個層次展開,從最表層的形式批評,到最深層的認識論診斷,最終指向一個關於語言、表徵與現實之間本體論落差的根本性問題。


二、古德哈特定律的歷史脈絡與標準敘述

2.1 原始語境

古德哈特定律最初源自英國經濟學家查爾斯·古德哈特(Charles Goodhart)於1975年在一篇討論英國貨幣政策的論文中的一個觀察。其原始表述大意為:「任何被觀察到的統計規律,一旦被用於政策控制目的,就會傾向於崩潰。」這個陳述有著明確的脈絡限制——它是在討論央行使用貨幣量作為政策目標時產生的問題,特別是貨幣主義(monetarism)在英國貨幣政策中的應用失敗。

當貨幣當局試圖控制貨幣供應量以影響通貨膨脹時,金融機構會通過創新貨幣替代品(如新型存款工具)來規避定義範疇,導致被控制的「貨幣量」指標失去與實際經濟活動的聯繫。這是一個具體的、有明確機構背景的觀察。

2.2 廣泛流傳的版本

真正讓這個概念飛躍性傳播的,是英國社會人類學家瑪麗蓮·斯特拉森(Marilyn Strathern)在1997年的一篇論文中給出的更精煉版本:「當一個指標變成目標,它就不再是好指標(When a measure becomes a target, it ceases to be a good measure)。」這個版本去除了貨幣政策的具體脈絡,將命題普遍化為適用於任何量化管理的陳述。

從此,古德哈特定律開始了從貨幣政策術語到管理學常識的征途。它出現在商學院教材、公共行政手冊、人工智能安全研究,乃至流行商業書籍中。其傳播速度之快、引用範圍之廣,本身就成了一個值得研究的現象。

2.3 平行發展:坎貝爾定律

值得注意的是,社會心理學家唐納德·坎貝爾(Donald Campbell)幾乎在同一時期獨立提出了類似的觀察,後稱為坎貝爾定律(Campbell's Law,1979):「任何量化的社會指標被用於社會決策的程度越高,它就越容易受到腐化壓力,並越傾向於扭曲和腐化它本應監控的社會過程。」坎貝爾的版本雖然措辭更為具體,指向了「腐化壓力」這一社會機制,但同樣缺乏對腐化機制的精確形式化描述。

古德哈特定律和坎貝爾定律的平行出現,說明這一現象具有一定的跨領域有效性。然而,一個現象被多個學者在不同領域獨立觀察到,只證明該現象足夠普遍,並不意味著任何一個關於它的「定律」具有充分的解釋力。


三、第一層批判:命名而非機制

3.1 定律的必要條件

在科學意義上,一個稱得上「定律」的陳述通常需要滿足幾個條件:它應該能夠識別作用機制;它應該能夠在給定初始條件下做出定量預測;它應該具有明確的適用邊界;它應該能夠被設計出的實驗所潛在地反駁。

牛頓的萬有引力定律告訴我們引力的大小如何隨距離平方反比衰減,並給出了精確的數學形式。熱力學定律描述的是能量轉換的方向性和不可逆性,並在統計力學框架下有微觀機制的支撐。即使是較為定性的達爾文演化論,也提供了明確的機制(選擇壓力、遺傳變異、適應性差異),並指出了哪些觀察會構成對理論的反駁。

古德哈特定律提供了什麼?它告訴我們一個模式的名稱,但沒有告訴我們:指標的失效速度取決於哪些變量?在哪些條件下指標具有腐化抵抗力?不同類型的指標有不同的失效動態嗎?如何量化一個指標的「可腐化程度」?

3.2 現象命名的認識論地位

現象命名(phenomenological naming)是科學的起點,不是終點。給一類現象貼上標籤,有助於交流和識別,但它本身不構成解釋。「炎症」這個詞描述了一類生理現象,但現代醫學的進步在於識別了細胞介素的信號傳導機制、先天免疫和適應性免疫的區別,以及特定分子通路的作用,而不僅僅是知道「某些組織有時會發炎」。

古德哈特定律停留在命名層次。它說:有一種現象,指標在被設定為目標後會失效。但這個陳述對我們理解為什麼、在什麼條件下、以什麼速度、通過什麼機制,幾乎沒有幫助。

3.3 盧卡斯批判:真正的理論版本

1976年,羅伯特·盧卡斯(Robert Lucas)在一篇題為〈計量經濟學政策評估批判〉的論文中,用嚴格的數學語言表達了一個在結構上類似的洞察:任何基於歷史數據建立的政策模型,一旦被用於實際政策制定,模型的結構關係就會改變——因為理性的經濟行為者會根據政策本身調整其預期和行為,從而使原有的統計關係失效。

盧卡斯批判的力量在於它的精確性:它識別了理性預期(rational expectations)作為核心機制,指出計量模型中的簡化式參數(reduced-form parameters)並非政策不變量(policy invariant)而是政策函數的結果,並為結構計量經濟學(structural econometrics)的發展提供了理論基礎。這不只是一個名稱,而是一個具有可操作含義的理論框架。

相比之下,古德哈特定律的地位更像是「已知盧卡斯批判之前的直覺觀察」,它提前識別了一個真實問題,但沒有能力將其形式化。問題在於,當更嚴格的理論已經存在,繼續在廣泛的場合援引不嚴格的版本,會阻礙理解的深化。


四、第二層批判:普遍性宣稱與不可否證性

4.1 「任何指標」的量詞問題

古德哈特定律的標準表述包含了一個未加限制的全稱量詞:「任何(any)指標」。這個量詞讓命題在邏輯上具有最大的覆蓋範圍,但同時也造成了一個嚴重的認識論問題:它如何能被反駁?

如果某個指標在成為政策目標後依然保持了良好的追蹤性,定律的支持者可以說:這個指標「還沒有受到足夠強度的優化壓力」,或者「這是特殊情況」,或者「暫時有效,長期必然失效」。這些退卻路徑的存在,意味著定律在實踐上是不可否證的——不是因為它是真的,而是因為它足夠模糊,可以容納任何觀察結果。

一個不能被任何可能的觀察結果所反駁的陳述,根據波普爾(Karl Popper)的科學哲學標準,不構成科學命題。它只是一個描述性框架,允許我們在事後將各種失敗歸類其下,但對預測失敗或設計對策毫無幫助。

4.2 存在反例嗎?

直覺上,我們可以想到一些在強優化壓力下保持相對穩健的指標。體重作為健康代理指標,在大眾健身文化的廣泛優化下,與心血管健康的相關性雖有所減弱(因為有人通過增肌而非減脂來降低BMI),但並未完全崩潰。死亡率作為醫療質量的粗略指標,儘管醫院存在選擇性拒收高風險病患的激勵,在統計上依然保持了相當的診斷效力。

古德哈特定律對這些觀察沒有系統性的回應,因為它沒有提供一個理論框架來預測哪些指標在何種條件下具有腐化抵抗力。它只能在每個案例中做事後解釋,無法做事前預測。

4.3 邊界條件的缺失

一個有效的理論應當明確其適用邊界——它在哪裡成立,在哪裡不成立,以及邊界的形態是什麼。古德哈特定律沒有告訴我們:優化壓力需要達到什麼強度才會觸發失效?指標的可操縱性如何影響失效速度?指標是否有某些結構特性能夠增強其腐化抵抗力?當優化者之間存在競爭時,失效動態如何改變?

這些問題不只是學術上的細化要求,它們對於實踐應用至關重要。一個沒有邊界條件的定律,在應用場景中只能告訴人們「要小心」,而無法告訴人們「在哪裡要小心,在哪裡不需要那麼擔心」。


五、第三層批判:觀察者的特權視角與規範性預設

5.1 誰在宣告指標「失效」?

每一次援引古德哈特定律,都預設了一個事實:存在一個知道「真正目標」是什麼的觀察者,而被優化的指標與這個真正目標之間出現了偏離。但這個「真正目標」是從哪裡來的?在絕大多數被用來說明定律的例子中,「真正目標」從未被寫入任何正式規則——它只存在於某個觀察者(通常是研究者或批評者)的詮釋框架中。

觀察蘇聯釘子廠的外部研究者說:「他們的真正目標應該是生產有用的釘子,而不是最多數量的釘子。」但是,這個「真正目標」在計劃指令中從未被如此表述。從計劃當局的形式規格來看,工廠完美地完成了任務。是觀察者帶來了「有用性」這個維度,並以此判斷指標失敗。

這不是一個可以輕易忽略的細節。它意味著古德哈特定律的成立,從根本上依賴於一個特權觀察者的存在——這個觀察者持有一套未被形式化的目標標準,並以此來評判形式化指標的表現。定律表演的是客觀的現象描述,實際上是一個持有答案的裁判在事後宣判比賽規則設計得不好。

5.2 規範性判斷的偽裝

這種結構造成了一個重要的認識論問題:古德哈特定律以描述性的外表呈現,但其內核是規範性的。「指標失效了」不是一個中性的觀察,它隱含了「指標應當如何運作的標準」,而這個標準是觀察者帶入的,不是從被觀察系統中推導出來的。

在英屬印度的眼鏡蛇例子中:殖民政府制定了「按死蛇數量付費」的規定,民眾開始飼養眼鏡蛇以領取賞金。古德哈特的詮釋是:「死蛇數量」這個指標被目標化後失效了。但是,從蛇農的視角來看,他們完全理性地回應了系統的激勵——死蛇的供給確實增加了。是誰宣告指標「失效」的?是一個事後判斷「政策的真正意圖是減少野外蛇群而非支付賞金」的觀察者。

這個詮釋未必是錯的——減少野外蛇群可能確實是較接近殖民政府初衷的目標描述。問題在於,這個判斷是規範性的,它需要被明確識別為規範性的,而不是被掩藏在「定律」的客觀外表之下。

5.3 主體性與觀察的循環

這裡有一個更深的循環結構:宣告指標失效的觀察者,其實是在以自己的意圖標準作為評估基準。這個意圖標準是主觀的、未被形式化的、對系統設計者可能是不透明的。當觀察者說「古德哈特定律發生了」,他實際上說的是「系統的形式化目標與我心目中的真正目標出現了偏離」——這是一個帶有強烈主體性的判斷,而非客觀的現象描述。

這並不是說這樣的批評毫無意義。指出形式化規則與社會目標之間的落差,是政策批評的正當形式。但是,將這種批評包裝成一個客觀「定律」,是誤導性的。它讓本應接受批判性審視的規範性判斷,以自然科學的偽裝逃過了應有的問責。


六、第四層批判:案例的誤診——設計失敗而非定律運作

6.1 重新診斷蘇聯釘子案例

讓我們更仔細地審視這個最著名的例子。蘇聯工廠在「數量」指標下生產微型釘,在「重量」指標下生產巨型釘。古德哈特的詮釋:指標成為目標後失效。

更精確的診斷:計劃規格(plan specification)存在根本性的不完整。一個完整的「有用釘子」規格應當包括:尺寸分布(按用途場景的需求比例)、材料標準、強度測試、市場匹配性驗證。蘇聯計劃者沒有寫出這樣的規格,不是因為「Goodhart定律使得完整規格不可能」,而是因為寫出這樣的規格需要大量信息和設計工作,而計劃經濟體制下的信息聚合機制系統性地導致了這類工作的缺失。

關鍵點在於:如果計劃指令包含了完整的產品規格(包括尺寸分布要求、品質驗收標準和用途適配測試),工廠根本無法通過生產微型釘或巨型釘來達成指標,因為這些產品無法通過驗收。指標的失效是規格不完整的直接後果,而不是指標被目標化的必然命運。

6.2 重新診斷眼鏡蛇案例

殖民政府設立了「按死蛇付費」的賞金制度,結果民眾開始養蛇。古德哈特的詮釋:死蛇數量指標失效。

更精確的診斷:政策規格缺少了兩個關鍵的閉合條件:第一,對蛇的來源沒有限制(應當規定只補貼野外捕獲的蛇,排除人工養殖);第二,缺乏獨立核查機制(應當通過基線調查和野外監測來驗證野外蛇群數量的實際變化)。

在機制設計的語言中,這是一個激勵相容性(incentive compatibility)的設計失敗。一個激勵相容的機制設計應當確保:誠實的策略(實際去野外抓蛇)對理性行為者而言是最優策略,而欺騙性的策略(養蛇賺賞金)是不可行的或成本高昂的。殖民政府的設計沒有滿足這個條件,這是可以通過更好的規格設計來糾正的工程失敗。

6.3 重新診斷英國國民醫療服務等待時間案例

英國NHS設立了「候診時間不得超過四小時」的目標後,醫院開始在停車場讓病患在救護車內等待,直到確定床位後才正式辦理入院手續,以此規避「候診時間」的計時起點。

這不是指標被目標化後失效的案例,而是規則的「計時起點」定義存在可操縱的漏洞。一個更嚴謹的規格應當將計時起點定義為病患到達醫療設施的時刻(包括停車場),而非正式入院登記時刻。這個漏洞是可以預見並封閉的,只要規則設計者考慮了「理性博弈者會如何尋找制度縫隙」這個問題。

6.4 設計失敗與定律的責任分配

在所有這些案例中,有一個系統性的模式:規則設計者未能進行充分的規格閉合(specification closure)——即考慮所有可能的博弈路徑並寫入排除條款。古德哈特定律通過宣稱「這是定律在運作」,有效地將設計失敗重新框架為不可避免的命運,從而為設計者的不盡責提供了掩護。

這不是輕微的詮釋差異,而是具有重要實踐後果的診斷分歧。如果問題是「定律在運作,指標注定失效」,對策是放棄對某些事物的量化管理。如果問題是「規格不完整,激勵設計有漏洞」,對策是做更好的機制設計工作——這是可實現的,有工具支撐的,有理論基礎的。

古德哈特定律通過命名現象為「定律」,推廣了前者,阻礙了後者。


七、第五層批判:目標的無限維性與投影的必然損失

7.1 真實目標的維度結構

前述的批判集中在設計失敗的層面,但古德哈特問題還有一個更深的維度,那是任何有限規格都無法完全解決的:真實的社會目標、組織目標、乃至個體意圖,存在於一個無限維的語義空間中。

「有用的釘子」作為一個概念,包含了:材料適配性(不同木材對釘子的要求不同)、場景多樣性(結構工程與精細木工需要不同規格)、時序依賴(建築行業的季節性需求)、供應鏈約束(庫存邏輯與生產效率的張力)、耐久性要求(不同應用場景對防鏽等性能的差異化需求),以及無數其他相關維度。任何有限的形式規格,都是從這個無限維空間向有限維空間的投影(projection)。

形式地表達:若目標 T 存在於無限維空間 ℝ^∞,任何指標系統 M 都是一個投影 π: ℝ^∞ → ℝ^n,其中 n 為有限正整數。投影的信息損失 ΔI = ‖T - π(T)‖ 是結構性的、不可消除的,只能通過改變投影方向(選擇不同維度)或增加投影維度數(採用更多指標)來部分減緩,但永遠無法歸零。

7.2 指標失效的真正根源

這個框架揭示了古德哈特定律所描述的現象的真正根源:問題不是指標在「被設定為目標後」才失效的。問題是,任何有限維指標從一開始就已經丟失了目標的某些維度。這個丟失是先驗的(a priori),不是在優化過程中才產生的。

優化過程只是讓這個先驗的維度損失變得可見——當一個系統沿著某個被量化的維度進行優化時,它必然會忽略或犧牲那些未被量化的維度,而那些未被量化的維度恰恰是原始目標中被壓縮掉的部分。換言之,優化揭示了投影,而不是造成了投影。

7.3 「更多指標」的失敗

一個常見的回應是:如果單一指標不足,就使用多個指標,彼此交叉驗證。這是一個方向正確但不充分的策略。多個有限維指標的聯合,依然是從 ℝ^∞ 到 ℝ^N(N 較大但仍有限)的投影。對更大 N 的投影減少了信息損失,但同時帶來了新的問題:

其一,多指標系統的內部張力。不同指標之間存在結構性的取捨關係,優化一組指標的組合並不等於在所有維度上都接近真實目標。其二,高維指標系統的可操縱性可能更高,因為優化者有更多的維度可以在其中找到博弈空間。其三,當指標數量增加到某個閾值,系統會因為激勵的分裂和不一致而在整體上喪失導向能力。

古德哈特定律對這個問題的結構性根源沒有任何說明。它停留在「指標失效」的描述,而沒有指出:任何有限指標系統都天然地丟失了無限維目標的某些信息,優化只是放大了這個本已存在的偏差。

7.4 投影方向的政治性

這個框架還揭示了一個鮮少被討論的問題:投影方向的選擇不是中性的,而是帶有價值選擇的。當設計者決定用「死亡率」而非「生活質量」來衡量醫療質量,用「考試分數」而非「好奇心」來衡量教育質量,這不只是一個技術決定,而是一個關於什麼更值得被計量、什麼可以被忽略的價值判斷。

古德哈特定律沒有意識到這個選擇的政治性。它只說指標可能失效,沒有問:為什麼在無數可能的投影方向中,我們選擇了這個?被忽略的維度是被認為不重要,還是因為難以量化所以被忽略,還是因為量化它們會威脅到某些人的利益?


八、第六層批判:量化失敗的三個層次

8.1 一個被壓縮的分類問題

古德哈特定律將所有量化失敗都歸入同一個描述框架:「指標成為目標後失效」。但量化失敗實際上具有不同的結構性根源,需要不同的診斷和不同的對策。將它們全部壓縮進同一個標籤,是分類層次上的粗率。

本文識別了量化失敗的三個結構性層次,它們在問題性質和解決路徑上有本質的差異。

8.2 第一層:真正的不可量化性

某些目標或價值在本體論層面不具備自然的量化結構。「正義感」、「美的體驗」、「道德直覺的整體性」——這些概念不是因為我們還沒有找到好的量化工具而無法量化,而是因為它們的概念結構不是偏序集(partially ordered set),不支持數值映射下的充分保結構性(structure-preserving)表示。

對這一層次的正確回應,不是尋找更好的指標,而是承認量化範式在此處的根本不適用,並尋求其他形式的評估與決策機制——詮釋學(hermeneutics)、實踐智慧(phronesis)、案例法(case-based reasoning)等。古德哈特定律沒有幫助我們識別何時面對的是第一層問題。

8.3 第二層:認識論上假設的不可量化性

第二層失敗更為隱蔽:目標在原則上可以被量化,但由於認識工具的不足或認識論上的惰性,被錯誤地歸類為「不可量化」的東西,最終退而求其次地用了一個粗糙的代理指標。

例如,「企業文化的健康程度」曾長期被視為不可量化,因此只能用間接的代理指標(離職率、員工滿意度調查)來追蹤。但近年來的組織行為學研究表明,通過更精細的測量設計(自然語言處理對內部溝通的分析、社會網絡結構的量化、集體認知測試等),企業文化的某些維度確實可以得到更直接的量化。這裡的原始問題不是「量化了錯誤的指標」,而是「因為認識工具不足而跳過了真正值得量化的維度,選擇了容易量化的代理」。

古德哈特定律對第二層問題的診斷是不充分的,因為它指向「指標選擇失當」,但沒有追問「為什麼我們選擇了這個代理指標而非更好的直接測量」——那個「為什麼」往往是認識論上的惰性或能力不足,而非不可避免的限制。

8.4 第三層:錯誤的適用域與判斷域

第三層是最為精細也最容易被誤診的一類。問題不在於指標本身的有效性——在它的本源域(native domain)中,該指標可能是完全合法且穩健的——而在於它被移植到了一個結構不同的域中使用。這是一個範疇錯誤(category error),偽裝成量化失敗。

考慮「GDP增長率」作為一個例子。GDP作為一個量,有清晰的定義域和計算規則,在衡量「市場交易活動的貨幣規模」這個特定含義上是相對穩健的。但當它被用來衡量「社會整體福利」或「人民生活質量」時,就發生了適用域的錯誤移植——因為GDP的結構(只計算貨幣化的市場交易)本來就排除了大量影響福利的因素(非市場的家務勞動、環境質量、社會連結、閒暇時間等)。

這不是GDP「成為目標後失效」的問題,而是GDP從一開始就不是「社會福利」這個概念的正確量化工具——它們處於不同的數學結構中,前者假設目標空間是所有可貨幣化的交換的集合,後者的目標空間則是多維的人類福祉向量。

古德哈特定律將這三種不同層次的量化失敗統一壓縮成「指標變目標就失效」的敘述,抹去了它們在診斷層面的根本差異,使得針對性的對策開發成為不可能。


九、第七層批判:認識論的遮蔽效應

9.1 封閉深層問題的機制

古德哈特定律對認識論的最深傷害,不在於它說了什麼,而在於它阻止了什麼被問到。當一個概念框架被廣泛接受並成為默認解釋工具時,它不只是提供了答案,還通過預設問題形式來限制了哪些問題可以被提出。

在古德哈特框架中,預設的問題形式是:「我們選擇了哪個指標?指標是否成為了目標?指標是否失效了?」這個問題序列預設了量化本身的正當性,將注意力集中在「哪個指標」上,而不允許我們問:「是否應當在這個域中使用量化方法?該域的概念結構是否支持量化?量化這件事本身會不會系統性地改變被觀察的現象?」

換句話說,古德哈特定律自然化了(naturalizes)有限維測量作為管理和政策的默認框架。它讓人覺得量化是不言而喻的正確方向,只是偶爾會有「Goodhart效應」這個技術性障礙。

9.2 被掩蓋的本體論問題

在教育領域,標準化考試被廣泛用於衡量學習質量。當「考試分數」成為目標,出現了「應試教育」的問題,古德哈特定律被援引來解釋這個失效。但是,這個援引遮蔽了一個更深的問題:在「學習」這個概念的語義空間中,「考試分數」究竟捕捉了什麼,又遺漏了什麼?問題不只是「分數成了目標所以失效」,而是:

學習是什麼?它是一個可以被分解為子維度並分別測量的過程,還是一個整體性的、湧現性的(emergent)現象,其本質在分解測量的過程中被破壞?

如果學習具有整體性,那麼任何部分性的測量都不只是「有偏差的代理指標」,而是從根本上對被測量物的性質有誤解。這不是「哪個指標更好」的問題,而是「指標化這件事是否與被測量物的本質相容」的問題。

古德哈特定律讓這個問題不需要被問,因為它提供了一個較淺的解釋:「換一個更難操縱的指標就能解決問題」。這個解釋有時是部分正確的,但它阻止了我們問那個更根本的問題。

9.3 量化的反身性效應

量化不只是觀察現象的工具,它還主動改變被觀察的現象。當一個域被引入量化評估後,域內行為者的行為模式、動機結構乃至自我理解都會發生根本性的改變。

這個反身性效應(reflexivity effect)比古德哈特所描述的要深得多。不是指標在被目標化後失效,而是量化行為本身重構了被量化的現象。一個醫生在沒有量化評估時,依照其醫療直覺和職業倫理做決策;在引入死亡率排名後,他的決策被引入了一個全新的維度——如何管理自己在排名中的位置。這不是「死亡率指標失效了」,而是「一個醫生」這個角色本身在量化環境中發生了本體論的改變。

古德哈特定律沒有工具來描述這個層面的問題,因為它的框架中,「目標」是固定的,「指標」是對目標的代理,失效是這個代理關係的衰退。它沒有辦法處理「目標本身被量化行為重塑」的情況。


十、根本問題:語言的有限維結構與無限維現實

10.1 規則制定者的真正困境

前述各層批判指向了一個共同的深層根源。我們說設計者的失敗是「規格不完整」——但為什麼規格不完整?是因為設計者懶惰或無能嗎?

在某些案例中,懶惰或無能確實是因素。但在更廣泛的情況下,規格的不完整具有結構性的必然性:形式化語言(任何形式化語言,無論是自然語言規則、數學規格、法律條文還是算法目標函數)都是有限離散符號系統。它可以表達有限多個約束條件,有限多個變量,有限多個條件分支。

而它試圖捕捉的「意圖」,存在於人類心智與社會脈絡的共同構成中,這個構成是無限維的、連續的、情境依賴的。它包含了無數的隱性知識(tacit knowledge)、語用預設(pragmatic presuppositions)、歷史脈絡(historical context)和文化嵌入性(cultural embeddedness)——這些都是任何有限規格系統都無法完整捕捉的。

設計者面對的不是一個工程難題(更努力工作就能解決),而是一個本體論困境(語言的表徵能力與意圖的語義豐富性之間的結構性落差)。

10.2 維根斯坦的警示

路德維希·維根斯坦(Ludwig Wittgenstein)在其後期哲學中指出:遵循規則的能力不能完全由規則本身來說明,因為任何有限的規則陳述都與無限多種「遵循」方式相容,正確地「理解」一個規則需要存在於一個語言共同體(language community)的實踐中,而這個實踐無法被完全顯式化。

這個洞察直接適用於古德哈特問題的語境。規則設計者用有限的語言寫出規格,但規格的「意圖」存在於寫規格者的認知和實踐脈絡中,而不完全存在於規格文本本身。當理性的博弈者以一種技術上符合規格文字但違反規格精神的方式行動時,他們實際上是在利用「規格文本」與「規格意圖」之間的不可彌合的語義間隙。

這個間隙不是因為規格寫得不夠仔細,而是因為寫得「足夠仔細」在語義上不可能達到——它需要將無限維的意圖完整地壓縮進有限維的符號序列,而這從信息論角度就是不可能的任務。

10.3 哥德爾的影子

形式系統的不完備性(incompleteness)在這裡有一個深刻的類比。哥德爾定理告訴我們,任何足夠強的一致性形式系統都無法完全捕捉算術真理——存在在系統內無法被證明但在更高層次的元系統中顯然為真的命題。

類似的結構出現在規則系統中:任何有限的形式規格系統都存在「真空地帶」——既不被規格明確允許也不被明確禁止的行為空間。在這個真空地帶中,理性行為者可以進行規格設計者意圖之外的操作。擴充規格以覆蓋這些真空地帶,只會創造新的更高層次的真空地帶。

這是一個原則性的無法解決的問題,不是一個可以通過更多細心工作來消除的工程挑戰。古德哈特定律沒有觸及這個深度。

10.4 不是規則設計者的問題

這個分析導向了一個關鍵的重新框架:古德哈特所批評的現象,根本責任不在規則設計者,而在於一個更基本的事實——我們要求語言做一件它結構上無法做到的事:完整地表達意圖。

規則設計者是在有限維語言工具的約束下,嘗試捕捉無限維意圖的行動者。他們必然失敗,不是因為他們不夠努力,而是因為他們的工具有原則性的表達能力上限。

如果古德哈特定律的批評對象應當是什麼,它應當是這個隱性假設:形式化語言可以充分表達管理意圖。這個假設才是所有「Goodhart式失敗」的共同前提。但古德哈特定律沒有識別這個假設,遑論對它提出批評。


十一、更適切的理論框架:機制設計的比較

11.1 機制設計理論的貢獻

如果古德哈特定律代表了對「指標失效」問題的前理論(pre-theoretical)命名,那麼機制設計理論(mechanism design theory)代表了真正的理論化嘗試。Leonid Hurwicz、Eric Maskin 和 Roger Myerson 因其在機制設計理論上的奠基性工作獲得了2007年諾貝爾經濟學獎,這一理論方向恰恰試圖回答古德哈特定律所觸及的問題:如何設計規則,使得自利的行為者在追求自身利益的過程中,其行為恰好也實現了設計者的社會目標?

機制設計的核心概念是激勵相容性(incentive compatibility):一個機制是激勵相容的,當且僅當在這個機制下,每個參與者的最優策略恰好是誠實地揭示其私有信息。顯示原理(revelation principle)進一步表明,對於任何貝葉斯納什均衡,都存在一個等效的直接揭示機制(direct revelation mechanism),在該機制下誠實揭示構成均衡策略。

這是一個有數學結構的框架,提供了可操作的設計原則,而不只是一個描述失效的名稱。

11.2 機制設計如何重新框架問題

在機制設計的視角下,古德哈特所描述的問題被重新表述為:給定的機制在策略均衡下,社會選擇函數是否仍然實現了設計者的目標?如果不是,這個機制是激勵不相容的,需要重新設計。

這個框架的優越性在於:它提供了診斷工具(均衡分析、激勵相容性驗證),提供了設計原則(如何構建激勵相容機制),並且允許我們區分哪些設計目標在理論上是可實現的(可執行性,implementability),哪些在原則上不可實現(不可能定理,如Gibbard-Satterthwaite定理關於操縱免疫的投票規則的不可能性)。

不可能定理的存在本身就是對古德哈特定律的一個超越:它告訴我們,某些設計目標在理論上就不可能通過任何機制來實現(滿足給定條件的),而不僅僅說「指標可能失效」。這是一個真正的理論界限,而不是一個隨時可以被特設性補丁繞過的「定律」。

11.3 機制設計的局限與古德哈特問題的殘餘

誠然,機制設計理論也有其局限性。它通常假設行為者的偏好結構是已知的(或者可以被激勵揭示),目標空間是可以形式化表達的,信息的維度是有限且可枚舉的。這些假設在某些重要應用中成立,但在許多現實場景中(特別是涉及複雜組織目標、文化價值、長期社會效果的情況)並不成立。

這裡正是前幾節分析的「無限維目標」問題的殘餘之處:即使我們有了機制設計的工具,我們仍然面對「目標本身無法被有限維形式化」的本體論困境。機制設計可以幫助我們在給定了足夠精確的目標形式化之後,更好地設計激勵結構;但它無法幫助我們解決目標本身的無限維性問題。

這個殘餘問題是真實的,深刻的,值得認真對待的。但它是一個完全不同性質的問題,與古德哈特所描述的「指標因為被目標化而失效」的動態過程,在機制和解決路徑上都不相同。將它們混為一談,是古德哈特框架的另一個理論代價。


十二、走向更完整的理論語言

12.1 我們需要什麼樣的理論

基於前述批判,我們可以描繪一個對「量化治理失敗」問題更充分的理論框架所需要具備的條件。

第一,它需要一個關於目標維度結構的顯式理論——區分可量化、假設不可量化與真正不可量化的目標,並提供判斷標準。

第二,它需要一個關於形式規格與意圖之間語義間隙的理論——承認這個間隙的結構性必然,並提供在此限制內最優化規格閉合的工具。

第三,它需要一個關於量化反身性的理論——描述量化行為如何改變被量化的現象,包括行為者自我理解和動機結構的轉變。

第四,它需要可操作的不可能性結果——明確哪些設計目標在理論上是不可實現的,以便防止在不可能的目標上浪費設計資源。

第五,它需要對量化失效的三種類型進行區分診斷,並為每種類型提供對應的干預路徑。

古德哈特定律在這些維度上全部缺席。它只是一個觀察起點,而一個有效的管理和政策科學,需要的遠不只是命名起點。

12.2 古德哈特的正確貢獻

公正地說,古德哈特的觀察確實識別了一個值得認真對待的現象:在組織和政策環境中,形式化的量化評估與其試圖代理的目標之間,存在系統性的張力,這種張力在優化壓力下會被放大。這個識別本身具有歷史性的啟發價值,特別是在1970年代量化管理方法在各域廣泛採用的背景下。

問題不在於原始觀察,而在於它從一個有具體脈絡的貨幣政策觀察,被普遍化為一個涵蓋所有量化管理場景的「定律」,並在這個過程中失去了所有本應驅動理解深化的機制性內容。這種普遍化沒有增加理論力量,只是增加了標籤的覆蓋面。


十三、結語

本文通過七個層次的批判,試圖說明古德哈特定律在理論地位上的根本局限:它是一個現象命名,缺乏機制解釋;它的普遍性宣稱使其不可否證;它以客觀描述的面目隱藏了觀察者的規範性預設;它將設計失敗誤診為自然定律,為設計者的不盡責提供了掩護;它未能處理目標的無限維性及投影損失的必然性;它對量化失敗的三種結構性類型缺乏區分能力;最終,它通過命名遮蔽了關於量化框架適用性的更深問題。

所有這些批判最終指向同一個根本問題:古德哈特定律錯誤地將一個語言學與本體論問題——有限維形式語言無法完整捕捉無限維意圖——轉化為一個關於「指標被腐化」的組織學問題。這個轉化讓問題看起來更可解決(換更好的指標就行),但實際上是在一個淺層回答了一個需要深層答案的問題。

真正的困境在於:任何試圖用有限符號捕捉管理意圖的努力,都面對語言本身的表徵能力上限。這不是設計者的失敗,這是語言的宿命。承認這個宿命,才是設計更誠實的管理系統的第一步——不是尋找完美的指標,而是在深知任何指標都是有損壓縮的前提下,謹慎地選擇在哪個維度上壓縮,以及如何保留對壓縮本身的自覺意識。

管理的智慧,不在於找到完美的量化工具,而在於知道量化的邊界在哪裡,以及邊界之外用什麼代替它。


參考文獻

Goodhart, C. A. E. (1975). Problems of monetary management: The UK experience. Papers in Monetary Economics, 1. Reserve Bank of Australia.

Strathern, M. (1997). 'Improving ratings': Audit in the British university system. European Journal of Education, 32(3), 305–321.

Campbell, D. T. (1979). Asshole: Contrasts in the assessment of national productivity. Sociological Methods & Research, 7(4), 350–373.

Lucas, R. E. (1976). Econometric policy evaluation: A critique. In K. Brunner & A. H. Meltzer (Eds.), The Phillips Curve and Labor Markets, Carnegie-Rochester Conference Series on Public Policy, 1, 19–46. North-Holland.

Hurwicz, L. (1960). Optimality and informational efficiency in resource allocation processes. In K. J. Arrow, S. Karlin, & P. Suppes (Eds.), Mathematical Methods in the Social Sciences. Stanford University Press.

Maskin, E. (1999). Nash equilibrium and welfare optimality. Review of Economic Studies, 66(1), 23–38.

Myerson, R. B. (1979). Incentive compatibility and the bargaining problem. Econometrica, 47(1), 61–73.

Wittgenstein, L. (1953). Philosophical Investigations. Blackwell.

Popper, K. R. (1959). The Logic of Scientific Discovery. Hutchinson.

Gödel, K. (1931). Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. Monatshefte für Mathematik und Physik, 38, 173–198.

Soros, G. (1987). The Alchemy of Finance. Simon & Schuster.

Sen, A. (1999). Development as Freedom. Oxford University Press.

Ostrom, E. (1990). Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge University Press.


EML-EP-2026 | EveMissLab 一言諾科技有限公司 版權所有,轉載請標明出處

原始檔(供 RAG/下載):papers/paper-742.md [md]