從搜尋到辨識_魔方重驗技能認知_EML-COG-2026

EVEMISSLAB Logic Matrix · EveMissLab / 一言諾科技有限公司

[認識論邊界宣告 / EPISTEMOLOGICAL DISCLAIMER]

[CHT] 本矩陣內所有論文之公式與數據為「啟發式模擬參數」,用於驗證理論架構與推演因果鏈,未經實證校準,請勿作為現實物理測量數據引用 or 處理。EVEMISSLAB 採行「邏輯先行(Logic-First)」原則:概念架構與系統因果映射優先於統計實證,但不排除未來實證對接。


[ENG] The numerical parameters within these frameworks are illustrative model coefficients used for structural verification and causal mapping; they are not empirically calibrated and must not be treated as physical measurements. This matrix operates on a Logic-First principle: conceptual architecture and causal mapping take precedence over statistical empiricism, without precluding future empirical reconciliation.

從搜尋到辨識:以魔術方塊重驗技能型內隱認知的命題框架

A Propositional Framework: Re-validating Skill-Based Implicit Cognition through the Rubik's Cube

作者: Neo.K | 機構: 一言諾科技有限公司(EveMissLab) | 對練/結晶化: Theia 文件編號: EML-COG-2026-LRC(Local-Representation Collapse) | 版本: v0.1 | 日期: 2026.06


摘要

本文以魔術方塊(3×3×3)為單一受控載體,將分散於認知科學數十年的既有結論——組塊化、技能程序化、內隱/程序記憶、心像旋轉、前向模型、無模型與有模型增強學習、自動化的實例理論、內容定址記憶、延展認知——重新組織為一組可檢驗的命題與猜想。本文不主張任何新的實證發現。 其貢獻有三:其一,提供一個把上述異源理論收攏在同一受控對象上的命題化框架;其二,明確辨正一個流行但接反的直覺——「高手在解題時於狀態樹中搜尋」——指出狀態樹搜尋是學習期的鷹架而非專家執行期的機制,專家是被蒸餾出的反應式策略;其三,以展平式維度重構(FDRS)的語彙,把「局部表徵」精確化為「全局狀態空間的有損商映射」,並指出專家的查詢是保鄰近的聯想檢索,恰為雜湊(散列)的對偶。全文採命題—推論—猜想格式,附可證偽預測、範圍限制與神經對應,並在附錄給出與 FDRS 算子的對照。

Abstract. Using the 3×3×3 Rubik's cube as a single controlled substrate, this paper re-organizes established results across cognitive science—chunking, skill proceduralization, implicit/procedural memory, mental rotation, forward models, model-based vs. model-free reinforcement learning, instance theory of automaticity, content-addressable memory, and extended cognition—into a set of testable propositions and conjectures. It claims no new empirical findings. Its contributions are a unifying propositional frame on one controlled object; a correction of the popular-but-inverted intuition that experts search a state tree at solve time (the tree is a learning-phase scaffold, distilled into a reactive policy); and an FDRS reading in which "local representation" is the lossy quotient of the global state space, and expert retrieval is a similarity-preserving associative lookup—the dual of a hash.


第一章 導論

1.1 問題與動機

一個普通人,在不具備任何群論、不理解魔方狀態空間結構的前提下,經過數週練習,能穩定地把一個被打亂的魔術方塊還原。其狀態空間規模約 $4.3\times10^{19}$,遠超任何徒手窮舉或顯性記憶所能涵蓋。這個日常事實構成一個尖銳的問題:一個高維、動態、連接複雜度極高的結構,如何在缺乏顯性理論的情況下,被內化為可即時執行的技能?

這個問題之所以非平凡,在於它同時違反了兩個樸素直覺。第一個直覺是:要解決一個如此龐大的組合問題,必須「理解」它的結構。但事實是大多數能還原魔方的人完全不懂魔方群、不知道神為數(God's Number)為 20、甚至說不清自己中段在做什麼。第二個直覺是:技能既然能被執行,就應該能被清楚言說。但事實是高手往往無法完整解釋自己的手在做什麼——你若打斷他、要他逐步報告,他的表現反而崩潰。這兩個違反,正是內隱認知的指紋。

本文的立場是:這個問題的大部分,在認知科學既有的文獻中其實已經被回答了——只是答案分散在組塊化、技能習得、內隱記憶、運動控制與增強學習等彼此少有對話的領域。魔方的價值不在於它能催生新理論,而在於它是一個單一、離散、可完全形式化、又對人類具有真實難度的受控載體,足以讓這些異源理論在同一對象上彼此校準、互相驗證。換言之,魔方不是新答案的來源,是把舊答案擺在一起對照的試管。

1.2 為何選擇魔方作為驗證載體

魔方具備一組罕見的並存性質:(一)狀態空間有限且可精確計數,群結構封閉;(二)操作集小(六面、各三種變體),可窮舉;(三)全局正確性有明確判準(解開/未解開);(四)對人類而言難度真實,需要數週至數年的練習曲線;(五)專家的外顯敘述(公式、相位)與內隱執行(手感、辨識)可分離觀察。這五者使魔方成為比西洋棋(分支因子過大、終局判準模糊)或人工語法(缺乏空間—運動維度)更乾淨的技能認知試管。此外,魔方同時跨越知覺、空間想像與精細運動三個系統,使它能一次照見「辨識—決策—執行」的完整迴路,而非只觸及其中一段。

1.3 誠實定位與貢獻

再強調一次:本文不是新發現。 它是一次綜合與重驗。其貢獻限於:

  1. 把既有結論命題化、收攏於單一載體;
  2. 辨正「專家於狀態樹中搜尋」此一接反的直覺;
  3. 以 FDRS 語彙精確化「局部表徵」並指出查詢的聯想本質。

凡涉及量化(如組塊容量、反應時)之處,本文僅引用文獻既有結果,或明確標註為說明性假設。本文亦在第九章誠實界定魔方類比的適用範圍與其失效之處,避免把單一載體上的結論過度外推。

方法論立場。 本文採命題—推論—猜想格式,而非實證報告,是一個刻意的選擇。其目的不是宣稱新事實,而是把既有事實重新對齊:當組塊化、技能習得、增強學習、聯想記憶這些原本各說各話的理論被擺到同一個受控對象上、並以同一套記號($\mathcal{S}$、$\mathcal{X}$、$\pi$、$\rho$、$T$)重述時,它們之間的邏輯關係——何者描述學習期、何者描述執行期、何者是觀察者的重建——才會浮現。命題格式的價值在於把這些關係顯題化、可否證化:每一條命題都被寫成可被指認為錯的形式,每一個猜想都附上其證偽條件。這是一種整理,不是一種發現;但好的整理本身,有時會讓人看見原本被領域邊界遮住的東西。


第二章 預備與記號

定義 2.1(容器與全局狀態)。 令魔方的全局狀態為 $s\in\mathcal{S}$,$|\mathcal{S}|\approx4.3\times10^{19}$。容器 $C$ 為承載狀態的物理對象本身;轉動算子集 $\Phi=\{U,D,L,R,F,B\}$ 及其逆與平方生成魔方群 $G=\langle\Phi\rangle$。一次轉動 $\phi\in G$ 作用為 $s\mapsto\phi(s)$。

定義 2.2(觀察模式與表示)。 同一容器可被多種模式 $m$ 讀取:立體嵌入(3D)、攤平色位(2D 十字網,FCSR)、貼面鄰接圖(譜)。模式切換不改變 $C$,僅改變表示——此即 FDRS 之表示轉換算子 $\mathcal{R}$(容器同一性)。三種模式讀出的數值(如同色連通分量數)可彼此翻譯而相容,因其底層為同一容器。

定義 2.3(局部表徵 / 組塊)。 局部表徵 $\chi$ 是一個對全局狀態的有損映射 $\pi:\mathcal{S}\to\mathcal{X}$,其中 $\mathcal{X}$ 為組塊空間,$|\mathcal{X}|\ll|\mathcal{S}|$。一個組塊 $\chi=\pi(s)$ 對應 $\mathcal{S}$ 中一整個等價類 $\pi^{-1}(\chi)$。直覺上,$\chi$ 是「一個可用某觸發序列處理的局部構型」,例如「一組待插入的角—稜對」。

定義 2.4(策略與相位)。 反應式策略 $\rho:\mathcal{X}\to\Phi^*$ 將組塊映至一段動作序列(觸發 / trigger)。相位 $q$ 是解題流程的粗階段(如:十字→前兩層→頂層朝向→頂層排列),相位集 $Q$ 很小($|Q|$ 為個位數)。

定義 2.5(狀態樹)。 以初始狀態為根、轉動為邊、後繼狀態為節點所展開的搜尋樹,記為 $T$。求解的一條路徑 $\pi^*=(\phi_1,\dots,\phi_k)$ 是 $T$ 中由根至解的一條道路。

本文核心區分為:$T$ 的展開(搜尋)與 $\rho$ 的查詢(辨識)是兩種根本不同的計算。前者代價隨分支因子與深度爆炸,後者代價近乎常數。

2.6 一個貫穿全文的具體例子

為使後續命題不流於抽象,先固定兩個具體錨點。

錨點一(組塊→觸發)。 在前兩層(F2L)階段,一個典型組塊是「白面朝右、待插入右前槽的角—稜對」。對這個被辨識的組塊,高手不思考、不模擬,直接施出固定觸發(如右手三連 R U R' 一族中的對應變體)。這個「構型→動作」的映射就是 $\rho(\chi)$。關鍵在於:無論魔方其餘部分如何,只要這個局部構型被辨識,動作即被觸發——這正是定義 2.3 中「許多全局狀態映至同一組塊」的具體呈現。

錨點二(相位不變量)。 底層十字一旦完成,後續所有 F2L 觸發都被設計為「在過程中暫時破壞、又在結尾恢復」十字,使十字作為不變量被保持。這意味著解題者從不需要回頭檢查十字是否還在——相位的結構保證了它。這個錨點將在第六章被用來說明「全局正確性由結構擔保、而非由全局匹配達成」。


第三章 命題群 A:複雜性的觀察者相對性

命題 A1(描述複雜度 ≠ 導航複雜度)

魔方狀態空間的規模 $|\mathcal{S}|\approx4.3\times10^{19}$ 是對容器的最樸素編碼下的描述複雜度,並非任何求解主體實際導航的複雜度。專家從不表徵 $s\in\mathcal{S}$ 之全局,他操作的是組塊空間 $\mathcal{X}$,而 $|\mathcal{X}|$ 僅數百量級。

論證。 局部轉動的交互圖是稀疏的:一次面轉動僅牽動該層的八個塊,其餘十二塊不動。人類求解寄生於此局部性——在任一時刻只持有當前組塊,其餘「交給方法」。因此被導航的對象是 $\mathcal{X}$ 而非 $\mathcal{S}$。$4.3\times10^{19}$ 這個數字從未進入任何人的工作記憶;它只存在於「用 54 個獨立貼面去描述容器」這個外部編碼裡。換一個編碼——例如以組塊為單位——同一個容器的有效複雜度立刻坍縮數十個數量級。複雜度因此不是容器的內稟性質,而是觀察者所選編碼的函數。

認知科學對應。 此即 Newell 與 Simon(1972)「問題空間」概念的一個極端而乾淨的實例:問題求解不在客觀狀態空間進行,而在主體所構造的問題空間進行;專家的問題空間經過劇烈壓縮。Chase 與 Simon(1973)對西洋棋的研究給出同型結論——專家的優勢不在記憶容量,而在組塊:他看見的不是孤立棋子,而是有意義的結構單位。Gobet 與 Simon(1996)進一步以「模板」擴充組塊,說明專家的知覺單位可以更大、更結構化。Miller(1956)的 $7\pm2$ 與 Cowan(2001)修正的約 4 個組塊,界定了工作記憶這個必須被繞過的瓶頸。

魔方詮釋。 CFOP 高手記憶的 57 個 OLL、21 個 PLL,本質是 $\mathcal{X}$ 上的一張查詢表的條目,而非 $\mathcal{S}$ 的任何子集。組塊把高維狀態折疊成可被工作記憶承載的少數知覺單位。一個只能逐塊看、無法看見組塊的新手,其工作記憶會被瞬間淹沒——這正是新手感到魔方「太複雜」的真實機制:複雜度的差異不在魔方,在編碼。

命題 A2(局部表徵是全局狀態的有損商映射)

局部表徵 $\chi=\pi(s)$ 不是 $\mathcal{S}$ 中的「一個狀態」,而是一個等價類 $\pi^{-1}(\chi)$。許多在全局上不同的狀態映至同一組塊,因而觸發同一動作 $\rho(\chi)$。專家在 $\mathcal{X}$(商空間)中行走,不在 $\mathcal{S}$ 中行走。

論證。 「一個朝向正確、待插入右前槽的角—稜對」這個組塊,對應全局上無數種其餘部分各異的狀態。策略 $\rho$ 對該組塊給出固定觸發,與全局其餘無關(在相位約束下)。故 $\rho$ 的定義域是 $\mathcal{X}$,且 $\pi$ 的纖維 $\pi^{-1}(\chi)$ 通常極大。換言之,$\pi$ 是一個多對一的壓縮:它丟棄了對當前決策無關的全局細節,只保留決定下一動作所需的局部結構。

認知科學對應。 此對應「知覺範疇化」與「刺激泛化」:相近輸入落入同一範疇、引發同一反應。它也預示了第七章將論的「保鄰近性」——商映射保留鄰近關係,這是與雜湊的本質差異。從訊息論看,$\pi$ 是一個有損編碼,其損失正是「對當前決策無關的位元」,而其保留正是「決定動作的充分統計量」。

FDRS 詮釋。 $\pi:\mathcal{S}\to\mathcal{X}$ 即一次展平:高維狀態被映至低維可操作表示,而本質的邏輯連結被保留(鄰近的構型仍映至鄰近的組塊、相近的動作)。組塊空間 $\mathcal{X}$ 就是專家所操作的那張低維圖卡。

推論 A2.1。 既然 $\rho$ 作用於 $\mathcal{X}$,則內隱記憶承載的不是高複雜度本身——高複雜度在被記住之前,已先被 $\pi$ 摧毀(壓縮)。內隱記憶裝的是殘渣,不是流形。 由此可知,「如何把高複雜度記成內隱記憶」這個問法本身略有錯位:它從來不是以高複雜度的形態被記住的,而是先壓縮、再記住壓縮後的低維殘餘。


第四章 命題群 B:兩個時間尺度與搜尋的坍縮

本章是本文對流行直覺的核心辨正。

命題 B1(學習期是有模型搜尋,執行期是無模型查詢)

技能的兩個時間尺度承載兩種不同的計算:學習期以有模型的狀態樹搜尋為主——心像旋轉、前瞻、試錯、回溯,費力而緩慢;專家執行期以無模型的快取策略為主——辨識當前組塊、直接觸發對應動作,不展開狀態樹。

論證。 設學習者面對未知構型,其唯一手段是在問題空間中試探:施加一動、觀察後果、若惡化則回溯。這正是狀態樹 $T$ 的展開。每一次成功的路徑被記憶、被強化,逐步把「構型→有效動作」這一對映 $\rho$ 填滿。當 $\rho$ 在某組塊上已被填實,主體不再於該組塊處搜尋,而直接查詢——搜尋在該處坍縮為查表。技能的整個習得過程,就是 $\rho$ 的定義域逐塊被填滿、而 $T$ 的展開逐塊被取消的過程。

認知科學對應。

與本研究所建程式的對照。 我們為魔方所實作的自動求解器,採用帶啟發式的迭代加深 A\(IDA\,Korf, 1985):它展開狀態樹、以啟發函數估測離解尚差幾步、剪枝、回溯。這恰恰是新手如何「思考」魔方的計算模型——有模型、樹搜尋、估距。它不是專家如何「動作」魔方的模型。我們花了整套工程,造出一台像初學者那樣思考的機器;而本文所論的高手,恰是學會了不再那樣思考的人。這個對照本身就是命題 B1 的一個操作化註腳。

命題 B2(狀態樹是觀察者的重建,非執行者的內容)

從外部觀察,專家走出一條穿越狀態樹 $T$ 的路徑 $\pi^*$;但執行者腦內並未展開 $T$。$T$ 是描述者為了說明這條路徑而事後重建的結構,與「複雜性是觀察者強加的」(命題 A1)同型——樹在描述者的模型裡,不在執行者的頭裡。

論證。 專家的單步是 $\rho(\chi)$ 的查詢,其計算代價與 $T$ 的分支因子無關,亦不涉及對替代分支的枚舉。「路徑」是一連串獨立辨識的串接,其作為「樹中道路」的身份是外部投影。我們之所以傾向用「狀態樹」描述專家,是因為我們(觀察者)需要一個結構來解釋為何那條動作序列會通向解——但這個解釋性結構不必對應任何執行期的內部過程。

推論 B2.1(殘留前瞻的誠實修正)。 「專家零搜尋」是過強的。競速者在前兩層會追蹤一至兩塊、做淺層前瞻;在檢視期會規劃起手。故精確表述為:專家並非消滅搜尋,而是把搜尋從深層審議式的樹展開,壓縮為淺層、並行、近乎辨識的預期。 深層狀態樹搜尋屬於學習期與新手,專家保留的是被劇烈剪枝的薄層前瞻。本文不主張一個非黑即白的「搜尋 vs 辨識」二分,而主張一個連續的壓縮譜:練習把搜尋的深度與寬度單調壓低,直至逼近純辨識。

推論 B2.2(試錯的時間定位)。 「一直在試對試錯」描述學習者(探索 / explore),非專家(利用 / exploit)。狀態樹活在訓練期的探索裡,訓練完成即坍縮為策略。將試錯與內化過程置於同一句,等於把兩個時間尺度壓平——這是日常直覺最常犯的錯,因為我們同時看見「人在試」與「人會解」,便誤以為解的當下也在試。


命題 B3(顯性殘餘即可傳遞層)

顯性記憶保留下來的,恰是知識中可被傳遞、可被教學的部分——相位骨架與規則不變量(「為何先這樣轉」);而相位內的程序核心 $\rho$ 因其為高頻寬、並行、連續的感覺運動快取,無法被低頻寬、序列化的語言通道完整載出,故停留為黑盒。

論證。 語言是一條低頻寬、序列化的傳遞通道:它能承載「先做底層十字、因為後續演算法都保持它」這種命題式、可教的規則,卻無法承載手指法那種高維、並行、連續的運動細節(時序、力道、視線落點、辨識的微結構)。於是技能在被教學時,必然被壓縮成「相位+不變量+公式記號」這種可言說殼層;而真正的執行核心只能由學習者經由自身練習重新長出來——教科書能給你公式表,給不了你手。這正好解釋了一個常見觀察:高手能敘述大致幾步與「為何先這樣轉」,但中段計算是黑盒。黑盒不是因為神秘,是因為那部分知識的格式與語言不相容。

認知科學對應。 此與猜想 G2 的「可言說性缺口」互為表裡,並對應運動學習中「演示優於講解」的現象——觀察與模仿能繞過語言瓶頸,直接在感覺運動層傳遞,而純口語講解則被殼層所限。Anderson 的陳述—程序遷移在此有一個社會面向:可被傳遞的,永遠是尚未(或剛被)程序化、仍留在陳述式格式裡的那一層;一旦程序化完成,知識就同時變快、變強、變得不可言說、也變得不可直接傳授。

推論 B3.1(教學的悖論)。 一門技能越是被精熟(越程序化),其持有者越難把它教出來——可教性與精熟度在程序核心上成反比。這不是高手藏私,是知識格式的物理限制。


第五章 新手到專家的軌跡:練習曲線上到底發生了什麼

本章把命題群 B 的「兩個時間尺度」展開為一條連續軌跡,逐一指出隨練習而變化的量。

其一,組塊的粒度上升。 新手以單塊為知覺單位(每片貼面都要單獨處理),工作記憶迅速飽和;隨練習,知覺單位升級為「對」「行」「案例」乃至「整個相位的局面」。這是 Chase–Simon 組塊化在時間軸上的展開:被看見的不是更多東西,而是更大的東西。

其二,心像旋轉的依賴下降。 新手大量依賴 Shepard–Metzler 式的內部模擬去預判一步的後果,其代價隨想像的旋轉量線性上升;專家以快取的案例辨識取代模擬,故同樣的決策幾乎不再付出旋轉代價。可觀察的指標是:新手單步前的停頓隨「需要想像的角度」增長,專家則趨於平坦。

其三,前瞻的深度被壓縮、寬度被剪枝。 新手做深而亂的樹搜尋(想很多步、又常走錯回溯);專家做淺而準的前瞻(F2L 追一兩塊、為下一個案例預備視線),其餘交給辨識。搜尋沒有消失,是被壓到極薄。

其四,知識的承載介質從顯性遷往隱性、再遷往身體與外物。 起初是可言說的規則(「若角塊在此,做這串」);經產生式編譯後成為不可言說的反應;再經速解的手指法(fingertrick)固化,演算法被存成一個流暢的運動基模,存在於手而非符號。同時,魔方本體承擔了狀態記憶——專家用眼讀回當前局面,而非在腦中維持。

其五,全局監控退場。 新手不時停下檢查「整體還差多少」(一種代價高昂的全局匹配);專家停止這種檢查,因為相位不變量已把全局保證內化(見第六章)。全局監控的退場,是工作記憶得以釋放、速度得以提升的關鍵之一。

這五者並非彼此獨立,而是同一個壓縮過程的五個側面:把複雜度從意識的窄管裡,分別趕進組塊、趕進策略、趕進身體、趕進外物,並取消對全局的持續驗證。


第六章 命題群 C:全局正確性的結構擔保

命題 C1(方法即證明:全局正確由不變量保持的相位序擔保,非由全局匹配達成)

專家從不執行「全局匹配」——他不表徵、不驗證整顆魔方的全局狀態。他執行一連串局部匹配,其合成之所以全局正確,是因為解法的相位結構單調保持已解部分(先解的層在後續相位中不被破壞)。全局正確性是方法設計的湧現擔保,不是一個被表徵的目標。

論證(以層先法逐相位走查)。 考慮一條典型解法的相位序:底層十字 → 底層角塊(完成第一層)→ 第二層稜塊(完成前兩層)→ 頂層朝向 → 頂層排列。每一個後續相位所用的演算法,都被設計為保持前一相位的成果不變:插入第二層稜塊的觸發會暫時擾動底層、但結尾恢復;頂層朝向的演算法保持前兩層不變;頂層排列的演算法保持朝向不變。於是「離解還差多遠」這個全局量,沿相位序自動單調下降,無需任何人去計算它。會去計算全局距離的,是帶啟發函數 $h$ 的搜尋(如我們的 IDA\* 求解器),不是專家。專家把全局保證外包給了相位結構——方法本身就是一份不必每次重證的證明。

認知科學對應。 此對應「程序性技能的階層組織」與 Dreyfus & Dreyfus(1986)對專家「不再依規則、而依情境直覺」的描述:專家信任方法,把全局保證外包給已內化的相位結構。Ericsson & Kintsch(1995)的「長期工作記憶」說明專家如何以結構化檢索繞過工作記憶限制——相位即一種結構化索引,使專家能在不持有全局的情況下,於正確的位置取出正確的局部知識。

推論 C1.1。 「局部匹配到全局匹配」的表述高估了全局端。更精確:局部匹配一路到底,全局正確性是相位不變量的湧現擔保。 全局匹配若真被執行,那是搜尋者(新手或演算法)的行為,不是專家的。新手之所以慢,部分正因為他還在做這種昂貴而其實可被結構取代的全局監控。


第七章 命題群 D:聯想查詢與展平鍵

命題 D1(專家查詢是內容定址的聯想檢索,為雜湊的對偶)

把專家的查詢稱為「雜湊表查詢」在「快取」一義上成立,在「雜湊」一義上接反。雜湊函數被設計來摧毀鄰近結構(相近的鍵被打散、差一位元即落入無關桶);而專家的查詢鍵是有損、近似、容忍變形的——相近的局部構型觸發相近(甚至相同)的反應。專家是內容定址的聯想記憶,是雜湊表被設計來避免成為的那種東西。

論證。 雜湊的價值在均勻散佈(避免碰撞),其代價是丟棄輸入空間的度量結構:好的雜湊函數刻意讓相鄰的鍵映到遠處。辨識的價值恰在保留度量結構:一個未曾精確見過的構型,仍能被歸入正確的組塊族並觸發正確反應(泛化)。前者要散,後者要聚;二者在「是否保鄰近」這一性質上正好相反。若專家真的是雜湊表,他就無法泛化——任何未精確登錄過的構型都會落入無關桶、查無此鍵。但專家恰恰能對沒見過的構型做出對的反應,這正證明其鍵保留了相似度結構。

認知科學對應。 Hopfield(1982)的聯想網路給出內容定址記憶的物理模型:由部分/含噪的輸入收斂至最近吸引子。實例理論(Logan, 1988)亦然——檢索由相似度驅動,而非精確鍵。範疇化與原型理論同樣建立在相似度之上。

FDRS 詮釋(保鄰近的鍵即展平)。 「快取」一半是準的:該快取是被學習期昂貴的有模型搜尋填出來的(探索算過的結果存下、之後利用),此即 memoization。但讀取它的鍵是聯想的、保鄰近的,而非散列的;且其結構是階層的(觸發→案例→相位),非扁平的 key→value。更深的一點是:那把「保鄰近」的鍵,正是 $\pi$ 這次展平的產物——組塊是地址,而地址相近 ⇔ 可操作性相近。這是展平 $\Phi$ 的全部價值:它造出一個「靠近真的有意義」的表示,於是一次廉價的最近匹配就足夠。雜湊把空間打散,好的展平把它收攏。

推論 D1.1。 高手不是記性好到能查一張巨表;他是找到了那張讓查表變得不必要的圖——在保鄰近的座標上,最近的答案永遠就在手邊,近到不像在查,像在認。


第八章 三種收斂的辨正

命題 E1(「展開/收斂」涉及三個不可混淆的算子)

在魔方語境中,「展開/收斂」一詞至少對應三個不同的算子,混為一談會造成範疇錯誤:
(i)維度的 升降:3D 立體 ⇄ 2D 攤平網(FDRS 的 $\Phi$/RDCM);
(ii)狀態的 收斂:亂序 → 解開(解題本身,在 $\mathcal{S}$ 內的軌跡);
(iii)注意力的 張開/收束:掃視採集局部特徵(張開)→ 鎖定下一步(收束)。

論證與辨正。 認知過程中真實存在的是(iii)——知覺採樣與決策的循環。但它既非(i)的維度升降,也不應與(ii)的狀態收斂等同。把認知的「局部→全局」直接讀成 FDRS 的「升維/降維」,是一次誘人的等價滑動:認知過程並未改變表徵的維度,它是在一個已被壓縮的低維表示($\mathcal{X}$)上導航狀態。三個算子各有定義域:(i)的定義域是表示的維度,(ii)的定義域是狀態空間 $\mathcal{S}$,(iii)的定義域是注意力的範圍。混疊它們會讓張力結構塌縮——保持三者分離,是本框架的紀律性要求。

值得補充的是(iii)注意力收斂的機制:專家的視線並非均勻掃描整顆魔方,而是被學得的顯著性引導,跳躍式地落在「下一個可被辨識的組塊」所在處——一次知覺的張開(採樣候選局部)接一次收束(鎖定觸發點),如此循環。這個張開/收束的節律是真實且可被眼動追蹤量測的,但它發生在 $\mathcal{X}$ 的辨識層,與維度升降(i)、狀態前進(ii)分屬不同層級。把「人在解魔方時不斷展開又收斂」這句日常描述,誤讀為 FDRS 的維度操作,正是本命題要攔下的範疇滑動。


第九章 範圍與限制

把單一載體上的結論外推到「一切技能」是危險的。本章誠實界定魔方類比成立的邊界。

其一,魔方是確定性、完全資訊、離散的。 它沒有對手、沒有隨機性、沒有隱藏狀態、沒有連續控制。許多真實技能(駕駛、即興演奏、對話、運動競技)是隨機的、部分可觀測的、連續的、且有對抗方。在那些領域,純無模型快取不足以應付分布外情境,有模型的規劃與線上適應不會完全退場。故命題 B1 的「搜尋坍縮為查詢」在魔方上接近完全,在開放領域只是部分成立——專家仍需保留一定的線上模型用於應變。

其二,魔方有明確的全局判準與可分解的相位結構。 命題 C1 的「方法即證明」依賴於存在一套不變量保持的相位分解。並非所有技能都有這種乾淨的相位結構;缺乏它的技能,其全局正確性無法被結構完全擔保,主體必須保留某種全局監控。

其三,個體差異與方法差異。 同樣「會解魔方」,盲解者、速解者、直覺解者所內化的表徵與策略結構不同。本文的命題刻畫的是「經方法訓練、達到自動化」這一類專家的共性,不宣稱涵蓋所有解法路線。

其四,本文的命題多為既有結論的重組,其魔方實證化(在魔方任務上直接測得各命題的反應時/神經指標)大多尚待進行。 下一章的可證偽預測即為此而設,但本文本身不提供新數據。

其五,技能的特定性與遠遷移之闕如。 魔方專長幾乎不遷移到其他技能——精通魔方並不使人更會下棋、更會演奏或更會解數學題。這個「不遷移」本身佐證了本框架:專家內化的是一張特定任務的展平 $\pi$ 與其上的策略 $\rho$,而非某種可跨域搬運的通用「空間智能」。Thorndike 與 Woodworth 對「形式訓練說」的早期否證、以及遠遷移(far transfer)在文獻中普遍微弱的事實,都指向同一點:被習得的是 task-specific 的低維圖卡與策略。這也回扣命題 A1——複雜度的馴服,來自找到那張特定的圖,而圖不通用;換一個任務,舊圖失效,得重新展平。若魔方訓練被證實能穩健遷移至無關領域的問題解決,則本框架的「展平特定性」假設將受質疑。

界定這些邊界,不是削弱框架,而是標明它的適用域——超出此域的結構,需要其他工具處理。


第十章 猜想群與可證偽預測

以下為超出既有直接證據、但由本框架自然導出的猜想。標註其可證偽形式。

猜想 G1(可程序化 ⇔ 可展平)

一個任務可被內隱地(程序性地)精熟,當且僅當它容許一張保本質連結的低維可操作表示(即存在有效的展平 $\pi$)。缺乏可利用低維結構的任務(如記憶一串無結構的隨機符號)無法被程序化,只能被低效地陳述式硬背。

可證偽預測。 在人工受控材料上系統性調節「可壓縮性 / 結構性」:可壓縮材料應展現冪律式的程序化(反應時下降、可言說性下降、抗干擾性上升);不可壓縮材料應停留於緩慢的陳述式檢索,不出現自動化轉移。若高度不可壓縮材料仍出現穩定程序化,則 G1 被否證。

猜想 G2(可言說性缺口)

專家的顯性可言說內容,集中於相位骨架規則不變量(「為何先這樣轉」),而相位內的策略核心 $\rho$ 大致不可言說(黑盒)。可言說性與該知識在陳述式系統的殘留量成正比,與其程序化程度成反比。

可證偽預測。 要求專家逐步口語報告其 F2L 求解,將顯著拖慢並惡化表現(程序核心抗口語化);而要求其報告相位策略(「先做十字」)則無此代價。若程序核心可被無代價地完整口語化,G2 被否證。此與「次級任務干擾」「言語遮蔽效應」的既有範式相容。

猜想 G3(觀察者—樹幻覺)

對專家單步求解的反應時與神經負荷,不隨狀態樹的局部分支因子增長(因無樹展開);對新手則隨之增長(因有樹展開)。狀態樹的「複雜度」只在搜尋者身上留下計算足跡,在辨識者身上不留。

可證偽預測。 操弄當前構型在狀態樹中的分支因子 / 解的深度,測量單步啟動的反應時與前額葉負荷:新手應呈正相關,專家應趨於平坦。若專家亦呈強正相關,則 B2/G3 被否證(意味專家仍在展開樹)。

猜想 G4(神經系統的雙軌遷移)

技能習得對應計算負荷由「海馬—前額葉軸」(陳述式、學習期搜尋、有模型規劃)向「基底核—小腦軸」(程序式、無模型策略、前向模型執行)的遷移。

對應與預測。 與 Knowlton、Mangels & Squire(1996)對基底核於機率分類學習之角色、Squire(1992)對陳述/非陳述記憶之解離、Wolpert、Ghahramani & Jordan(1995)對小腦前向模型之刻畫一致。預測:練習過程中,求解相關活動應由內側顳葉/背外側前額葉向背側紋狀體與小腦轉移。此為既有運動學習文獻的已知模式,本文僅將其錨定於魔方。


第十一章 神經對應小結

兩個時間尺度對應兩條神經軸,且彼此競爭與接力:

延展認知(Clark & Chalmers, 1998)在此具體化:競速者把狀態外包給魔方本體(用眼讀回,不在腦中模擬)、把演算法外包給手指(手「知道」觸發)。表徵分布於內部策略、身體運動基模與外部物件三處——這也是工作記憶瓶頸的三條逃逸路徑:組塊(讓 WM 只持一個單位)、程序(讓 WM 無須持有)、外物(讓世界持有狀態)。三者是同一策略:把複雜度趕出意識的窄管。


第十二章 結語

我們花了整套工程,教會一台機器像新手那樣思考魔方——它展開狀態樹、用啟發式估測離解還差多遠、剪枝、回溯。而本文所問的那個高手,恰恰是學會了不再那樣思考的人:他不展樹、不估距、不回溯,他辨識,然後動作。

把這些命題串起來,會看見一條一致的弧:複雜性不在物件裡,在描述它的人那裡(命題 A);狀態樹不在執行者腦中,在重建它的觀察者那裡(命題 B);全局正確不靠全局匹配,靠方法的不變量結構擔保(命題 C);查詢不靠散列,靠保鄰近的展平鍵(命題 D)。四者是同一個洞察的四個側面——所有看似住在高維裡的東西,都在一次正確的展平之後,搬到了低維的手邊。

狀態樹不是被走完的,是被忘掉的。熟練的盡頭不是記得每一條分支,而是再也不需要看見那棵樹——在對的座標上,最近的答案近到不像在查,像在認。而認,從來不是記憶的勝利,是遺忘的成就:把所有不必要的分支忘乾淨,只留下那條手早已知道的路。

也正因如此,技能最深的那一層注定無法被言說、被教授——能寫進教科書的,永遠是還停在陳述式格式裡、尚可被語言載出的殼層(相位與不變量);而那個讓魔方在指間流動的核心,每個人都得自己重新長一次。我們能把地圖交給下一個人,交不出走過那條路的腳。這不是技藝的缺憾,是它的尊嚴:有些知識,只能由身體親自抵達。


參考文獻(擇要)


附錄 A 與 FDRS 算子的對照

| 認知對象 | 本文記號 | FDRS 對應 | |---|---|---| | 全局狀態 → 局部組塊 | 有損商映射 $\pi:\mathcal{S}\to\mathcal{X}$ | 展平 $\Phi$(降維,保鄰近 / 保本質連結) | | 組塊 → 重建全局構型(罕用) | $\pi$ 的部分逆 | 重構 RDCM(升維) | | 觀察模式切換(立體/攤平/譜) | $m\mapsto m'$,容器不變 | 表示轉換 $\mathcal{R}$(容器同一性) | | 學習期搜尋的代價 | 狀態樹 $T$ 的展開成本 | 對應失真 / 代價算子 $\mathcal{D}$ 的高值(昂貴轉換) | | 專家查詢 | 在 $\mathcal{X}$ 上的聯想檢索 $\rho$ | 低 $\mathcal{D}$ 的近等距讀取(保鄰近鍵) | | 相位骨架 | 小型有限狀態機 $Q$ | 模式層之上的宏觀控制結構 |

附錄 B 核心命題速覽


本文為 EveMissLab 之認知科學重讀工作,立場為綜合與重驗,不主張新實證發現。命題與猜想之具體實驗化,留待後續;其與 FDRS 主框架(展平 $\Phi$、重構 RDCM、表示轉換 $\mathcal{R}$、失真算子 $\mathcal{D}$)的形式對接,亦待另文以鏈複形語言完整化。本文的全部主張,可一句話收束:複雜從來不在物件裡,技能不過是找到了那張讓它變簡單的圖,然後把找圖的過程,連同那棵樹,一起忘了。

原始檔(供 RAG/下載):papers/EML-COG-2026.md [md]