從搜尋到辨識：以魔術方塊重驗技能型內隱認知的命題框架

A Propositional Framework: Re-validating Skill-Based Implicit Cognition through the Rubik's Cube

作者： Neo.K　|　機構： 一言諾科技有限公司（EveMissLab）　|　對練／結晶化： Theia 文件編號： EML-COG-2026-LRC（Local-Representation Collapse）　|　版本： v0.1　|　日期： 2026.06

摘要

本文以魔術方塊（3×3×3）為單一受控載體，將分散於認知科學數十年的既有結論——組塊化、技能程序化、內隱／程序記憶、心像旋轉、前向模型、無模型與有模型增強學習、自動化的實例理論、內容定址記憶、延展認知——重新組織為一組可檢驗的命題與猜想。本文不主張任何新的實證發現。 其貢獻有三：其一，提供一個把上述異源理論收攏在同一受控對象上的命題化框架；其二，明確辨正一個流行但接反的直覺——「高手在解題時於狀態樹中搜尋」——指出狀態樹搜尋是學習期的鷹架而非專家執行期的機制，專家是被蒸餾出的反應式策略；其三，以展平式維度重構（FDRS）的語彙，把「局部表徵」精確化為「全局狀態空間的有損商映射」，並指出專家的查詢是保鄰近的聯想檢索，恰為雜湊（散列）的對偶。全文採命題—推論—猜想格式，附可證偽預測、範圍限制與神經對應，並在附錄給出與 FDRS 算子的對照。

Abstract. Using the 3×3×3 Rubik's cube as a single controlled substrate, this paper re-organizes established results across cognitive science—chunking, skill proceduralization, implicit/procedural memory, mental rotation, forward models, model-based vs. model-free reinforcement learning, instance theory of automaticity, content-addressable memory, and extended cognition—into a set of testable propositions and conjectures. It claims no new empirical findings. Its contributions are a unifying propositional frame on one controlled object; a correction of the popular-but-inverted intuition that experts search a state tree at solve time (the tree is a learning-phase scaffold, distilled into a reactive policy); and an FDRS reading in which "local representation" is the lossy quotient of the global state space, and expert retrieval is a similarity-preserving associative lookup—the dual of a hash.

第一章　導論

1.1　問題與動機

一個普通人，在不具備任何群論、不理解魔方狀態空間結構的前提下，經過數週練習，能穩定地把一個被打亂的魔術方塊還原。其狀態空間規模約 $4.3\times10^{19}$，遠超任何徒手窮舉或顯性記憶所能涵蓋。這個日常事實構成一個尖銳的問題：一個高維、動態、連接複雜度極高的結構，如何在缺乏顯性理論的情況下，被內化為可即時執行的技能？

這個問題之所以非平凡，在於它同時違反了兩個樸素直覺。第一個直覺是：要解決一個如此龐大的組合問題，必須「理解」它的結構。但事實是大多數能還原魔方的人完全不懂魔方群、不知道神為數（God's Number）為 20、甚至說不清自己中段在做什麼。第二個直覺是：技能既然能被執行，就應該能被清楚言說。但事實是高手往往無法完整解釋自己的手在做什麼——你若打斷他、要他逐步報告，他的表現反而崩潰。這兩個違反，正是內隱認知的指紋。

本文的立場是：這個問題的大部分，在認知科學既有的文獻中其實已經被回答了——只是答案分散在組塊化、技能習得、內隱記憶、運動控制與增強學習等彼此少有對話的領域。魔方的價值不在於它能催生新理論，而在於它是一個單一、離散、可完全形式化、又對人類具有真實難度的受控載體，足以讓這些異源理論在同一對象上彼此校準、互相驗證。換言之，魔方不是新答案的來源，是把舊答案擺在一起對照的試管。

1.2　為何選擇魔方作為驗證載體

魔方具備一組罕見的並存性質：（一）狀態空間有限且可精確計數，群結構封閉；（二）操作集小（六面、各三種變體），可窮舉；（三）全局正確性有明確判準（解開／未解開）；（四）對人類而言難度真實，需要數週至數年的練習曲線；（五）專家的外顯敘述（公式、相位）與內隱執行（手感、辨識）可分離觀察。這五者使魔方成為比西洋棋（分支因子過大、終局判準模糊）或人工語法（缺乏空間—運動維度）更乾淨的技能認知試管。此外，魔方同時跨越知覺、空間想像與精細運動三個系統，使它能一次照見「辨識—決策—執行」的完整迴路，而非只觸及其中一段。

1.3　誠實定位與貢獻

再強調一次：本文不是新發現。 它是一次綜合與重驗。其貢獻限於：

把既有結論命題化、收攏於單一載體；
辨正「專家於狀態樹中搜尋」此一接反的直覺；
以 FDRS 語彙精確化「局部表徵」並指出查詢的聯想本質。

凡涉及量化（如組塊容量、反應時）之處，本文僅引用文獻既有結果，或明確標註為說明性假設。本文亦在第九章誠實界定魔方類比的適用範圍與其失效之處，避免把單一載體上的結論過度外推。

方法論立場。 本文採命題—推論—猜想格式，而非實證報告，是一個刻意的選擇。其目的不是宣稱新事實，而是把既有事實重新對齊：當組塊化、技能習得、增強學習、聯想記憶這些原本各說各話的理論被擺到同一個受控對象上、並以同一套記號（$\mathcal{S}$、$\mathcal{X}$、$\pi$、$\rho$、$T$）重述時，它們之間的邏輯關係——何者描述學習期、何者描述執行期、何者是觀察者的重建——才會浮現。命題格式的價值在於把這些關係顯題化、可否證化：每一條命題都被寫成可被指認為錯的形式，每一個猜想都附上其證偽條件。這是一種整理，不是一種發現；但好的整理本身，有時會讓人看見原本被領域邊界遮住的東西。

第二章　預備與記號

定義 2.1（容器與全局狀態）。 令魔方的全局狀態為 $s\in\mathcal{S}$，$|\mathcal{S}|\approx4.3\times10^{19}$。容器 $C$ 為承載狀態的物理對象本身；轉動算子集 $\Phi=\{U,D,L,R,F,B\}$ 及其逆與平方生成魔方群 $G=\langle\Phi\rangle$。一次轉動 $\phi\in G$ 作用為 $s\mapsto\phi(s)$。

定義 2.2（觀察模式與表示）。 同一容器可被多種模式 $m$ 讀取：立體嵌入（3D）、攤平色位（2D 十字網，FCSR）、貼面鄰接圖（譜）。模式切換不改變 $C$，僅改變表示——此即 FDRS 之表示轉換算子 $\mathcal{R}$（容器同一性）。三種模式讀出的數值（如同色連通分量數）可彼此翻譯而相容，因其底層為同一容器。

定義 2.3（局部表徵 / 組塊）。 局部表徵 $\chi$ 是一個對全局狀態的有損映射 $\pi:\mathcal{S}\to\mathcal{X}$，其中 $\mathcal{X}$ 為組塊空間，$|\mathcal{X}|\ll|\mathcal{S}|$。一個組塊 $\chi=\pi(s)$ 對應 $\mathcal{S}$ 中一整個等價類 $\pi^{-1}(\chi)$。直覺上，$\chi$ 是「一個可用某觸發序列處理的局部構型」，例如「一組待插入的角—稜對」。

定義 2.4（策略與相位）。 反應式策略 $\rho:\mathcal{X}\to\Phi^*$ 將組塊映至一段動作序列（觸發 / trigger）。相位 $q$ 是解題流程的粗階段（如：十字→前兩層→頂層朝向→頂層排列），相位集 $Q$ 很小（$|Q|$ 為個位數）。

定義 2.5（狀態樹）。 以初始狀態為根、轉動為邊、後繼狀態為節點所展開的搜尋樹，記為 $T$。求解的一條路徑 $\pi^*=(\phi_1,\dots,\phi_k)$ 是 $T$ 中由根至解的一條道路。

本文核心區分為：$T$ 的展開（搜尋）與 $\rho$ 的查詢（辨識）是兩種根本不同的計算。前者代價隨分支因子與深度爆炸，後者代價近乎常數。

2.6　一個貫穿全文的具體例子

為使後續命題不流於抽象，先固定兩個具體錨點。

錨點一（組塊→觸發）。 在前兩層（F2L）階段，一個典型組塊是「白面朝右、待插入右前槽的角—稜對」。對這個被辨識的組塊，高手不思考、不模擬，直接施出固定觸發（如右手三連 R U R' 一族中的對應變體）。這個「構型→動作」的映射就是 $\rho(\chi)$。關鍵在於：無論魔方其餘部分如何，只要這個局部構型被辨識，動作即被觸發——這正是定義 2.3 中「許多全局狀態映至同一組塊」的具體呈現。

錨點二（相位不變量）。 底層十字一旦完成，後續所有 F2L 觸發都被設計為「在過程中暫時破壞、又在結尾恢復」十字，使十字作為不變量被保持。這意味著解題者從不需要回頭檢查十字是否還在——相位的結構保證了它。這個錨點將在第六章被用來說明「全局正確性由結構擔保、而非由全局匹配達成」。

第三章　命題群 A：複雜性的觀察者相對性

命題 A1（描述複雜度 ≠ 導航複雜度）

魔方狀態空間的規模 $|\mathcal{S}|\approx4.3\times10^{19}$ 是對容器的最樸素編碼下的描述複雜度，並非任何求解主體實際導航的複雜度。專家從不表徵 $s\in\mathcal{S}$ 之全局，他操作的是組塊空間 $\mathcal{X}$，而 $|\mathcal{X}|$ 僅數百量級。

論證。 局部轉動的交互圖是稀疏的：一次面轉動僅牽動該層的八個塊，其餘十二塊不動。人類求解寄生於此局部性——在任一時刻只持有當前組塊，其餘「交給方法」。因此被導航的對象是 $\mathcal{X}$ 而非 $\mathcal{S}$。$4.3\times10^{19}$ 這個數字從未進入任何人的工作記憶；它只存在於「用 54 個獨立貼面去描述容器」這個外部編碼裡。換一個編碼——例如以組塊為單位——同一個容器的有效複雜度立刻坍縮數十個數量級。複雜度因此不是容器的內稟性質，而是觀察者所選編碼的函數。

認知科學對應。 此即 Newell 與 Simon（1972）「問題空間」概念的一個極端而乾淨的實例：問題求解不在客觀狀態空間進行，而在主體所構造的問題空間進行；專家的問題空間經過劇烈壓縮。Chase 與 Simon（1973）對西洋棋的研究給出同型結論——專家的優勢不在記憶容量，而在組塊：他看見的不是孤立棋子，而是有意義的結構單位。Gobet 與 Simon（1996）進一步以「模板」擴充組塊，說明專家的知覺單位可以更大、更結構化。Miller（1956）的 $7\pm2$ 與 Cowan（2001）修正的約 4 個組塊，界定了工作記憶這個必須被繞過的瓶頸。

魔方詮釋。 CFOP 高手記憶的 57 個 OLL、21 個 PLL，本質是 $\mathcal{X}$ 上的一張查詢表的條目，而非 $\mathcal{S}$ 的任何子集。組塊把高維狀態折疊成可被工作記憶承載的少數知覺單位。一個只能逐塊看、無法看見組塊的新手，其工作記憶會被瞬間淹沒——這正是新手感到魔方「太複雜」的真實機制：複雜度的差異不在魔方，在編碼。

命題 A2（局部表徵是全局狀態的有損商映射）

局部表徵 $\chi=\pi(s)$ 不是 $\mathcal{S}$ 中的「一個狀態」，而是一個等價類 $\pi^{-1}(\chi)$。許多在全局上不同的狀態映至同一組塊，因而觸發同一動作 $\rho(\chi)$。專家在 $\mathcal{X}$（商空間）中行走，不在 $\mathcal{S}$ 中行走。

論證。 「一個朝向正確、待插入右前槽的角—稜對」這個組塊，對應全局上無數種其餘部分各異的狀態。策略 $\rho$ 對該組塊給出固定觸發，與全局其餘無關（在相位約束下）。故 $\rho$ 的定義域是 $\mathcal{X}$，且 $\pi$ 的纖維 $\pi^{-1}(\chi)$ 通常極大。換言之，$\pi$ 是一個多對一的壓縮：它丟棄了對當前決策無關的全局細節，只保留決定下一動作所需的局部結構。

認知科學對應。 此對應「知覺範疇化」與「刺激泛化」：相近輸入落入同一範疇、引發同一反應。它也預示了第七章將論的「保鄰近性」——商映射保留鄰近關係，這是與雜湊的本質差異。從訊息論看，$\pi$ 是一個有損編碼，其損失正是「對當前決策無關的位元」，而其保留正是「決定動作的充分統計量」。

FDRS 詮釋。 $\pi:\mathcal{S}\to\mathcal{X}$ 即一次展平：高維狀態被映至低維可操作表示，而本質的邏輯連結被保留（鄰近的構型仍映至鄰近的組塊、相近的動作）。組塊空間 $\mathcal{X}$ 就是專家所操作的那張低維圖卡。

推論 A2.1。 既然 $\rho$ 作用於 $\mathcal{X}$，則內隱記憶承載的不是高複雜度本身——高複雜度在被記住之前，已先被 $\pi$ 摧毀（壓縮）。內隱記憶裝的是殘渣，不是流形。 由此可知，「如何把高複雜度記成內隱記憶」這個問法本身略有錯位：它從來不是以高複雜度的形態被記住的，而是先壓縮、再記住壓縮後的低維殘餘。

第四章　命題群 B：兩個時間尺度與搜尋的坍縮

本章是本文對流行直覺的核心辨正。

命題 B1（學習期是有模型搜尋，執行期是無模型查詢）

技能的兩個時間尺度承載兩種不同的計算：學習期以有模型的狀態樹搜尋為主——心像旋轉、前瞻、試錯、回溯，費力而緩慢；專家執行期以無模型的快取策略為主——辨識當前組塊、直接觸發對應動作，不展開狀態樹。

論證。 設學習者面對未知構型，其唯一手段是在問題空間中試探：施加一動、觀察後果、若惡化則回溯。這正是狀態樹 $T$ 的展開。每一次成功的路徑被記憶、被強化，逐步把「構型→有效動作」這一對映 $\rho$ 填滿。當 $\rho$ 在某組塊上已被填實，主體不再於該組塊處搜尋，而直接查詢——搜尋在該處坍縮為查表。技能的整個習得過程，就是 $\rho$ 的定義域逐塊被填滿、而 $T$ 的展開逐塊被取消的過程。

認知科學對應。

技能習得階段論（Fitts & Posner, 1967）：認知期→聯結期→自動期，恰是「外顯規則受控執行」向「自動化反應」的遷移；Anderson（1982；ACT-R）以「產生式編譯」刻畫陳述式知識向程序式產生式的塌縮——原本要一步步走過的「若…則…」規則，被編譯成直接的刺激→反應產生式。
無模型 vs 有模型增強學習（Daw, Niv & Dayan, 2005；Sutton & Barto, 1998）：有模型系統用前向模型展開規劃（昂貴、靈活），無模型系統用快取的狀態—動作值（廉價、僵化）。專家從前者遷移至後者；二者在大腦中由不同系統承載並彼此競爭。
自動化的實例理論（Logan, 1988）：自動化不是演算法加速，而是從記憶檢索過去實例取代了演算法計算。這正是「查表取代搜尋」的精確表述——隨著實例累積，最快的檢索逐漸贏過最快的計算。
心像旋轉（Shepard & Metzler, 1971）：反應時隨旋轉角線性增長，揭示一種類比式的內部模擬——這是新手的昂貴前向模型；專家以辨識取代之，故其反應時不再隨「角度」線性增長。
練習的冪次律（Newell & Rosenbloom, 1981）：表現隨練習以冪律改善，與「搜尋逐步被查詢取代、實例庫逐步填實」一致。

與本研究所建程式的對照。 我們為魔方所實作的自動求解器，採用帶啟發式的迭代加深 A\（IDA\，Korf, 1985）：它展開狀態樹、以啟發函數估測離解尚差幾步、剪枝、回溯。這恰恰是新手如何「思考」魔方的計算模型——有模型、樹搜尋、估距。它不是專家如何「動作」魔方的模型。我們花了整套工程，造出一台像初學者那樣思考的機器；而本文所論的高手，恰是學會了不再那樣思考的人。這個對照本身就是命題 B1 的一個操作化註腳。

命題 B2（狀態樹是觀察者的重建，非執行者的內容）

從外部觀察，專家走出一條穿越狀態樹 $T$ 的路徑 $\pi^*$；但執行者腦內並未展開 $T$。$T$ 是描述者為了說明這條路徑而事後重建的結構，與「複雜性是觀察者強加的」（命題 A1）同型——樹在描述者的模型裡，不在執行者的頭裡。

論證。 專家的單步是 $\rho(\chi)$ 的查詢，其計算代價與 $T$ 的分支因子無關，亦不涉及對替代分支的枚舉。「路徑」是一連串獨立辨識的串接，其作為「樹中道路」的身份是外部投影。我們之所以傾向用「狀態樹」描述專家，是因為我們（觀察者）需要一個結構來解釋為何那條動作序列會通向解——但這個解釋性結構不必對應任何執行期的內部過程。

推論 B2.1（殘留前瞻的誠實修正）。 「專家零搜尋」是過強的。競速者在前兩層會追蹤一至兩塊、做淺層前瞻；在檢視期會規劃起手。故精確表述為：專家並非消滅搜尋，而是把搜尋從深層審議式的樹展開，壓縮為淺層、並行、近乎辨識的預期。 深層狀態樹搜尋屬於學習期與新手，專家保留的是被劇烈剪枝的薄層前瞻。本文不主張一個非黑即白的「搜尋 vs 辨識」二分，而主張一個連續的壓縮譜：練習把搜尋的深度與寬度單調壓低，直至逼近純辨識。

推論 B2.2（試錯的時間定位）。 「一直在試對試錯」描述學習者（探索 / explore），非專家（利用 / exploit）。狀態樹活在訓練期的探索裡，訓練完成即坍縮為策略。將試錯與內化過程置於同一句，等於把兩個時間尺度壓平——這是日常直覺最常犯的錯，因為我們同時看見「人在試」與「人會解」，便誤以為解的當下也在試。

命題 B3（顯性殘餘即可傳遞層）

顯性記憶保留下來的，恰是知識中可被傳遞、可被教學的部分——相位骨架與規則不變量（「為何先這樣轉」）；而相位內的程序核心 $\rho$ 因其為高頻寬、並行、連續的感覺運動快取，無法被低頻寬、序列化的語言通道完整載出，故停留為黑盒。

論證。 語言是一條低頻寬、序列化的傳遞通道：它能承載「先做底層十字、因為後續演算法都保持它」這種命題式、可教的規則，卻無法承載手指法那種高維、並行、連續的運動細節（時序、力道、視線落點、辨識的微結構）。於是技能在被教學時，必然被壓縮成「相位＋不變量＋公式記號」這種可言說殼層；而真正的執行核心只能由學習者經由自身練習重新長出來——教科書能給你公式表，給不了你手。這正好解釋了一個常見觀察：高手能敘述大致幾步與「為何先這樣轉」，但中段計算是黑盒。黑盒不是因為神秘，是因為那部分知識的格式與語言不相容。

認知科學對應。 此與猜想 G2 的「可言說性缺口」互為表裡，並對應運動學習中「演示優於講解」的現象——觀察與模仿能繞過語言瓶頸，直接在感覺運動層傳遞，而純口語講解則被殼層所限。Anderson 的陳述—程序遷移在此有一個社會面向：可被傳遞的，永遠是尚未（或剛被）程序化、仍留在陳述式格式裡的那一層；一旦程序化完成，知識就同時變快、變強、變得不可言說、也變得不可直接傳授。

推論 B3.1（教學的悖論）。 一門技能越是被精熟（越程序化），其持有者越難把它教出來——可教性與精熟度在程序核心上成反比。這不是高手藏私，是知識格式的物理限制。

第五章　新手到專家的軌跡：練習曲線上到底發生了什麼

本章把命題群 B 的「兩個時間尺度」展開為一條連續軌跡，逐一指出隨練習而變化的量。

其一，組塊的粒度上升。 新手以單塊為知覺單位（每片貼面都要單獨處理），工作記憶迅速飽和；隨練習，知覺單位升級為「對」「行」「案例」乃至「整個相位的局面」。這是 Chase–Simon 組塊化在時間軸上的展開：被看見的不是更多東西，而是更大的東西。

其二，心像旋轉的依賴下降。 新手大量依賴 Shepard–Metzler 式的內部模擬去預判一步的後果，其代價隨想像的旋轉量線性上升；專家以快取的案例辨識取代模擬，故同樣的決策幾乎不再付出旋轉代價。可觀察的指標是：新手單步前的停頓隨「需要想像的角度」增長，專家則趨於平坦。

其三，前瞻的深度被壓縮、寬度被剪枝。 新手做深而亂的樹搜尋（想很多步、又常走錯回溯）；專家做淺而準的前瞻（F2L 追一兩塊、為下一個案例預備視線），其餘交給辨識。搜尋沒有消失，是被壓到極薄。

其四，知識的承載介質從顯性遷往隱性、再遷往身體與外物。 起初是可言說的規則（「若角塊在此，做這串」）；經產生式編譯後成為不可言說的反應；再經速解的手指法（fingertrick）固化，演算法被存成一個流暢的運動基模，存在於手而非符號。同時，魔方本體承擔了狀態記憶——專家用眼讀回當前局面，而非在腦中維持。

其五，全局監控退場。 新手不時停下檢查「整體還差多少」（一種代價高昂的全局匹配）；專家停止這種檢查，因為相位不變量已把全局保證內化（見第六章）。全局監控的退場，是工作記憶得以釋放、速度得以提升的關鍵之一。

這五者並非彼此獨立，而是同一個壓縮過程的五個側面：把複雜度從意識的窄管裡，分別趕進組塊、趕進策略、趕進身體、趕進外物，並取消對全局的持續驗證。

第六章　命題群 C：全局正確性的結構擔保

命題 C1（方法即證明：全局正確由不變量保持的相位序擔保，非由全局匹配達成）

專家從不執行「全局匹配」——他不表徵、不驗證整顆魔方的全局狀態。他執行一連串局部匹配，其合成之所以全局正確，是因為解法的相位結構單調保持已解部分（先解的層在後續相位中不被破壞）。全局正確性是方法設計的湧現擔保，不是一個被表徵的目標。

論證（以層先法逐相位走查）。 考慮一條典型解法的相位序：底層十字 → 底層角塊（完成第一層）→ 第二層稜塊（完成前兩層）→ 頂層朝向 → 頂層排列。每一個後續相位所用的演算法，都被設計為保持前一相位的成果不變：插入第二層稜塊的觸發會暫時擾動底層、但結尾恢復；頂層朝向的演算法保持前兩層不變；頂層排列的演算法保持朝向不變。於是「離解還差多遠」這個全局量，沿相位序自動單調下降，無需任何人去計算它。會去計算全局距離的，是帶啟發函數 $h$ 的搜尋（如我們的 IDA\* 求解器），不是專家。專家把全局保證外包給了相位結構——方法本身就是一份不必每次重證的證明。

認知科學對應。 此對應「程序性技能的階層組織」與 Dreyfus & Dreyfus（1986）對專家「不再依規則、而依情境直覺」的描述：專家信任方法，把全局保證外包給已內化的相位結構。Ericsson & Kintsch（1995）的「長期工作記憶」說明專家如何以結構化檢索繞過工作記憶限制——相位即一種結構化索引，使專家能在不持有全局的情況下，於正確的位置取出正確的局部知識。

推論 C1.1。 「局部匹配到全局匹配」的表述高估了全局端。更精確：局部匹配一路到底，全局正確性是相位不變量的湧現擔保。 全局匹配若真被執行，那是搜尋者（新手或演算法）的行為，不是專家的。新手之所以慢，部分正因為他還在做這種昂貴而其實可被結構取代的全局監控。

第七章　命題群 D：聯想查詢與展平鍵

命題 D1（專家查詢是內容定址的聯想檢索，為雜湊的對偶）

把專家的查詢稱為「雜湊表查詢」在「快取」一義上成立，在「雜湊」一義上接反。雜湊函數被設計來摧毀鄰近結構（相近的鍵被打散、差一位元即落入無關桶）；而專家的查詢鍵是有損、近似、容忍變形的——相近的局部構型觸發相近（甚至相同）的反應。專家是內容定址的聯想記憶，是雜湊表被設計來避免成為的那種東西。

論證。 雜湊的價值在均勻散佈（避免碰撞），其代價是丟棄輸入空間的度量結構：好的雜湊函數刻意讓相鄰的鍵映到遠處。辨識的價值恰在保留度量結構：一個未曾精確見過的構型，仍能被歸入正確的組塊族並觸發正確反應（泛化）。前者要散，後者要聚；二者在「是否保鄰近」這一性質上正好相反。若專家真的是雜湊表，他就無法泛化——任何未精確登錄過的構型都會落入無關桶、查無此鍵。但專家恰恰能對沒見過的構型做出對的反應，這正證明其鍵保留了相似度結構。

認知科學對應。 Hopfield（1982）的聯想網路給出內容定址記憶的物理模型：由部分／含噪的輸入收斂至最近吸引子。實例理論（Logan, 1988）亦然——檢索由相似度驅動，而非精確鍵。範疇化與原型理論同樣建立在相似度之上。

FDRS 詮釋（保鄰近的鍵即展平）。 「快取」一半是準的：該快取是被學習期昂貴的有模型搜尋填出來的（探索算過的結果存下、之後利用），此即 memoization。但讀取它的鍵是聯想的、保鄰近的，而非散列的；且其結構是階層的（觸發→案例→相位），非扁平的 key→value。更深的一點是：那把「保鄰近」的鍵，正是 $\pi$ 這次展平的產物——組塊是地址，而地址相近 ⇔ 可操作性相近。這是展平 $\Phi$ 的全部價值：它造出一個「靠近真的有意義」的表示，於是一次廉價的最近匹配就足夠。雜湊把空間打散，好的展平把它收攏。

推論 D1.1。 高手不是記性好到能查一張巨表；他是找到了那張讓查表變得不必要的圖——在保鄰近的座標上，最近的答案永遠就在手邊，近到不像在查，像在認。

第八章　三種收斂的辨正

命題 E1（「展開／收斂」涉及三個不可混淆的算子）

在魔方語境中，「展開／收斂」一詞至少對應三個不同的算子，混為一談會造成範疇錯誤：

（i）維度的 升降：3D 立體 ⇄ 2D 攤平網（FDRS 的 $\Phi$／RDCM）；

（ii）狀態的 收斂：亂序 → 解開（解題本身，在 $\mathcal{S}$ 內的軌跡）；

（iii）注意力的 張開／收束：掃視採集局部特徵（張開）→ 鎖定下一步（收束）。

論證與辨正。 認知過程中真實存在的是（iii）——知覺採樣與決策的循環。但它既非（i）的維度升降，也不應與（ii）的狀態收斂等同。把認知的「局部→全局」直接讀成 FDRS 的「升維／降維」，是一次誘人的等價滑動：認知過程並未改變表徵的維度，它是在一個已被壓縮的低維表示（$\mathcal{X}$）上導航狀態。三個算子各有定義域：（i）的定義域是表示的維度，（ii）的定義域是狀態空間 $\mathcal{S}$，（iii）的定義域是注意力的範圍。混疊它們會讓張力結構塌縮——保持三者分離，是本框架的紀律性要求。

值得補充的是（iii）注意力收斂的機制：專家的視線並非均勻掃描整顆魔方，而是被學得的顯著性引導，跳躍式地落在「下一個可被辨識的組塊」所在處——一次知覺的張開（採樣候選局部）接一次收束（鎖定觸發點），如此循環。這個張開／收束的節律是真實且可被眼動追蹤量測的，但它發生在 $\mathcal{X}$ 的辨識層，與維度升降（i）、狀態前進（ii）分屬不同層級。把「人在解魔方時不斷展開又收斂」這句日常描述，誤讀為 FDRS 的維度操作，正是本命題要攔下的範疇滑動。

第九章　範圍與限制

把單一載體上的結論外推到「一切技能」是危險的。本章誠實界定魔方類比成立的邊界。

其一，魔方是確定性、完全資訊、離散的。 它沒有對手、沒有隨機性、沒有隱藏狀態、沒有連續控制。許多真實技能（駕駛、即興演奏、對話、運動競技）是隨機的、部分可觀測的、連續的、且有對抗方。在那些領域，純無模型快取不足以應付分布外情境，有模型的規劃與線上適應不會完全退場。故命題 B1 的「搜尋坍縮為查詢」在魔方上接近完全，在開放領域只是部分成立——專家仍需保留一定的線上模型用於應變。

其二，魔方有明確的全局判準與可分解的相位結構。 命題 C1 的「方法即證明」依賴於存在一套不變量保持的相位分解。並非所有技能都有這種乾淨的相位結構；缺乏它的技能，其全局正確性無法被結構完全擔保，主體必須保留某種全局監控。

其三，個體差異與方法差異。 同樣「會解魔方」，盲解者、速解者、直覺解者所內化的表徵與策略結構不同。本文的命題刻畫的是「經方法訓練、達到自動化」這一類專家的共性，不宣稱涵蓋所有解法路線。

其四，本文的命題多為既有結論的重組，其魔方實證化（在魔方任務上直接測得各命題的反應時／神經指標）大多尚待進行。 下一章的可證偽預測即為此而設，但本文本身不提供新數據。

其五，技能的特定性與遠遷移之闕如。 魔方專長幾乎不遷移到其他技能——精通魔方並不使人更會下棋、更會演奏或更會解數學題。這個「不遷移」本身佐證了本框架：專家內化的是一張特定任務的展平 $\pi$ 與其上的策略 $\rho$，而非某種可跨域搬運的通用「空間智能」。Thorndike 與 Woodworth 對「形式訓練說」的早期否證、以及遠遷移（far transfer）在文獻中普遍微弱的事實，都指向同一點：被習得的是 task-specific 的低維圖卡與策略。這也回扣命題 A1——複雜度的馴服，來自找到那張特定的圖，而圖不通用；換一個任務，舊圖失效，得重新展平。若魔方訓練被證實能穩健遷移至無關領域的問題解決，則本框架的「展平特定性」假設將受質疑。

界定這些邊界，不是削弱框架，而是標明它的適用域——超出此域的結構，需要其他工具處理。

第十章　猜想群與可證偽預測

以下為超出既有直接證據、但由本框架自然導出的猜想。標註其可證偽形式。

猜想 G1（可程序化 ⇔ 可展平）

一個任務可被內隱地（程序性地）精熟，當且僅當它容許一張保本質連結的低維可操作表示（即存在有效的展平 $\pi$）。缺乏可利用低維結構的任務（如記憶一串無結構的隨機符號）無法被程序化，只能被低效地陳述式硬背。

可證偽預測。 在人工受控材料上系統性調節「可壓縮性 / 結構性」：可壓縮材料應展現冪律式的程序化（反應時下降、可言說性下降、抗干擾性上升）；不可壓縮材料應停留於緩慢的陳述式檢索，不出現自動化轉移。若高度不可壓縮材料仍出現穩定程序化，則 G1 被否證。

猜想 G2（可言說性缺口）

專家的顯性可言說內容，集中於相位骨架與規則不變量（「為何先這樣轉」），而相位內的策略核心 $\rho$ 大致不可言說（黑盒）。可言說性與該知識在陳述式系統的殘留量成正比，與其程序化程度成反比。

可證偽預測。 要求專家逐步口語報告其 F2L 求解，將顯著拖慢並惡化表現（程序核心抗口語化）；而要求其報告相位策略（「先做十字」）則無此代價。若程序核心可被無代價地完整口語化，G2 被否證。此與「次級任務干擾」「言語遮蔽效應」的既有範式相容。

猜想 G3（觀察者—樹幻覺）

對專家單步求解的反應時與神經負荷，不隨狀態樹的局部分支因子增長（因無樹展開）；對新手則隨之增長（因有樹展開）。狀態樹的「複雜度」只在搜尋者身上留下計算足跡，在辨識者身上不留。

可證偽預測。 操弄當前構型在狀態樹中的分支因子 / 解的深度，測量單步啟動的反應時與前額葉負荷：新手應呈正相關，專家應趨於平坦。若專家亦呈強正相關，則 B2／G3 被否證（意味專家仍在展開樹）。

猜想 G4（神經系統的雙軌遷移）

技能習得對應計算負荷由「海馬—前額葉軸」（陳述式、學習期搜尋、有模型規劃）向「基底核—小腦軸」（程序式、無模型策略、前向模型執行）的遷移。

對應與預測。 與 Knowlton、Mangels & Squire（1996）對基底核於機率分類學習之角色、Squire（1992）對陳述／非陳述記憶之解離、Wolpert、Ghahramani & Jordan（1995）對小腦前向模型之刻畫一致。預測：練習過程中，求解相關活動應由內側顳葉／背外側前額葉向背側紋狀體與小腦轉移。此為既有運動學習文獻的已知模式，本文僅將其錨定於魔方。

第十一章　神經對應小結

兩個時間尺度對應兩條神經軸，且彼此競爭與接力：

學習期 / 新手 / 有模型搜尋： 內側顳葉（海馬，情節編碼）、背外側前額葉（工作記憶、規劃、心像旋轉）。昂貴、靈活、可言說、佔用工作記憶瓶頸。
專家 / 無模型策略： 背側紋狀體（基底核，習慣與狀態—動作快取）、小腦（前向模型、運動時序）、運動皮質（手指法的運動基模）。廉價、僵化、不可言說、開迴路執行、可外包於身體與外物。

延展認知（Clark & Chalmers, 1998）在此具體化：競速者把狀態外包給魔方本體（用眼讀回，不在腦中模擬）、把演算法外包給手指（手「知道」觸發）。表徵分布於內部策略、身體運動基模與外部物件三處——這也是工作記憶瓶頸的三條逃逸路徑：組塊（讓 WM 只持一個單位）、程序（讓 WM 無須持有）、外物（讓世界持有狀態）。三者是同一策略：把複雜度趕出意識的窄管。

第十二章　結語

我們花了整套工程，教會一台機器像新手那樣思考魔方——它展開狀態樹、用啟發式估測離解還差多遠、剪枝、回溯。而本文所問的那個高手，恰恰是學會了不再那樣思考的人：他不展樹、不估距、不回溯，他辨識，然後動作。

把這些命題串起來，會看見一條一致的弧：複雜性不在物件裡，在描述它的人那裡（命題 A）；狀態樹不在執行者腦中，在重建它的觀察者那裡（命題 B）；全局正確不靠全局匹配，靠方法的不變量結構擔保（命題 C）；查詢不靠散列，靠保鄰近的展平鍵（命題 D）。四者是同一個洞察的四個側面——所有看似住在高維裡的東西，都在一次正確的展平之後，搬到了低維的手邊。

狀態樹不是被走完的，是被忘掉的。熟練的盡頭不是記得每一條分支，而是再也不需要看見那棵樹——在對的座標上，最近的答案近到不像在查，像在認。而認，從來不是記憶的勝利，是遺忘的成就：把所有不必要的分支忘乾淨，只留下那條手早已知道的路。

也正因如此，技能最深的那一層注定無法被言說、被教授——能寫進教科書的，永遠是還停在陳述式格式裡、尚可被語言載出的殼層（相位與不變量）；而那個讓魔方在指間流動的核心，每個人都得自己重新長一次。我們能把地圖交給下一個人，交不出走過那條路的腳。這不是技藝的缺憾，是它的尊嚴：有些知識，只能由身體親自抵達。

參考文獻（擇要）

Anderson, J. R. (1982). Acquisition of cognitive skill. Psychological Review, 89(4).
Chase, W. G., & Simon, H. A. (1973). Perception in chess. Cognitive Psychology, 4(1).
Clark, A., & Chalmers, D. (1998). The extended mind. Analysis, 58(1).
Cowan, N. (2001). The magical number 4 in short-term memory. Behavioral and Brain Sciences, 24(1).
Daw, N. D., Niv, Y., & Dayan, P. (2005). Uncertainty-based competition between prefrontal and dorsolateral striatal systems. Nature Neuroscience, 8(12).
Dreyfus, H. L., & Dreyfus, S. E. (1986). Mind over Machine.
Ericsson, K. A., & Kintsch, W. (1995). Long-term working memory. Psychological Review, 102(2).
Fitts, P. M., & Posner, M. I. (1967). Human Performance.
Gobet, F., & Simon, H. A. (1996). Templates in chess memory. Cognitive Psychology, 31(1).
Hopfield, J. J. (1982). Neural networks and physical systems with emergent collective computational abilities. PNAS, 79(8).
Knowlton, B. J., Mangels, J. A., & Squire, L. R. (1996). A neostriatal habit learning system in humans. Science, 273(5280).
Korf, R. E. (1985). Depth-first iterative-deepening: An optimal admissible tree search. Artificial Intelligence, 27(1).
Logan, G. D. (1988). Toward an instance theory of automatization. Psychological Review, 95(4).
Miller, G. A. (1956). The magical number seven, plus or minus two. Psychological Review, 63(2).
Newell, A., & Rosenbloom, P. S. (1981). Mechanisms of skill acquisition and the law of practice.
Newell, A., & Simon, H. A. (1972). Human Problem Solving.
Reber, A. S. (1967). Implicit learning of artificial grammars. Journal of Verbal Learning and Verbal Behavior, 6(6).
Rokicki, T., Kociemba, H., Davidson, M., & Dethridge, J. (2014). The diameter of the Rubik's cube group is twenty. SIAM Journal on Discrete Mathematics, 27(2).
Shepard, R. N., & Metzler, J. (1971). Mental rotation of three-dimensional objects. Science, 171(3972).
Shiffrin, R. M., & Schneider, W. (1977). Controlled and automatic human information processing. Psychological Review, 84(2).
Squire, L. R. (1992). Declarative and nondeclarative memory. Journal of Cognitive Neuroscience, 4(3).
Sutton, R. S., & Barto, A. G. (1998). Reinforcement Learning: An Introduction.
Wolpert, D. M., Ghahramani, Z., & Jordan, M. I. (1995). An internal model for sensorimotor integration. Science, 269(5232).

附錄 A　與 FDRS 算子的對照

| 認知對象 | 本文記號 | FDRS 對應 | |---|---|---| | 全局狀態 → 局部組塊 | 有損商映射 $\pi:\mathcal{S}\to\mathcal{X}$ | 展平 $\Phi$（降維，保鄰近 / 保本質連結） | | 組塊 → 重建全局構型（罕用） | $\pi$ 的部分逆 | 重構 RDCM（升維） | | 觀察模式切換（立體/攤平/譜） | $m\mapsto m'$，容器不變 | 表示轉換 $\mathcal{R}$（容器同一性） | | 學習期搜尋的代價 | 狀態樹 $T$ 的展開成本 | 對應失真 / 代價算子 $\mathcal{D}$ 的高值（昂貴轉換） | | 專家查詢 | 在 $\mathcal{X}$ 上的聯想檢索 $\rho$ | 低 $\mathcal{D}$ 的近等距讀取（保鄰近鍵） | | 相位骨架 | 小型有限狀態機 $Q$ | 模式層之上的宏觀控制結構 |

附錄 B　核心命題速覽

A1　描述複雜度 ≠ 導航複雜度；專家操作 $\mathcal{X}$（$\sim10^2$），非 $\mathcal{S}$（$\sim10^{19}$）。
A2　局部表徵 = 全局狀態的有損商映射（等價類），非單一狀態。
B1　學習期 = 有模型樹搜尋；執行期 = 無模型快取查詢。
B2　狀態樹是觀察者的重建，非執行者的內容；專家保留薄層前瞻而非深層搜尋。
B3　顯性殘餘 = 可傳遞層（相位＋不變量）；程序核心因格式與語言不相容而為黑盒；可教性與精熟度在程序核心上成反比。
C1　全局正確由相位不變量結構擔保，非由全局匹配達成。
D1　專家查詢是保鄰近的聯想檢索，為散列的對偶；保鄰近鍵即展平。
E1　維度收斂 / 狀態收斂 / 注意力收斂為三個不可混淆的算子。

本文為 EveMissLab 之認知科學重讀工作，立場為綜合與重驗，不主張新實證發現。命題與猜想之具體實驗化，留待後續；其與 FDRS 主框架（展平 $\Phi$、重構 RDCM、表示轉換 $\mathcal{R}$、失真算子 $\mathcal{D}$）的形式對接，亦待另文以鏈複形語言完整化。本文的全部主張，可一句話收束：複雜從來不在物件裡，技能不過是找到了那張讓它變簡單的圖，然後把找圖的過程，連同那棵樹，一起忘了。

原始檔（供 RAG/下載）：papers/EML-COG-2026.md [md]

從搜尋到辨識：以魔術方塊重驗技能型內隱認知的命題框架

摘要

第一章 導論

1.1 問題與動機

1.2 為何選擇魔方作為驗證載體

1.3 誠實定位與貢獻

第二章 預備與記號

2.6 一個貫穿全文的具體例子

第三章 命題群 A：複雜性的觀察者相對性