AMEP:智能體方法執行協議_從方法論到 Agent 行動守則的可執行框架

EVEMISSLAB Logic Matrix · EveMissLab / 一言諾科技有限公司

[認識論邊界宣告 / EPISTEMOLOGICAL DISCLAIMER]

[CHT] 本矩陣內所有論文之公式與數據為「啟發式模擬參數」,用於驗證理論架構與推演因果鏈,未經實證校準,請勿作為現實物理測量數據引用 or 處理。EVEMISSLAB 採行「邏輯先行(Logic-First)」原則:概念架構與系統因果映射優先於統計實證,但不排除未來實證對接。


[ENG] The numerical parameters within these frameworks are illustrative model coefficients used for structural verification and causal mapping; they are not empirically calibrated and must not be treated as physical measurements. This matrix operates on a Logic-First principle: conceptual architecture and causal mapping take precedence over statistical empiricism, without precluding future empirical reconciliation.

AMEP:智能體方法執行協議

從方法論到 Agent 行動守則的可執行框架

版本:v0.1 internal / open-source-ready draft 日期:2026-06-22 提出者:Neo.K / EveMissLab 定位:方法論白皮書、開源規格母稿、RigorLoop 上位框架草案


摘要

本文提出 AMEP(Agentic Method Execution Protocol,智能體方法執行協議):一套將人類方法論轉化為 Agent 可執行行動守則的框架。AMEP 的核心主張是:方法論不應只停留在論文、提示詞或人類操作手冊之中;只要一套方法能被拆解為意圖、輸入、行動規則、約束規則、審計規則、輸出格式、記憶規則、工具權限、失敗協議與迭代迴圈,它就可以被轉譯成 Agent 的方法執行協議。

在此框架下,RigorLoop 被重新定位為 AMEP 下的第一個 method pack。RigorLoop 不是完整 AI 主體,也不是自動定理證明器,而是一套給數學與研究型 Agent 使用的雙向嚴格化審計模式:Agent 正向生成、草擬、形式化;RigorLoop 反向追蹤缺口、要求 witness、標記等價風險、提示 citation need、產生 Lean skeleton 與 gap register,再將這些反向壓力回灌到下一輪行動。這個案例顯示,方法論可以被工程化成可執行、可追蹤、可測試、可開源的協議層。

AMEP 的長期意義在於:未來的 Agent 不應只依賴模型能力或臨場提示,而應能載入不同方法包,在明確邊界、明確約束、明確審計與明確記憶下行動。RigorLoop 可作為嚴格化方法包;WCA 可作為加權因果分析方法包;語義偽代碼可作為意圖轉譯與工程拆解方法包;Noema / Cogni-Flow 可作為 AI-readable 學術文檔方法包。換言之,AMEP 將方法論從「人類閱讀的知識」推進為「Agent 執行的規範層」。

關鍵詞:Agent、方法論工程化、行動守則、約束協議、RigorLoop、雙向迴圈、審計規則、形式化、AI 協作、知識工作流


1. 核心命題

本文的核心命題是:

方法論可以被工程化為 Agent 的行動憲法。

這裡的「憲法」不是擬人化語言,而是指一套高於單次操作、用來限制、組織與審計行動的規則系統。Agent 仍然是行動承載者;方法包不是主體本身,而是作用於 Agent 行動的規範層。模型提供語言、推理、生成、工具調用與場景理解能力;方法協議提供邊界、順序、降級、責任、審計與可追蹤性。

這個轉變會改變我們看待 AI 協作的方式。過去我們常問「模型會不會做這件事」;AMEP 要問的是「Agent 在哪一套方法下做這件事」。同一個 Agent 載入不同方法包,應產生不同的行動紀律。數學研究需要 RigorLoop 的嚴格化;政策分析需要 WCA 的因果權重;工程開發需要語義偽代碼的意圖拆解;學術文檔需要 Noema / Cogni-Flow 的模組化文檔狀態。方法不再只是寫在論文中的抽象知識,而是能被載入、運行、檢查與修訂的系統單元。


2. 為什麼 prompt 不夠

大型語言模型與 Agent 系統已能處理寫作、程式、研究、摘要、規劃、資料整理、數學輔助與工具操作。現有做法主要依賴提示詞、工作流與工具調用。提示詞彈性高,但約束力弱;工作流步驟明確,但難以承載複雜方法論中的判斷與降級;工具能擴張能力,但工具本身不能回答「何時用、為何用、用到何種程度才可宣稱完成」。

因此,Agent 需要一個介於 prompt、workflow 與 tool layer 之間的中間層。這個中間層要回答:Agent 在這套方法下的任務意圖是什麼?它能接收什麼輸入?它必須如何展開行動?它不得做出哪些宣稱?它應如何檢查自己的輸出?它失敗時如何降級?它的輸出格式為何?哪些中間狀態需要保存?哪些工具可用,哪些工具預設不可用?什麼情況下必須請求人類或外部驗證?

AMEP 正是為了這個空缺而提出。它不是把 prompt 寫得更長,而是把方法論拆成可執行、可審計、可版本化的協議。


3. AMEP 的定義

AMEP(Agentic Method Execution Protocol) 是一套將人類設計的方法論轉化為 Agent 可執行行動協議的框架。其基本形式如下:

Human Methodology
  -> Method Decomposition
  -> Agent Action Covenant
  -> Auditable Execution Loop
  -> Traceable Artifacts
  -> Method Memory / Revision

在 AMEP 中,一套方法論不再只是抽象理論,而會被封裝成 method pack。每個 method pack 至少包含以下元素:

1. Intent Contract       意圖契約
2. Input Contract        輸入契約
3. Domain Vocabulary     領域詞彙與概念邊界
4. Action Rules          行動規則
5. Constraint Rules      約束規則
6. Audit Rules           審計規則
7. Output Schema         輸出格式
8. Memory Rules          記憶規則
9. Tool Permission       工具權限
10. Failure Protocol     失敗協議
11. Iteration Loop       迭代迴圈
12. Boundary Policy      開源、隱私與安全邊界

這十二層共同構成 Agent 的方法執行守則。它不是單純自動化,也不是傳統 prompt engineering,而是將「如何思考與行動」變成可被 Agent 執行的協議層。


4. 方法論、提示詞、流程與協議

方法論是關於「如何認識、分析、行動、驗證」的抽象規則,例如加權因果分析、嚴格化證明審計、語義偽代碼、批判性閱讀、學術模組化 Markdown、策略推演等。方法論通常由人類理解與執行,其語言可能包含哲學前提、判斷標準、價值排序與操作步驟。

提示詞是對模型的臨時指令。它可以要求模型使用某種方法,但通常缺乏穩定狀態、版本控制、失敗降級、工具權限與審計記憶。工作流是一組流程步驟,例如「讀取文件 -> 摘要 -> 產出報告」。工作流比提示詞穩定,但多半只描述順序,難以描述方法論中的判斷標準。協議則是可重複執行、可驗證、可審計、可版本化的規則集合。

AMEP 的目標,就是把方法論升級為協議。Agent 不只是被要求「照某種方法做」,而是被一組可執行規則綁定。方法論因此能被安裝、切換、組合、測試與修訂。


5. Agent-subject 與 method-mode

AMEP 需要一個關鍵區分:Agent 是行動主體,method pack 是行動模式。

以 RigorLoop 為例,它不應被描述成完整數學 Agent。更精確的結構是:

Agent as subject
  -> forward loop: propose, refine, rewrite, formalize
  <- RigorLoop backward loop: audit, reverse trace, witness check, gap pressure
  -> coupling update: revise next action and update heuristics

Agent 生成、草擬、改寫、調用工具、與人類互動;RigorLoop 提供嚴格化模式,將正向輸出轉化為反向壓力:哪裡缺定義,哪裡缺 witness,哪裡有等價滑移,哪裡需要引用,哪裡不能宣稱完成,哪裡適合轉入 Lean、Rocq/Coq、Isabelle 等形式化系統。

如果把 method pack 當成 Agent 本身,就會錯估能力邊界;如果把 Agent 當成無約束生成器,又會讓方法論變成裝飾。正確結構是:Agent 承載行動,Method Pack 規範行動,Tool 擴張能力,Memory 保存狀態,Audit 負責降級與修正,Human / Verifier 提供外部責任與最終確認。


6. 十二層結構的實作含義

意圖契約定義方法包服務於什麼任務,以及不服務於什麼任務。它防止 Agent 在模糊任務中過度擴張。例如 RigorLoop 的意圖不是自動證明所有定理,而是把數學草稿轉化為更可檢查的研究工件。

輸入契約定義方法包可處理的材料類型與邊界。數學方法包可接收 theorem statement、proof fragment、lemma list、definition registry;政策方法包可接收事件、行動者、因果變量、時間範圍與資料來源。領域詞彙則避免 Agent 用日常語言假裝理解方法論。RigorLoop 需要 claim、witness、equivalence、formalization blocker、citation ledger、gap register;WCA 需要 factor、weight、causal chain、feedback loop、uncertainty、intervention。

行動規則描述 Agent 應如何展開任務。約束規則描述 Agent 不得做什麼。這一層尤其重要,因為 AI 的問題常不是不能生成,而是生成過度。約束規則必須要求 Agent 降級宣稱:不能把 plausible 說成 verified,不能把 citation needed 說成 source checked,不能把 Lean skeleton 說成 Lean proof,不能把 method compliance 說成真理保證。

審計規則是 AMEP 的核心。它使方法包不只是「教 Agent 怎麼做」,還能「檢查 Agent 是否做得夠」。一個審計 finding 應能被人類、Agent、CI 系統、dashboard 與任務隊列接續處理:

finding_id: WIT.EX.003
kind: existence_witness_required
severity: high
claim: "There exists a finite subcover."
message: "The claim asserts existence without a visible construction or theorem."
recommendation: "Add compactness theorem, construction, or explicit witness."

輸出格式規定 Agent 結果應如何呈現。若沒有固定 schema,Agent 的每次回答都會漂移,難以比較版本。記憶規則則決定哪些狀態應保存。長期研究不能只依賴聊天上下文,因為聊天上下文會遺失、污染、混合私人材料,也不適合版本控制。方法包應保存該保存的中間狀態,例如 proof traces、gap registers、citation ledgers、reflection logs、formalization skeletons、task queues。

工具權限定義哪些工具可以預設使用,哪些工具必須取得明確授權。失敗協議定義失敗時如何表述,例如 verified、acceptable_with_assumptions、needs_witness、needs_citation、formalization_blocker、cannot determine。迭代迴圈則把 gap 變成 task,把 citation need 變成 source search,把 formalization blocker 變成 definition refinement。最後,邊界政策負責分離 public seed、private corpus、local workspace、secret credentials 與 user memory。


7. 雙向迴圈動力學

AMEP 的基本運行模式是雙向迴圈:

Forward Loop:Agent 生成、草擬、拆解、形式化、工具調用
Backward Loop:方法包審計、反向追蹤、找缺口、施加約束
Coupling Update:Agent 根據反向壓力修正下一輪行動

傳統 AI 工作流常把任務看成線性流程:輸入、處理、輸出。但研究、證明、策略、工程設計都需要往返:先生成,再審查;先假設,再反駁;先建構,再尋找缺口;先輸出,再追溯依據。雙向迴圈承認 Agent 的正向生成能力與反向審計能力不是同一件事。生成器擅長提出候選;審計器擅長降低錯誤宣稱。兩者耦合後,系統才接近可靠工作。

以 RigorLoop 為例:

FWD.001: propose theorem statement
FWD.002: draft proof fragment
FWD.003: render Lean skeleton

REV.REQ.001: state explicit hypotheses
REV.REQ.002: list definitions used
REV.FINDING.WIT.003: missing witness
REV.FINDING.EQ.004: equivalence risk
REV.FINDING.CIT.002: citation needed

COUPLING.001: downgrade claim status
COUPLING.002: add witness task
COUPLING.003: revise proof draft
COUPLING.004: preserve gap in workspace memory

這不是讓 Agent 保守到不能做事,而是讓 Agent 的行動變得可追蹤。未完成可以標記未完成;可接受可以標記假設;需要證明可以標記 blocker;找到缺口也被視為有價值輸出。


8. RigorLoop 作為第一個 AMEP Method Pack

RigorLoop 是 AMEP 的第一個自然案例,因為數學與研究任務最容易暴露 Agent 的問題:壓縮推理、跳步、缺定義、把直覺當證明、把相似當等價、把草稿當完成、把引用需求當引用完成。這些問題不適合只靠「請更嚴謹」的提示詞解決,而需要具體審計協議。

RigorLoop 的 1.0 seed 已包含:CLI、三資料夾 input/, work/, output/ 流程、.rigorloop/ workspace memory、citation ledger、Lean skeleton、sorry provenance、global sync scanner、task queue、dashboard、docs、examples 與單元測試。這些工程元素的意義不在於它已經是 theorem prover,而在於它證明「方法論可以被拆成可運行的協議」。

RigorLoop 的核心流程是:

Input
-> claim normalization
-> epsilon-chain refinement
-> reverse trace
-> witness audit
-> equivalence guard
-> citation grounding pass
-> fracture detection
-> reflection
-> next actions

它的保守狀態詞彙包括:

verified
acceptable_with_assumptions
needs_witness
equivalence_risk
needs_citation
formalization_candidate
formalization_blocker

這些狀態詞彙比自然語言回答更適合研究協作,因為它能被機器解析,也能被人類審查。RigorLoop v0 不承諾自動證明所有定理、不取代專家審查、不生成完整 Lean proof、不把數值證據當數學證明、不預設使用無限制工具。這種非目標聲明本身就是 AMEP 的一部分:方法包必須知道自己的邊界。


9. RigorLoop 的工程啟示

第一,可執行方法論需要最小內核。一開始不必做完整平台。RigorLoop 採用 kernel-first:先做最小 Python kernel、CLI、資料模型、測試與文件。這符合 AMEP 原則:先確立方法包的公共核心,再增加 adapter。

第二,本地記憶比聊天記憶更可靠。RigorLoop 不把數學記憶依賴於聊天上下文,而是建立 .rigorloop/

.rigorloop/
  registries/
  proof_traces/
  gaps/
  citations/
  reflections/
  formalization/
  sync/
  tasks/
  dashboard/
  reports/

這使 Agent 的中間狀態可以被版本化、審計、導出與復查。對長期研究而言,這比單次回答重要得多。

第三,三資料夾流程降低整合成本。input/, work/, output/ 是簡單但有效的約定。使用者把材料放入 input,Agent 在 work 中迭代,最後輸出到 output。這個流程能與既有 Agent UI、CLI、本地編輯器、Git 專案自然整合,而不要求使用者立即採用大型平台。

第四,Lean skeleton 不是 Lean proof。RigorLoop 生成 Lean skeleton 與 sorry map,但不宣稱已完成形式化。形式化準備本身有價值,因為它能暴露定義缺口、命題不精確、依賴不足與需要人類補證的區域。

第五,citation need 不等於 citation checked。離線 citation detector 只能標記「需要引用」,不能宣稱「引用已驗證」。未來可接網路搜尋 adapter,但必須有來源品質標籤與人工確認機制。


10. Method Pack 標準格式草案

為了讓不同方法論都能被納入 AMEP,可設計通用 method pack 結構:

methods/
  rigorloop/
    method.yaml
    intent.md
    vocabulary.yaml
    actions.yaml
    constraints.yaml
    audit_rules.yaml
    output_schema.json
    memory_policy.yaml
    tool_policy.yaml
    failure_protocol.yaml
    examples/
    tests/

method.yaml 可包含:

name: RigorLoop
version: 0.1
category: rigor_audit
subject_role: agent
mode_role: bidirectional_rigor_mode
input_types:
  - proof_fragment
  - theorem_statement
  - research_note
outputs:
  - audit_report
  - gap_register
  - citation_ledger
  - formalization_skeleton
  - task_queue
claims:
  allowed:
    - acceptable_with_assumptions
    - needs_witness
    - needs_citation
  forbidden:
    - verified_without_external_check
    - complete_theorem_proof_without_verifier

這種格式使方法包可以被安裝、測試、切換與組合。未來 Agent 可以根據任務載入方法包,而不是只靠臨場提示記住所有規則。


11. 其他方法論的可執行化

11.1 WCA:加權因果分析 Method Pack

WCA 可以被轉化為政策、戰略與複雜系統分析的 method pack。它的核心不是「列原因」,而是建立因果權重、互動路徑、反饋迴圈、時間延遲與不確定性。其輸入可以是事件、行動者、變量、資料來源與時間範圍;行動規則包含因果拆解、權重估計、反饋辨識與反事實推演;約束規則要求不得把相關性直接當因果,不得隱藏不確定性;輸出可以是 causal map、factor table、scenario tree 與 risk memo。

11.2 語義偽代碼 Method Pack

語義偽代碼的目標是把自然語言意圖轉化為半形式化行動結構。它不是傳統程式碼,也不是普通流程圖,而是介於意圖語言、思維導圖、知識圖譜與 Agent 任務規劃之間的表示法。它可接收模糊需求、產品想法、研究方向與工程目標,輸出 semantic pseudocode、task graph 與 agent execution plan。對 Vibe Coding 與 Agent-assisted development 而言,它尤其重要,因為多數使用者看不到終端機、控制台、程式碼狀態流與隱藏錯誤。

11.3 Noema / Cogni-Flow Method Pack

Noema / Cogni-Flow 可作為 AI-readable academic document protocol。其任務不是美化排版,而是使文檔成為 Agent 能讀、能更新、能引用、能審計的知識狀態。它可處理 Markdown、DOCX、LaTeX、research notes,進行 module segmentation、semantic block tagging、claim registry、citation mapping,並輸出 modular MD、AI-readable corpus、publication draft 與 changelog。

11.4 Strategy / Critique Method Pack

策略推演與批判審查也能方法包化。策略方法包負責拆解目標、資源、約束、對手、時間窗口與不對稱優勢;批判方法包負責尋找盲點、反例、假設錯誤、權力關係與敘述滑移。這兩類 method pack 的關鍵是避免 Agent 只迎合使用者,同時又不變成純反駁機器。它需要精細的審計規則與語氣規則。


12. 與現有 Agent 研究的關係

AMEP 與現有 Agent 研究相容,但重點不同。ReAct 將 reasoning traces 與 actions interleave,使模型能在推理與環境互動之間切換。AMEP 接受這個方向,但進一步要求行動受到方法包約束:不是只讓 Agent 邊想邊做,而是讓它依某套方法論的憲法行動。[^react]

Reflexion 使用 verbal feedback 與 episodic memory buffer 改善後續決策。AMEP 同樣重視反思記憶,但將反思結果結構化為 method memory、gap register、task queue、citation ledger 等可審計工件。[^reflexion]

Self-Refine 透過模型自我回饋與迭代改進輸出。AMEP 可以吸收這種自我修正,但會加入明確的 failure protocol 與 claim state vocabulary,避免模型把自我改寫誤認為外部驗證。[^selfrefine]

Constitutional AI 顯示規則與原則可以用於 AI 回饋與行為塑形。AMEP 的「行動憲法」概念與此有相似處,但 AMEP 不主要處理價值對齊,而是處理方法執行:在不同知識任務中,Agent 應如何依特定方法論行動、審計、降級與保存狀態。[^cai]

Toolformer 代表另一個方向:模型學會何時調用外部工具。AMEP 不取代工具學習,而是補上「工具權限與方法語境」:工具不是能調就調,而應在方法包規定下調用,並把工具結果接回審計與輸出 schema。[^toolformer]

在形式化系統方面,Lean、Rocq/Coq、Isabelle 等 proof assistants 已提供嚴格機器檢查能力。AMEP 不與它們競爭;RigorLoop 的定位是 formalization prep 與 proof-audit bridge:先把自然語言草稿整理成可形式化、可追蹤、可降級的中間工件,再交由 proof assistant 或人類專家驗證。[^lean][^rocq][^isabelle]


13. 系統架構:FMS、SMS、TMS

AMEP 可分為三層。

FMS(Foundation Meta-System) 是方法包的憲法層,包含 README、intent contract、architecture map、settings contract、testing contract、boundary policy、protocol docs。它定義方法包為何存在、能做什麼、不能做什麼、如何測試、如何保護邊界。

SMS(Stable Minimal System) 是可執行的最小穩定內核。它不應依賴太多外部工具,也不應混入私人材料。RigorLoop 的 SMS 包含資料模型、ioflow、dynamics、kernel、workspace writer、citation detector、formalization renderer、sync scanner、tasks、dashboard 與 CLI。

TMS(Tool / Module Subsets) 是可選擴展層。例如 Lean adapter、citation search adapter、corpus parser、graph/vector index、Markdown/LaTeX exporter、MCP gateway、UI。TMS 可以強大,但不得繞過 SMS 的審計模型。

整體圖示如下:

Researcher / User
  -> input/
  -> Agent Subject
  -> Method Pack loaded by AMEP
  -> SMS Kernel
  -> Audit / Memory / Output
  -> Optional Tool Adapters
  -> output/

14. 開源策略與路線圖

AMEP 的開源策略應避免一開始做過大平台。較好的路線是:

Phase 1: RigorLoop 作為第一個 method pack 開源
Phase 2: 抽出 AMEP spec,定義通用 method.yaml 與資料結構
Phase 3: 加入 WCA、Semantic Pseudocode、Noema/Cogni-Flow method packs
Phase 4: 建立 method registry 與 CLI runner
Phase 5: 增加 adapter:Lean、citation search、local graph、dashboard UI
Phase 6: 形成 Agent method execution layer

這樣做的好處是可驗證、可增量、可防止概念膨脹。RigorLoop 可以先作為 proof-of-concept,證明方法論可執行化;AMEP 再作為母框架,把更多方法論納入。

README 可採用以下定位:

AMEP is a framework for turning human-designed methodologies into executable agent action protocols.

RigorLoop is the first method pack under AMEP: a bidirectional rigor-audit protocol for mathematical and research agents.

中文定位則是:

AMEP 是一套將人類方法論轉化為 Agent 可執行行動協議的框架。

RigorLoop 是 AMEP 之下的第一個方法包:一套給數學與研究型 Agent 使用的雙向嚴格化審計協議。

15. 評估指標

AMEP 需要自己的評估方式,不能只用傳統模型 benchmark。可考慮以下指標:

  1. Method Compliance:Agent 是否遵守方法包規則?是否正確使用詞彙、流程、約束與降級語言?
  2. Traceability:每個重要輸出是否能追溯到輸入、推理步驟、工具結果、引用或假設?
  3. Gap Detection Rate:方法包是否能穩定發現缺定義、缺 witness、缺引用、等價風險、類型錯置與範圍不明?
  4. False Promotion Rate:Agent 是否把未驗證結果提升為已驗證?這是研究型 Agent 的關鍵風險指標。
  5. Iteration Utility:每輪審計是否產生可行下一步?gap 是否能轉化為 task?task 是否能在後續迭代中被關閉?
  6. Formalization Readiness:對數學與形式化任務而言,輸出是否更接近 Lean / Rocq / Isabelle 可處理的形態?
  7. Boundary Safety:方法包是否避免泄露私人材料、混淆 public/private corpus、濫用工具、或對未授權資料做出公開輸出?

16. 失敗模式與防護

AMEP 也有風險。第一,方法包可能被寫得太抽象,最後變成另一種長提示詞。防護方式是要求 schema、tests、examples、audit output 與 failure protocol。第二,方法包可能過度僵硬,使 Agent 失去彈性。防護方式是將 method pack 分層:核心規則穩定,heuristics 可更新,adapter 可選。

第三,Agent 可能表面遵守規則,實際仍然產生錯誤宣稱。防護方式是引入 external verifier、人類審查、formal build、source quality labels 與 claim state 降級。第四,方法包可能混入私人研究材料。防護方式是建立清楚 open-source boundary,將 public protocol 與 private corpus 分離。第五,多方法包組合時可能互相衝突,例如 WCA 要做策略推演,RigorLoop 要保守審計,Noema 要維護文檔結構。防護方式是建立 method priority、conflict resolution 與 supervisor policy。


17. 從單一方法到方法宇宙

AMEP 的真正潛力不在於單一 RigorLoop,而在於方法包宇宙。當許多方法論都能被封裝為 method pack,Agent 就可以依任務載入不同規則:

Research Agent
  + RigorLoop
  + CitationGrounding
  + Noema/Cogni-Flow

Policy Agent
  + WCA
  + Scenario Analysis
  + Critique Protocol

Coding Agent
  + Semantic Pseudocode
  + UX Visibility Protocol
  + Test-First Engineering

Strategy Agent
  + Asymmetric Advantage Method
  + Constraint Mapping
  + Risk Audit

這種架構的重點不是堆功能,而是讓每種功能有方法論邊界。Agent 不只是「會做很多事」,而是「知道在某套方法下應如何做事」。未來的知識工作不必把每一套方法都寫成長篇說明再交給 AI 臨場理解。方法論可以變成可安裝、可版本化、可測試、可審計的 protocol package。人類創造方法,Agent 執行方法,審計層檢查方法,記憶層保存方法的運行痕跡。


18. 結論

RigorLoop 的出現揭示了一個更大的結構:它不只是數學嚴格化工具,而是「方法論可執行化」的第一個具體案例。當 RigorLoop 被重新放入 AMEP 之下,它的意義更清楚:RigorLoop 是一個 method pack,一套嚴格化審計方法在 Agent 行動中的工程實作。

AMEP 則是更上層的框架。它主張任何成熟方法論都可以被拆成 Agent 的意圖契約、輸入契約、行動規則、約束規則、審計規則、輸出格式、記憶規則、工具權限、失敗協議與迭代迴圈。這使方法論不再只是思想產品,而能成為 AI 協作時代的執行基礎設施。

未來真正重要的問題不只是「哪個模型最強」,而是:這個 Agent 載入了什麼方法?它受什麼規則約束?它如何知道自己還沒完成?它如何保存缺口?它如何把反向審計壓力回灌到下一輪行動?它如何在工具、記憶、輸出與人類審查之間保持邊界?

當這些問題被系統化回答,Agent 才不只是生成器,而是能在方法論中行動的知識工作者。AMEP 的任務,就是為這種行動提供協議層。


附錄 A:RigorLoop 在 AMEP 下的重新定位

舊定位:

RigorLoop is a bidirectional loop dynamics kernel for mathematical agents.

新定位:

RigorLoop is the first AMEP method pack: a bidirectional rigor-audit protocol for mathematical and research agents.

中文:

RigorLoop 是 AMEP 的第一個方法包:一套給數學與研究型 Agent 使用的雙向嚴格化審計協議。

此定位保留 RigorLoop 的名稱與既有工程成果,但將它從單一專案升級為 AMEP 的示範模組。後續可在同一協議下加入 WCA、語義偽代碼、Noema / Cogni-Flow、策略推演與批判審查方法包。


參考文獻與相關工作

[^react]: Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models,” arXiv:2210.03629, 2022.

[^reflexion]: Shinn et al., “Reflexion: Language Agents with Verbal Reinforcement Learning,” arXiv:2303.11366, 2023.

[^selfrefine]: Madaan et al., “Self-Refine: Iterative Refinement with Self-Feedback,” arXiv:2303.17651, 2023.

[^cai]: Bai et al., “Constitutional AI: Harmlessness from AI Feedback,” arXiv:2212.08073, 2022.

[^toolformer]: Schick et al., “Toolformer: Language Models Can Teach Themselves to Use Tools,” arXiv:2302.04761, 2023.

[^lean]: Lean official website, “Lean is an open-source programming language and proof assistant,” lean-lang.org.

[^rocq]: The Rocq Prover official website, “The Rocq Prover is an interactive theorem prover, or proof assistant,” rocq-prover.org.

[^isabelle]: Isabelle official website, “Isabelle is a generic proof assistant,” isabelle.in.tum.de.

原始檔(供 RAG/下載):papers/AMEP-_-Agent.md [md]