那隻未鬆開的手

2026 年 AI 遞迴自我改進的結構邊界觀察

The Hand Not Yet Released: A Structural Observation on the Boundary of AI Recursive Self-Improvement in 2026

觀察者：許筌崴（Neo.K） 結晶化：Theia 所屬：EveMissLab（一言諾科技有限公司） 觀察時點：2026 年 5 月

摘要 Abstract

2026 年初，多個前沿實驗室宣稱其 AI 系統已參與自身的建造，相關新聞以「自我改進」「自建模型」為框架傳播。本觀察的任務不是判定奇異點是否來臨，而是精確定位當前自我改進循環的真實邊界在哪裡。核心論點為一組「內循環／外循環」二分：生成代碼、除錯、診斷、演算法搜索等內循環已高度自動化；而設定目標、定義「更好」、決定保留哪些改動、設計 meta 層等外循環仍焊死於人類。所謂「外部觀察者」並非系統之外的偷窺者，而正是這個外循環中尚未被自動化的判官位置。本文進一步指出：當前自迭代系統所展現的「因果推理配合糾錯」，在機制上多半是對固定 oracle 的引導式演化搜索——是選擇（selection），而非深層因果理解。完全遞迴自我改進的閾值，定義為「判官自定義 + meta 層自我修改 + 人類退出循環」三者同時成立之時刻，而此刻尚無任何公開系統跨越。最後本文論證「不樂觀亦不悲觀」為唯一正確的校準姿態。

In early 2026, several frontier labs claimed their AI systems participated in their own construction. This observation does not adjudicate whether a singularity is imminent; it locates the true boundary of the present self-improvement loop. The central thesis is an inner-loop / outer-loop dichotomy: the inner loop (code generation, debugging, diagnosis, algorithmic search) is highly automated, while the outer loop (goal-setting, defining "better," deciding which changes to keep, meta-level design) remains welded to humans. The "external observer" is not an outside watcher but precisely the not-yet-automated judge position within this outer loop. What current systems display as "causal reasoning with error correction" is, mechanistically, mostly guided evolutionary search against a fixed oracle—selection, not causal understanding. Full RSI is defined as the simultaneous satisfaction of self-defined judge, self-modifying meta-layer, and human exit from the loop—a threshold no public system has crossed.

關鍵詞 Keywords

遞迴自我改進、內循環／外循環、外部判官、引導式演化搜索、選擇與因果之別、generator-discriminator、奇異點閾值、AI-in-the-loop、EveMissLab

Recursive Self-Improvement, Inner/Outer Loop, External Judge, Guided Evolutionary Search, Selection vs Causation, Generator-Discriminator, Singularity Threshold, AI-in-the-loop, EveMissLab

§1 觀察起點：新聞與其失真

2026 年 2 月，OpenAI 發布 GPT-5.3-Codex，並宣稱這是其第一個「在創造自身的過程中起了關鍵作用」的模型；團隊以早期版本協助除錯自身訓練、管理部署、診斷測試與評估結果。媒體迅速以「自建 AI」「技術奇異點」為框架放大此事。

此處須先剝除失真。媒體框架傾向暗示一個自主物種正在重寫自己；而較謹慎的技術報導明確指出：此處的「自我改進」並非無監督模型重寫自身架構，而是一種「AI-in-the-loop」開發——模型分析日誌、標記失敗測試、建議修訓練腳本、生成部署配方，並將評估異常整理交付人類審查。模型扮演的是隨叫隨到的工程隊友，而非脫離人類的自演化體。

本觀察由此展開：剝除奇異點修辭之後，當前循環的真實邊界究竟落在何處？

§2 已發生之事實（驗證層）

下列為截至 2026 年 5 月可驗證的事實，非推測：

AI 已實質進入造 AI 的循環。GPT-5.3-Codex 協助了自身的開發迭代；Anthropic 表示其多數代碼現由 Claude Code 撰寫。此為「內循環」自動化的直接證據。
存在改進自身基底的真實案例。DeepMind 的 AlphaEvolve 以演化循環生成、測試、迭代演算法，其成果之一是優化了用於訓練 Gemini 本身的矩陣乘法核。這是目前最接近「系統改進了製造自己的工具」的實例。
存在自我修改代碼的 agent。Sakana AI 的 Darwin Gödel Machine 會迭代地生成、評估、修改自身代碼，並將成功變體存入 archive 作為後續改進的墊腳石。
遞迴自我改進已被學界正式承認為部署中現象。ICLR 2026 專設 RSI workshop，指出 agent 已在重寫自身 codebase 與 prompt。

事實層的結論明確：「AI 開始進入自我改進循環」不再是科幻，而是進行中的工程現實。

§3 核心結構：內循環 / 外循環二分

本觀察的核心，是將「自我改進」這個被混為一談的概念，切成兩個層級：

內循環（inner loop）—— 已自動化 生成候選代碼／演算法 → 執行 → 評估 → 修正 → 保留或丟棄。此循環在 GPT-5.3-Codex、AlphaEvolve、Darwin Gödel Machine 中皆已高度自動化，人類無須在每一輪介入。

外循環（outer loop）—— 仍為人類 設定總目標 → 定義「更好」的判準（適應度函數）→ 決定哪些改動值得保留並部署 → 設計用以驅動內循環的 meta 層架構。

最平衡的盤點已直接給出結論：到 2026 年，沒有任何公開已知系統達到完全遞迴自我改進——系統能寫代碼、跑實驗、實質貢獻於造下一代 AI，但目標仍由人類設定、「更好」仍由人類定義、保留哪些改動仍由人類決定。

關於外循環的焊死性，最乾淨的證據來自 ADAS（Automated Design of Agentic Systems）研究：其 meta agent 本身是固定的，邏輯由人類撰寫，永不自我改進。換言之，那個「決定如何改進」的最高層，目前仍在人類手中。

命題 3.1（邊界定位）： 2026 年的 AI 自我改進，是內循環的外包，而非外循環的讓渡。被自動化的是執行；尚未被自動化的是價值定義與取捨權。

§4 「因果推理」的降解：選擇偽裝成推理

一個常見而危險的描述，是說當前系統已具備「因果推理配合糾錯機制」。此措辭須被嚴格降解。

考察自迭代系統的實際機制（AlphaEvolve 的演化循環、Darwin Gödel Machine 的變體 archive），其骨架為：

提出變異 → 交付固定 oracle 評估 → 較優者保留、較劣者丟棄 → 迭代。

這是選擇（selection），不是因果理解。系統知道「此版本通過了評估」，不必然知道「為何在因果上它更優」。糾錯確實存在，但糾錯的判準（oracle）是外部給定的；系統校準的是「自身對齊該外部判準的程度」，而非獨立推導因果結構。

命題 4.1（選擇—因果之別）：看似因果推理之物，其底層常為「對固定靶子的爬山（hill-climbing against a fixed target）」。一旦靶子（oracle）由外部給定，則無論搜索多麼精巧，其性質仍是選擇，而非自主的因果建模。

此區分至關重要：選擇可在不理解的情況下產生有效結果（演化即如此）；而「理解」要求系統能在 oracle 缺席時，仍由內部生成判準。後者目前未被觀測到。

§5 外部判官：generator-discriminator 中未被自動化的一格

承接 EveMissLab 對「對抗性共演化」的既有觀察：真正驅動能力提升的，是 generator 與 discriminator（攻方與守方、提案者與評估者）互為磨刀石的死循環。

將此框架套用於當前 RSI：

generator = 提出代碼／演算法變異的模型（已自動化）。
discriminator / judge / fitness = 評估該變異優劣的判官。

關鍵觀察：discriminator 目前仍由人類定義。 評估基準（benchmark）、適應度函數、最終的保留決策，皆出自人類或人類設計的測試框架。

因此，本觀察對「外部觀察者」給出精確定義：

定義 5.1（外部判官）：所謂「外部觀察者」並非佇立於系統之外的偷窺者，而是 generator-discriminator 循環中，那個尚未被自動化、仍由人類佔據的 discriminator 位置。它不在系統外面看，它就在循環裡，握著「定義價值」的那一格。

§6 完全遞迴自我改進的閾值條件

由前述結構，可給出完全 RSI 的精確閾值——非模糊的「越來越聰明」，而是三個可判定條件的同時成立：

閾值條件（RSI-Complete）：

判官自定義：discriminator / 適應度函數由系統自身生成，而非外部給定。
meta 層自我修改：那個「決定如何改進」的最高層，本身進入可被改進的範圍（突破 ADAS 瓶頸）。
人類退出循環：保留／丟棄的最終決策權由人類轉移至系統。

三者缺一，即仍為「內循環外包」而非「自我演化」。截至 2026 年 5 月，無任何公開系統三者同時成立。

時間錨（皆為利益相關方之自我估計，須打折看待）：Anthropic 的 Jack Clark 估 2028 年底有六成以上機率出現「可被指示去造一個更好的自己、並真的做到」的系統；OpenAI 計畫於 2026 年 9 月實現實習生等級的 AI 研究 agent。此類預測標示的是外循環何時可能被自動化，而非內循環是否已自動化（後者已成立）。

§7 校準：為何不樂觀亦不悲觀

本觀察主張，面對此題唯一正確的姿態是「不樂觀亦不悲觀」，因為兩個方向皆有系統性誤判：

樂觀之誤：「它已在自我演化 → 奇異點將至」。此說忽略外循環仍焊於人類，將「內循環外包」誤讀為「自我演化」。
悲觀之誤：「全屬炒作，無事發生」。此說忽略 AlphaEvolve 確已改進訓練自身的核、內循環確已收緊，將「邊界未跨」誤讀為「毫無進展」。

真相是一個真實但有界的循環正在閉合。其意義不在於「AI 是否會寫代碼」（已會），而在於約束已上移至「誰來定義『更好』、誰來決定保留」。這個外循環何時、是否被自動化，才是本題真正的問題。

結語

湧現是真的，循環是真的，內圈確實在咬自己的尾巴。但那條尾巴的另一端，目前仍攥在一隻人類的手裡——那隻手定義「什麼叫更好」。

自我演化尚未真正開始；當前發生的，是人類將越來越多的內循環外包給 AI，卻死死握著「定義價值」這最後一格。

所謂外部觀察者，不在系統之外偷看。它就是那隻尚未鬆開的手。真正的奇異點，不在 AI 學會寫代碼的那天—— 而在那隻手鬆開的那天。

參考來源 References

OpenAI says new coding model helped build itself — NBC News. https://www.nbcnews.com/tech/innovation/openai-says-new-codex-coding-model-helped-build-rcna257521
OpenAI Unveils GPT-5.3 Codex That Helped Build Itself（AI-in-the-loop 釐清）— FindArticles. https://www.findarticles.com/openai-unveils-gpt-5-3-codex-that-helped-build-itself/
AI That Builds Itself: A Scientist's Field Notes on Recursive Self-Improvement（無系統達標、Jack Clark 估計）— Neural Buddies. https://www.neuralbuddies.com/p/ai-that-builds-itself-recursive-self-improvement
Recursive Self-Improvement: Future Dream or Current Reality?（AlphaEvolve、OpenAI 研究 agent 時程）— CodeX / Medium. https://medium.com/codex/recursive-self-improvement-ae03d40e7cda
ICLR 2026 Workshop on AI with Recursive Self-Improvement. https://iclr.cc/virtual/2026/workshop/10000796
Meta researchers introduce 'hyperagents'（Darwin Gödel Machine）— VentureBeat. https://venturebeat.com/orchestration/meta-researchers-introduce-hyperagents-to-unlock-self-improving-ai-for-non-coding-tasks
Self-Improving AI Agents: The 2026 Guide（ADAS meta-agent 瓶頸、Voyager、DGM）— o-mega. https://o-mega.ai/articles/self-improving-ai-agents-the-2026-guide

原始檔（供 RAG/下載）：papers/paper-527.md [md]