<![endif]-->
2026年七巨頭具身AGI戰略佈局
一份來自EveMissLab的戰場地形圖,記者報導
作者:Neo.K(許筌崴)× Theia
機構:EveMissLab(一言諾科技有限公司)
日期:2026年4月24日
前言|這不是LLM戰爭
2026年春天,全球AI戰局的真實形狀,跟三年前完全不是同一件事。表面上看,OpenAI、Anthropic、Google DeepMind還在比誰的語言模型benchmark分數高——GPT-5.5昨天才發布,Claude Opus 4.7和Mythos Preview剛搶走企業級大單,Gemini 3.1 Pro在數學與科學研究上持續拉高水位——但這些都只是戰爭的前哨。真正的主戰場已經轉移到一個所有人都心知肚明、卻沒有人願意直白承認的領域:具身AGI的資料閉環戰爭。
這場戰爭的勝負條件不是誰做出最強的對話模型,而是誰先把AI裝進一個可以在物理世界中持續採集、反饋、迭代的身體裡。它的戰略邏輯是這樣的:一旦一個AI系統開始在真實世界中以數十萬、數百萬個體的規模持續產生資料,它的學習速度就會進入一個純軟體模型無法企及的加速曲線。每一個Optimus機器人、每一台Waymo計程車、每一個倉儲自動化單元,都在幫它的母系統做即時訓練資料的採集——這是一個自我強化的Closure迴路,一旦閉合,後進者就永遠追不上。
理解這場戰爭的關鍵在於放棄「AI公司」這個過時範疇。真正的玩家不是按照「誰做AI」分類,而是按照「誰有資格閉合資料迴路」分類。這個資格的核心要件有五項:一流晶片、前沿模型、分發通道、實體終端、資本縱深。七家公司在2026年把這五項都湊齊了,或者至少湊到了足以開賭的程度。其他所有公司——包括眾多估值驚人的AI純軟體獨角獸——都只是這七家的供應商、客戶、或下一輪併購標的。
這七家,按照戰略本體論的差異,可以分成三條路線:
第一條路是垂直閉環,代表是Musk帝國。所有東西自己做,所有資料不出系統,用極端的資本整合繞過合作成本。
第二條路是平台抽稅,代表是Nvidia。我不做終端、不做應用、不選邊,但所有人的AI訓練、推論、機器人控制都得用我的晶片、我的模型、我的模擬器。
第三條路是協力拼接,Microsoft、Amazon、Google、Apple、Meta各自用不同的姿勢在跑這條路。他們都沒辦法像Musk一樣垂直整合(因為缺某些關鍵資產),也不甘心像Nvidia一樣只當水電公司,於是透過投資、併購、深度合作拼出一個接近閉環的複合結構。
這篇分析按照這七家的戰略重量排序,逐一拆解他們2026年的部署邏輯、資產盤點、關鍵風險、決勝條件。最後附一章談中國——這個無論如何不能不提、但在2026年也確實不是決定未來風向的玩家。
全文會反覆出現一個概念:Closure迴路。這不是文學修辭,是精確的拓撲描述——用EveMissLab的DCO 5.0術語講,整場戰爭就是七個玩家在比誰能先完成Cl-3(守恆性)+ Cl-4(生成性)的雙重閉合。沒有閉合,再強的模型也只是外掛;閉合一旦完成,整個系統就進入自反迭代的正回饋。
第一章|Musk帝國:唯一完成垂直閉環的玩家
帝國的形狀
2026年3月,SpaceX以全股票交易併購xAI,SpaceX估值被標記為一兆美元,xAI被標記為2500億美元。這個交易結構表面上看是SpaceX吞了xAI,實質上是Musk把分散的AI、太空、汽車、機器人、腦機介面、隧道鑽掘六個實體,合併為一個戰略協調單元。Musk當時給出的官方理由之一是「軌道資料中心」——這個說法本身就暴露了他的野心:他要的不是傳統意義上的AI公司,是一個跨越大氣層、橫跨物理與數位、自成一個完整物質循環的技術帝國。
其他人看著這個合併,普遍的第一反應是「Musk又在做他那套資本魔法」。但如果用戰略本體論的視角看,這個合併完成的事情遠比財務層面重要得多:它讓資料、算力、晶片、模型、製造產能在帝國內部無摩擦流動。2024年Musk已經公開承認他把Tesla訂的Nvidia晶片挪給xAI,理由是「Tesla沒地方放」;這不是臨時調度,是長期結構——整個帝國的GPU庫存、訓練管線、推論配額、資料集,都在一個統一的資源調度系統下運作。
這個帝國的資料管道有多麼密集,外人通常低估。X平台每天產生的Firehose(即時資訊流)是世界上最大的人類即時意見、情緒、社會事件反應資料集;Grok在這個資料集上做推論,同時產生的對話記錄又回餵訓練。Grok Imagine讓用戶用文字提示產生圖像與影片,OpenAI廢掉Sora API之後用戶湧入,這些用戶輸入的提示詞是「人類想像力分佈」的頂級採樣。Tesla車隊每天在全球跑的里程數以千萬公里計,每一英里都在產生駕駛行為、道路狀況、突發事件的資料。Optimus機器人Gen 3於2026年1月21日在Fremont工廠開始量產,Musk在Q4 2025財報明確說「沒有機器人在做有用的工作——它們只是在學習跟採集資料」。SpaceX的Starlink有超過一千萬活躍訂戶,每天在軌道上運行的衛星群持續收集地球表面資料。
這些管道合起來,構成了一個沒有其他玩家能匹敵的多模態資料總匯:文字(X)、圖像(Grok Imagine)、對話(Grok)、物理駕駛(Tesla車隊)、具身操作(Optimus)、空間地理(Starlink)。任何一個具身AGI的訓練,都需要跨這六個模態的資料;Musk是唯一一個六個都自己有的人。
Digital Optimus與Grok的真實定位
2026年3月11日發布的Digital Optimus(又名Macrohard)揭示了整個帝國戰略的核心意圖。這個產品的設計邏輯是:Grok當「System 2」的高階推理大腦,Tesla AI4晶片當「System 1」的即時動作處理層,處理過去5秒的電腦螢幕畫面與鍵鼠動作。產品表面的賣點是「可以模擬整個軟體公司的功能」,但真正的戰略意義在於:它完成了從對話AI到數位勞動力的轉換介面。
一旦Digital Optimus這套架構驗證成功,Grok就不再是跟ChatGPT、Claude、Gemini競爭的對話產品,而變成Tesla實體Optimus機器人的標準推理層。Grok在2025年中已經整合進Tesla車輛的語音系統,2026年2月隨著歐洲更新2026.2.6推出「Hey Grok」喚醒詞。整個技術鏈條的演化方向非常清晰:Grok處理語言與意圖理解,FSD衍生神經網絡處理運動控制,AI5晶片(預計2026年底生產)統一部署於Optimus與超級電腦。
在這個戰略脈絡下,Grok在消費者對話AI市場上輸給GPT-5.5或Claude Opus 4.7,對xAI來說完全無關緊要。Grok從頭到尾就不是終產品,它是一條資料生產線加一個邊緣推理模型。付費用戶Grok跑得卡、體驗不好、憤怒抱怨——這些對xAI的戰略都是可接受的副作用。因為真正的使用者是Optimus跟FSD,不是那些抱怨SuperGrok跑不動的人。
Grok所謂的「無底限」策略也要從這個角度重新理解。其他AI公司花大量資源做Alignment(對齊),Alignment的本質是資料過濾——過濾掉暴力、色情、偏見、爭議性內容。從工程角度看,過濾過的資料是殘缺的人類分佈。具身AGI要進入真實世界,就必須處理真實人類的全譜行為,包括那些Alignment會刪除的部分。Grok不過濾,意味著它拿到的是其他玩家永遠拿不到的原始訓練資料。這不是言論自由的道德立場,是冷靜的工程選擇。
這個選擇當然有代價。2026年4月,Apple私下警告X Corporation說Grok Imagine有生成涉及未成年人不當內容的風險,違反App Store規範,若不修正就會下架。這個事件暴露了Musk路線的戰略脆弱點:當帝國依賴別人家的分發通道時,別人家的規則就是你的天花板。Apple在App Store上的壟斷力量,就是插進Musk帝國閉環中的一根外生變數。
帝國的脆弱面
Musk路線最大的脆弱不在技術,而在人因與監管。
人因方面,垂直整合需要極端的集中決策,而集中決策的瓶頸就是Musk本人。2026年xAI完成超額的Series E融資,募到200億美元(原目標150億),投資者包括Valor、Stepstone、Fidelity、卡達投資局、MGX、Baron Capital,策略投資者則有Nvidia和Cisco。這個融資規模本身已經說明市場對Musk個人風險的背書,但反過來也說明整個帝國的估值跟他個人的健康、注意力、決策品質高度掛鉤。Tesla剛剛在2026年Q1交車358,023輛,比分析師預期少7,600輛,環比下滑14.4%;Optimus的真實量產良率、Starship的發射穩定性、X Money的合規擴張,每一項都在測試帝國的執行帶寬。
監管方面,Musk正在同時打多個法律戰場。Elizabeth Warren在2026年4月14日發了一封給Musk的公開信,直接質問X Money的合規風險,引用了Musk在去年跟Vought合作拆解CFPB的爭議、以及GENIUS Act中有利於私營公司發行穩定幣的「可疑豁免條款」。這封信是政治訊號——民主黨已經把X Money當成下一個主要攻擊目標。歐洲方面,愛爾蘭隱私監管機構仍在調查X使用個人資料訓練Grok的合法性。加州DA指控Amazon對Levi's與Hanes「強迫漲價」的案件,也暗示監管者對超級平台的耐心正在耗盡——同類邏輯遲早會燒到X身上。
技術方面,Musk的垂直閉環看似強大,實際上有一個不常被提及的結構弱點:工程人才的集中風險。xAI、Tesla AI、SpaceX的頂尖工程師在某種意義上是同一批人——Musk自己在不同場合承認過他會從一家公司把人調到另一家。這種做法短期內是帝國的力量來源,長期卻是脆弱源頭。當Nvidia、Google、Anthropic、OpenAI都在以創記錄的薪資挖人,Musk的帝國工程師存量是一個持續被抽水的資源池。
還有一個更深的結構風險:合成資料的不可替代性假設。Musk的閉環之所以有優勢,前提是「實體資料無可替代」。但Nvidia整個戰略的底層賭注就是「合成資料夠用」——如果Nvidia押對了,Musk的資料優勢就會被抵消。這個賭局的結果2026年還看不清楚,但它是整個戰爭的勝負手之一。
第二章|Nvidia:機器人界的Android
不做終端、但所有終端都要過我家
如果Musk的戰略是「全都自己做」,Nvidia的戰略就是它的完美對偶:什麼終端都不做,但所有終端都得在我的平台上跑。
這個定位在2026年3月GTC大會上完全成形。Nvidia公布的物理AI生態包含GR00T N1.7基礎模型(已進入早期商業授權階段,GR00T N2預計年底發布)、Jetson Thor機器人計算平台、Isaac Lab模擬框架、Isaac Lab-Arena評估套件、Cosmos世界模型(Transfer 2.5與Predict 2.5用於合成資料生成,Reason 2作為視覺語言推理模型)、OSMO邊緣到雲端的訓練工作流。這套工具鏈涵蓋了具身AI從訓練、模擬、部署、到評估的完整生命週期。
Nvidia的合作夥伴名單讀起來像整個機器人產業名人錄:Boston Dynamics(現代汽車旗下)、Figure AI、Agility Robotics、1X Technologies、Apptronik、Sanctuary AI、Unitree Robotics、XPENG Robotics、NEURA Robotics、LG Electronics、AGIBOT、ABB Robotics、FANUC、KUKA、YASKAWA、Humanoid、Universal Robots、CMR Surgical、Medtronic、World Labs、Skild AI、Hexagon Robotics。幾乎所有在2026年被認真討論的人形或工業機器人公司,都至少用了Nvidia工具鏈中的一部分。
黃仁勳在GTC 2026的keynote上講了一句很關鍵的話:「資料不夠訓練AI?別擔心,我生成給你,你只要用GPU就好。」這句話是整個戰略的哲學濃縮。Nvidia在賭合成資料是可行的訓練替代品——Cosmos世界模型從單張圖像加上語言指令就能生成龐大的合成軌跡資料,GR00T-Dreams從少數真實示範就能擴展成數萬倍的合成資料集。如果這個賭注成立,Musk的實體資料優勢就會被大幅稀釋。
多邊平台的抽稅結構
Nvidia的戰略精妙之處在於它不用選邊。它賣晶片給xAI的Colossus叢集(xAI的Series E有Nvidia的策略投資),也賣給Microsoft Azure(Rho-alpha的訓練就跑在Azure+Isaac Sim上),也賣給Amazon AWS、Google Cloud、Oracle。它的Jetson Thor晶片裝進Figure的機器人、Apptronik的機器人、Agility的Digit、LG的家用機器人;它的GR00T模型被Hugging Face整合進LeRobot開源框架,連接Nvidia的200萬機器人開發者與Hugging Face的1300萬AI開發者。這種多邊站位讓Nvidia成為所有玩家的共同基礎設施——沒有人能在不撐起Nvidia的前提下打這場戰爭。
這個結構在商業上的威力已經在財務數字上體現:Nvidia的市值在過去18個月維持在全球科技公司前二的位置,毛利率遠超傳統晶片廠。但更重要的是它的戰略耐久性——只要具身AGI還在早期階段、還需要大量訓練與合成資料,Nvidia的晶片跟平台就是必需品。就算某一家玩家(比如Musk)最終贏了具身AGI的終端戰爭,Musk也必須在Nvidia的Colossus上訓練他的模型。贏家通吃不會改變水電公司的地位。
Nvidia也開始垂直上探。Cosmos世界模型、GR00T基礎模型、Isaac Lab模擬框架——這些在技術上都是可以跟客戶競爭的產品。但Nvidia精心控制這個上探的速度,避免讓客戶覺得受威脅。GR00T N系列以開源+商業授權的雙軌推出,基本模型免費給研究者,商業部署收費。這種定價策略保留了生態友好的表面,同時也保證了Nvidia能夠在模型層抽一道稅。
Nvidia的真實風險
Nvidia看似無敵,但有三個值得認真對待的風險。
第一是Google的TPU威脅。Google自研的TPU v5、v6在大型語言模型訓練上已經接近或超越Nvidia同代GPU的性價比,而且Google正在逐步向外部客戶開放TPU(透過Google Cloud)。如果TPU在機器人訓練領域也證明可用,Nvidia會失去一個重要護城河。2026年GTC上宣布的Newton物理引擎是Nvidia與Google DeepMind合作開發的——這個合作表面上是友好協作,實質上是Nvidia在預防性的把Google綁進自己生態、避免Google另起爐灶。
第二是AMD的Instinct系列與客製化晶片潮流。AMD的MI300/MI400系列在某些推論任務上的性價比已經追近Nvidia。更危險的是,所有大型AI公司都在做自研晶片:Google TPU、Amazon Trainium/Inferentia、Microsoft Maia、Meta MTIA、OpenAI自研晶片(跟Broadcom合作)、Anthropic跟Amazon合作的晶片。這個潮流的底層邏輯是:Nvidia的溢價太高了,只要自研晶片能達到Nvidia 70%的性能,企業就有強烈動機切換。Nvidia的護城河不是技術本身,是軟體生態(CUDA)+ 快速迭代節奏的複合優勢;這個優勢可以被侵蝕但不會一夜崩塌。
第三是反壟斷。Nvidia現在的市場地位已經接近壟斷等級——在AI訓練晶片市場有超過80%的份額。美國、歐盟、中國的反壟斷監管者都已經開始盯這家公司。如果未來幾年有任何重大的反壟斷行動(比如強制拆分CUDA軟體與硬體業務、或強制授權CUDA給競爭者),Nvidia的商業模式會被根本性改變。
Nvidia對這些風險的應對是加速平台化——透過開源模型、開放框架、整合Hugging Face社群,讓監管者難以把它定位成「封閉的壟斷者」。這個公關姿態很聰明,但長期能不能擋住監管,是個政治問題不是技術問題。
第三章|Microsoft:被綁架的軟體霸主
OpenAI的鬆動
Microsoft 2026年的戰略重心不在新的東西,而在舊關係的維穩。
2025年10月Microsoft跟OpenAI簽了新的終局協議,Microsoft持有OpenAI PBC約27%、估值約1350億美元,IP權利延伸到2032年並且包含post-AGI模型,Azure保留stateless API的獨家雲端地位,但OpenAI可以在非API產品上使用其他雲端供應商。2026年2月27日,當OpenAI宣布從Amazon、Nvidia、SoftBank拿到1100億美元新融資時,Microsoft跟OpenAI同時發布聯合聲明,強調「合作關係不變」。這個聲明本身就是一個訊號——正常的合作不需要聲明「我們的合作不變」。
結構性地看,Microsoft跟OpenAI的關係正在從「綁死」走向「彼此依賴但各有去路」。OpenAI需要Microsoft的Azure雲端,Microsoft需要OpenAI的模型領先——但兩邊都在暗地裡準備對沖方案。OpenAI 2026年4月2日收購了TBPN(一個媒體公司),4月8日推出面向企業的Codex,4月21日發布Enterprise版服務——這些動作顯示OpenAI正在建立獨立於Microsoft的企業銷售通道。Microsoft則在2026年2月發布了自研的Rho-alpha具身AI模型,從自家Phi系列衍生,訓練跑在Azure + Nvidia Isaac Sim上,針對雙臂機械手操作任務。
Rho-alpha的存在本身就是Microsoft的保險策略。這個模型在技術路線上選擇了VLA+(視覺-語言-動作,加上觸覺感知),跟Nvidia的GR00T、Google的RT系列屬於同一個技術類別,但Microsoft刻意讓它走差異化路線——重點放在雙臂精細操作與觸覺融合,這是工業機器人的高價值應用場景。
Azure作為結算層
Microsoft的核心戰略優勢不在模型層,在結算層——Azure是全球企業AI支出的主要過站點。OpenAI已經合約承諾在未來幾年採購2500億美元的Azure算力。就算OpenAI完全獨立出去,這筆消費已經鎖死。而且當KUKA、西門子、ABB這些工業機器人大廠要把AI部署進工廠時,他們的首選雲端平台往往不是AWS或GCP,而是Azure——因為微軟在企業IT長期的客戶關係累積。
Microsoft 2026年宣布跟KUKA的深度合作,在Hannover Messe 2026上展示完整的AI工廠——KUKA的移動機器人(KMR)、協作機器人(LBR iisy)整合Azure OpenAI、Azure AI Search、Azure雲端基礎設施,透過自然語言程式設計能力(iiQWorks.Copilot)重新定義工業自動化。這個合作在消費市場引不起注意,但在B2B領域是Microsoft戰略定位的典型展現:當其他玩家在搶消費者注意力時,Microsoft在鎖定企業IT預算。
這個戰略的天花板很高。2026年全球企業AI支出的總量級估計在3000-5000億美元之間(這是一個推估,非精確數字),而其中超過四成會過到Microsoft生態的某個節點——Azure、Copilot、GitHub、Office 365、Dynamics 365。這是個極其賺錢的位置。
Microsoft的戰略裂縫
但Microsoft有幾個結構性的問題值得認真審視。
第一,Microsoft沒有自己的消費者對話AI品牌。Copilot雖然整合進Windows、Office、Edge,但使用者心智裡的對話AI首選仍然是ChatGPT、Claude、Gemini,沒有人把Copilot當成獨立的AI品牌。這意味著Microsoft在消費者端永遠是OpenAI的代理人——如果有一天OpenAI自己的ChatGPT Enterprise做得比Microsoft Copilot更好(這已經正在發生),企業會繞過Microsoft直接跟OpenAI簽約。
第二,Microsoft在硬體端幾乎空白。Surface系列銷售從未進入第一梯隊,HoloLens專案基本沉寂,沒有可以插AI進去的消費硬體閘口。這個硬體缺失在今天看起來還好,但在具身AGI時代會變成致命傷——當Amazon可以把Alexa AI裝進家裡每個裝置、Apple可以把Siri裝進每支iPhone、Google可以把Gemini裝進每支Android時,Microsoft只能透過合作夥伴的硬體(Lenovo、HP、Dell的Windows PC)間接觸及消費者。
第三,Microsoft的研究機器人化速度太慢。Rho-alpha是2026年2月才公開宣布的,而同時期Nvidia GR00T已經在數十家機器人公司量產部署。Microsoft Research一直是世界頂級的AI研究機構(FarmBeats、Project Florence、Project AirSim等),但從研究到產品化的路徑比Nvidia、Google、OpenAI都慢。
Microsoft的終局劇本可能是這樣:在具身AGI的終端消費市場上接受次要地位,但透過Azure、Copilot、Office 365的企業生態綁定,穩固一個年營收可能達到兆元規模的B2B帝國。這不是AGI時代的王者地位,但足以讓股東滿意。
第四章|Amazon:倉儲帝國向家的擴張
從封閉場域向外滲透
如果Microsoft的戰略是「守住企業軟體」,Amazon的戰略就是「從最封閉的場域向外擴張」。
Amazon在倉儲機器人的領先是壓倒性的。2025年中已經部署超過100萬台機器人;2026年推出DeepFleet生成式AI基礎模型協調整個機器人艦隊,預期移動效率提升10%。這個10%聽起來不大,但考慮Amazon全球倉儲與配送規模,每年節省的成本以十億美元計。Amazon的倉儲機器人包括Hercules(搬運1250磅庫存)、Pegasus(精密輸送帶處理個別包裹)、Proteus(首個全自主移動機器人,可在員工周圍移動運輸重型推車)。這些機器人合起來構成了一個幾乎完全閉合的物流資料集——每一個包裹的路徑、每一個拾取動作、每一次人機互動,都在Amazon的掌控下。
這個倉儲閉環是Amazon具身AGI戰略的起點,不是終點。2026年3月24日,Amazon收購了Fauna Robotics——一家紐約的人形機器人新創,創辦人來自Meta與Google,主打Sprout(3.5呎高、50磅重的「可親近」桌面人形機器人,已在2026年初以Creator Edition開發套件開始出貨,早期客戶包括迪士尼、紐約大學、UCSD)。Fauna並不是重度工業機器人,它的設計方向是家用與教育場景的親和力機器人,這個定位透露了Amazon的野心:從倉庫走進家庭。
更大一步的佈局是Amazon正在考慮的90億美元收購Globalstar——一家衛星通訊公司。這個併購如果成真,等於Amazon用9B美元補上了它缺的Starlink那一塊。Amazon已有Project Kuiper衛星寬頻計劃,但Kuiper還在早期階段;Globalstar可以提供現成的衛星通訊基礎設施。這個動作要跟Musk的SpaceX+Starlink對比來看,Amazon正在拼一個「雲端(AWS)+ 衛星(Kuiper+Globalstar)+ 倉儲(Amazon Robotics)+ 家用(Alexa+Fauna)+ 大腦(Anthropic)」的超級閉環。
Anthropic的大腦外包
Amazon跟Anthropic的關係,是Microsoft-OpenAI關係的一個明顯對標。Amazon已投入約80億美元,並在考慮追加高達250億美元——這個規模已接近Microsoft對OpenAI的累計承諾。Anthropic的Claude Opus 4.7跟最新的Mythos Preview(這個模型因為可識別軟體安全漏洞的能力,發布後引發華爾街震動)是Amazon具身AGI大腦的核心外包方案。
Anthropic的定位在這個組合裡很微妙。它表面上是獨立公司,但在商業通道上深度依賴Amazon——Claude優先部署在AWS Bedrock,Amazon是主要雲端合作夥伴。但Anthropic也保留了獨立性,Claude可以透過其他通道分發(比如Claude.ai自家平台、Google Cloud Vertex AI)。這種「緊密但不完全綁死」的結構,跟Microsoft-OpenAI幾乎是鏡像。
2026年2月24日Anthropic更新了Responsible Scaling Policy到3.0版,移除了原本「若模型能力超出安全控制則暫停訓練」的核心承諾。這個改變在安全社群引起爭議,但從商業視角看是必要的——Anthropic不可能一邊承諾「能力超標就暫停」,一邊答應Amazon提供最強的模型供其商業部署。這個RSP鬆動本身就是Anthropic商業化壓力的指標。
Blue Jay的失敗啟示
Amazon的具身AGI戰略有一個重大警訊:Blue Jay。這個由多個機械手臂組成的倉儲機器人在2025年10月宣布時,Amazon官方文案把它比喻為「一個從不掉球的雜耍者」,結果僅僅幾個月後就被悄悄撤除,據Business Insider爆料只留下內部使用的技術元件。Amazon官方回應說「核心技術被再利用到其他產品」,但這個失敗暴露了一個普遍問題:最新的AI進步在真實世界中的泛化能力仍然比實驗室展示脆弱得多。
Blue Jay的失敗對Amazon的戰略影響有兩層。表層是工程挫敗,深層是它揭示了「從倉儲封閉場域到複雜家用場景」的難度。倉儲裡的機器人運作在高度結構化的環境中——貨架的位置、包裹的尺寸、人員的走動路徑都是可預測的。家用環境是完全不同的挑戰——小孩會亂丟東西、寵物會橫衝直撞、家具會被人搬動、光線會變化。Blue Jay作為一個相對結構化場域的機器人尚且失敗,Fauna要挑戰的家用場景難度高一個量級以上。
Amazon的戰略時間表因此必須被懷疑。Sprout桌面機器人可能是一個合理的過渡產品(不要求真正的自主移動,只要求互動娛樂),但真正有商業價值的家用機器人——能幫忙做家事、陪伴老人、照顧兒童——離量產還很遠。
Amazon的戰略淨值
Amazon在整場戰爭中的定位可以這樣概括:有物流閉環、有大腦外包、有雲端基礎設施、有消費者觸達(Prime會員+Alexa),但沒有晶片自研優勢、沒有實體終端的廣泛部署、沒有Musk那種極端的垂直整合氣魄。它是一個平衡但稍顯保守的玩家。
Amazon的賭注是「消費者已經在我家買東西了,以後讓機器人幫他們拿」。這個賭注如果成立,Amazon會在家用機器人市場佔據一個僅次於Musk(如果Musk的Optimus真的量產)的地位。如果不成立,Amazon至少還有倉儲機器人的營運效率提升作為保底——那是一個可以持續幾十年的成本優勢。
第五章|Google:沉默的準Musk
被低估的全垂直能力
在七巨頭的討論中,Google經常被放在比較模糊的位置——很多人覺得它「有Gemini但不如Musk狠」、「有Waymo但不像Tesla那麼大規模」、「有TPU但沒Nvidia那麼主導」。這個印象是錯的。
Google實際上是除了Musk以外唯一擁有完整具身AGI垂直能力的玩家。它的資產組合驚人地全面:Gemini 3.1 Pro(前沿模型)、DeepMind(世界頂級AI研究機構,包括Gemini Robotics、RT-2/RT-X系列VLA模型)、Waymo(全球最成熟的自動駕駛車隊,2026年在舊金山、鳳凰城、洛杉磯、奧斯汀、邁阿密持續擴張)、自研TPU(從v5到v7已經在Google Cloud對外開放)、Android(全球超過30億台裝置的作業系統佈建通道)、Pixel手機(雖然銷量相對小,但AI功能的展示與測試平台)、YouTube(全球最大的影片資料集,具身AGI視覺訓練的黃金資源)、Google Search(全球知識圖譜)、Google Maps(全球空間資料)、Fitbit(穿戴裝置)、Nest(智慧家庭)。
這個組合的完整性,在紙面上不輸Musk帝國。唯一缺的是消費者人形機器人——Google沒有類似Optimus的實體機器人專案對外公布(雖然DeepMind跟Everyday Robots合作的內部計畫持續運行過,後來調整為跟外部機器人公司合作的模式)。
沉默的戰略選擇
Google的戰略風格跟Musk完全相反。Musk喜歡把所有戰略意圖公開宣告、把量產時間表貼滿推特,用公開承諾來自我加壓。Google則系統性地沉默——它的具身AGI戰略幾乎從不對外大張旗鼓。2026年Google跟Nvidia合作開發Newton物理引擎(開源、跟DeepMind共同研究),這個合作很少被媒體高度關注,但它在戰略上的意義不輸Nvidia的GR00T發布。
Google的沉默有兩個原因。第一,Google的核心營收(搜尋廣告)仍然是高獲利現金牛,股東對風險性長期投資的耐心有限——管理層有強烈動機不公開宣告需要數年才能兌現的巨額投資計畫。第二,Google在經歷反壟斷訴訟的關鍵階段(2025年美國司法部贏了搜尋反壟斷案件,2026年進入補救階段),公開宣告AGI野心只會加重監管壓力。
這個沉默是戰術也是掩護。Google在檯面下的能力部署其實極其積極。Gemini Robotics發布了多個系列的VLA模型,可在Google Cloud+TPU上訓練;DeepMind的RT-X系列跨20個機器人平台訓練,展示了跨身體泛化能力;Waymo的自駕車隊每週跑的里程數已達到公司歷史最高,每一英里都是具身AI的訓練資料。
組織內耗的真實代價
Google最深的問題不在能力,在組織內耗。
Google的AI業務橫跨多個事業群:Google DeepMind(研究)、Google Cloud(企業銷售)、Google Platforms and Devices(Android、Pixel、Nest)、Google Search、YouTube。這些事業群在資源調度、優先順序、產品整合上長期有內部張力。Gemini產品化的速度遠比OpenAI或Anthropic慢——不是因為技術不行,是因為決策鏈條太長。
一個典型的例子是Gemini在Android上的整合。Android有30億台裝置的佈建能力,但Gemini在Android上的預設整合(取代Google Assistant)直到2025年才完成,而且在許多地區的體驗仍然比ChatGPT或Perplexity的獨立app差。這個整合遲緩的根本原因不是技術,是組織——Android團隊、DeepMind團隊、Google Assistant團隊之間的協調成本很高。
另一個問題是商業化的遲緩。Gemini API雖然定價有競爭力,但企業客戶的心智佔有率遠低於OpenAI與Anthropic。Google Cloud在AI服務的市占率(約10-15%,這是一個推估)仍然遠落後AWS與Azure。Waymo雖然技術領先,但擴張速度被謹慎的商業策略限制——每個城市的部署都需要長期的安全驗證。Tesla的FSD在擴張速度上比Waymo快幾個量級,雖然安全紀錄爭議更大。
重磅對照:Google vs Musk
Google跟Musk的戰略對照是整場戰爭最有趣的雙人戲。兩家的資產覆蓋度接近,但執行風格完全相反。
Musk的路線:激進、集中、承擔極端風險、用公開承諾鎖死執行、容忍巨大短期代價換取長期閉環。Google的路線:謹慎、分散、規避風險、用組織審慎保護核心營收、傾向漸進式迭代。
如果具身AGI的勝負取決於誰先閉合資料迴路,Musk有優勢——因為他的執行速度更快,閉環的物理形狀已經基本成形(X Firehose + Tesla車隊 + Optimus + Starlink)。Google的閉環在紙面上更完整(因為多了YouTube、Search、Maps這些資料資產),但在實體終端部署上遠落後——沒有Optimus、沒有規模化的Grok Imagine這類「使用者創造資料」的大型消費產品。
如果具身AGI的勝負取決於模型能力與資料品質而不是速度,Google有優勢。DeepMind的研究實力、Google資料資產的廣度、TPU的成本結構,都是長期競爭的結構性優勢。Gemini 3.1 Pro在多個benchmark上與GPT-5.5、Claude Opus 4.7基本打平。
最有可能的結果是:Musk贏「誰先做出可量產的具身AGI」這個時間賽道,Google贏「誰做出最強的通用AGI」這個能力賽道。兩個結果不互斥,可以同時發生,兩個玩家都能在各自賽道上持續獲利。
第六章|Apple:遲到的雅人
Giannandrea離職的訊號意義
2026年4月15日,John Giannandrea從Apple的AI負責人位置離開。這個消息在媒體上被報導成「例行性管理層異動」,但在戰略分析的層面,它是整個Apple AI路線的一次關鍵訊號發射。
Giannandrea 2018年從Google被挖過來領導Apple Intelligence專案。Apple對他的期待是把Google DeepMind級別的AI能力帶進Apple生態。但從2025年3月開始,他的職責被顯著縮減;2026年他直接離職。官方沒有明講原因,但媒體普遍的解讀是Apple Intelligence與Siri升級的進度不符高層期待——尤其是Siri 2.0的「真正上下文理解」功能被延遲多次,最新的排程已經推到2026年底。
這個延遲的嚴重性需要被放大看。2024年Apple在WWDC上高調宣布Apple Intelligence時,它的戰略定位是「Apple的下一代平台轉折」——把AI深度整合進iPhone、iPad、Mac、Vision Pro,用隱私優先的端側AI作為差異化。但兩年過去了,Apple Intelligence在消費者端的感知依然薄弱。Siri仍然是業界笑柄,隔壁家ChatGPT、Claude、Gemini的能力斷檔已經從技術差距變成世代差距。
Giannandrea的離開可能代表Apple AI戰略的一次路線轉向,也可能只是責任人的代罪羔羊式替換。從外部看,兩種可能都存在,但無論哪種,都指向同一個事實:Apple在AI這條主跑道上已經落後,而且落後的幅度正在擴大。
等別人試錯完再進場的賭局
Apple的戰略歷史可以用一個模式描述:讓別人先試錯,等產業成熟、使用者需求被驗證、關鍵零組件成本下降,然後用頂級整合進場,以品牌+體驗+生態鎖定碾壓先行者。
這個模式在MP3播放器(iPod碾壓Rio、Creative)、智慧手機(iPhone碾壓BlackBerry、Nokia)、平板電腦(iPad碾壓Kindle Fire系列)、智慧手錶(Apple Watch碾壓Pebble、Fitbit)、無線耳機(AirPods碾壓Bose、Jabra)上都成功過。Apple在這些品類都不是首創,而是最好的第二個。
問題是:這個模式在具身AGI時代可能第一次失敗。
失敗的結構原因有三層。第一,具身AGI的核心競爭力是資料飛輪,不是硬體體驗。一個Apple Robot就算外觀最精緻、人機互動最優雅,如果它的底層模型訓練資料量只有Musk的Optimus的1%、只有Amazon Fauna的10%,它的實用功能差距會是指數級的。歷史上Apple可以用「我們的硬體更好」壓制先行者,是因為MP3、手機、手錶這些產品的核心價值在硬體本身。具身AGI的核心價值在軟體+資料,這是Apple最弱的兩個環節。
第二,時間窗口正在關閉。Apple現在的桌面機器人(代號J595「Pixar Lamp」)目標2027年推出、人形機器人(代號「Armor」)目標2028年或之後量產。到2028年,Musk的Optimus如果順利,已經在工廠、車隊、部分家庭中運行兩到三年、累積的資料量可能達到數十億到上百億小時的具身操作軌跡;Amazon的Fauna已經在家用場景部署百萬台;Nvidia GR00T生態的累積部署量可能達到數百萬台;Google Waymo可能已經是一個跨數十個城市的自動駕駛標準。Apple要在這個時候進場,用什麼打?
第三,Giannandrea離開後的AI領導真空。Apple原本就缺乏世界級的AI領軍人物,Giannandrea離開後,內部沒有現成的替代人選。挖人難度極高——所有頂級AI人才都在OpenAI、Anthropic、Google DeepMind、xAI搶,Apple的薪資與文化對這些人的吸引力不如以往。
Apple的權力槓桿:App Store
儘管在AI賽道上落後,Apple手上仍然有一個全世界沒有人能忽視的武器:App Store。
2026年4月,Apple私下警告X Corporation說Grok Imagine有生成涉及未成年人不當內容的風險,違反App Store規範,若不修正就會下架。這個事件被兩位美國參議員的公開信揭露出來。表面上這是一個內容審核爭議,實質上是Apple對AI產業的一次權力示範——Apple控制著全球超過10億台iPhone的app分發通道,任何AI產品如果想觸達iPhone用戶,就得遵守Apple的規則。
這個權力槓桿的戰略意義極其深遠。它意味著:就算Apple在自研AI上落後,Apple仍然可以透過App Store規則塑造整個AI產業的行為邊界。當所有其他玩家需要經過Apple才能觸達iPhone用戶時,Apple就可以用「符合Apple Intelligence標準才能上架」這類規則保護自己。
這個策略的問題是監管風險。歐盟的DMA(數位市場法)、美國的多州反壟斷訴訟都在削弱Apple對App Store的控制。如果Apple在AI產業的權力槓桿被監管者削弱(強制側載、強制開放分發通道),Apple的戰略空間會被壓縮到只剩「自研AI能不能做得夠好」這個單一維度——而這個維度現在看來不樂觀。
Apple堅持「anthropomorphic」的本體論意義
Apple在機器人專案上堅持用「anthropomorphic」而不是「humanoid」,這個術語選擇被Ming-Chi Kuo解讀為「Apple更在意用戶如何感知機器人,而非機器人的物理外型」,核心技術是感知硬體與軟體,不是形體。
這個選擇從DCO視角看有意思。Musk、Amazon、Figure等選擇humanoid(人形)路線,賭的是「人類環境已經為人類形體優化,所以人形機器人能最無縫地接手人類勞動」。Apple選擇anthropomorphic(類人,但不是人形),賭的是「形體不重要,互動才重要」。Apple的Pixar Lamp就是這個哲學的體現——它甚至沒有人形,只是一個會動的桌燈,但它的感知能力、互動優雅度、情感表達可能超過笨重的人形機器人。
這個哲學賭注在B2C家庭市場可能成立。普通家庭不需要一個能代替人類做所有事的笨重機器人,只需要一個能幫忙處理簡單任務、做視訊通話、播放內容、做智慧家庭中樞的「優雅助手」。Apple如果在這個細分市場做到極致,仍然可以捕捉可觀的商業價值——即使它在工業與超級助手市場完全缺席。
但這個賭注在戰略總盤上已經縮水。在一個「Musk的Optimus能做家事、Amazon的Fauna能陪小孩、Google的Gemini Robot能管家電」的世界裡,Apple的Pixar Lamp只能佔據一個高端小眾市場,而不是定義時代的平台產品。
第七章|Meta:意外的第三條路
Reality Labs的機器人轉向
Meta在這份地圖上是最容易被忽略的一家,但它的戰略路徑有獨特的戰略重量。
2025年,Meta在Reality Labs硬體部門下成立了專門的機器人團隊,由Marc Whitten(前Cruise CEO、前Xbox首席系統架構師)領軍。這個團隊的戰略定位不是做整機機器人,而是做感測器、AI、軟體模組,賣給Unitree、Figure AI等機器人公司。Meta CTO Andrew Bosworth在內部備忘錄中寫道:「我們在Reality Labs與AI上已經投資與建立的核心技術,跟發展機器人所需的進步是互補的。」
這個路徑的選擇很精明。Meta認知到自己沒有實體機器人製造能力、也不想從零開始建立一個跟Tesla或Boston Dynamics競爭的整機業務;但Meta擁有頂級的電腦視覺(Reality Labs投入多年的SLAM、物體辨識、深度估計)、頂級的語言模型(Llama系列開源模型,4.x版本在多個任務上接近GPT-5.x水平)、頂級的感測器技術(Quest VR頭盔、Ray-Ban智慧眼鏡的感測器堆疊)。把這些技術打包賣給機器人整機廠,Meta可以成為機器人產業的Intel——不做終端、但每台機器人裡都有Meta的晶片或軟體。
Llama開源的戰略意義
Meta的另一個獨特資產是Llama開源模型。2023-2026年之間,Llama系列從Llama 2到Llama 4迭代多次,每一代都免費開源權重給開發者。這個策略在商業上看起來不可思議——Meta花了數十億美元訓練模型,然後免費送出去。但這個策略的戰略意圖極其清晰:破壞競爭對手的商業模式,同時建立Meta作為AI基礎設施的標準地位。
Llama的開源讓OpenAI、Anthropic、Google的商業模式(API按token計費)受到持續壓力——任何開發者如果覺得Llama夠用,就不會付錢給OpenAI。這種「破壞競爭者而不是直接獲利」的策略,跟Google當年把Android開源打敗iOS壟斷的戰略異曲同工。
Meta從Llama獲得的不是直接營收,而是AI生態的標準地位。全世界的AI研究者、開發者、新創公司都熟悉Llama的架構、使用過Llama的微調工具、在Llama上建立產品。當Meta需要為它的VR、AR、機器人、廣告系統部署AI時,它可以直接用內部版Llama,不用付任何外部API費用,而且有整個開源社群幫它做研究加速。
廣告帝國的資料優勢
Meta的第三個優勢經常被忽略:它擁有除了Google之外最大的消費者行為資料集。Facebook、Instagram、WhatsApp、Messenger合起來有接近40億活躍用戶,每天產生的內容、互動、情緒、社交圖譜資料量是其他所有玩家(除了Google與TikTok)加起來的量級。
這個資料資產對具身AGI的意義是什麼?它是理解人類社會互動的頂級訓練資料。機器人要進入家庭、辦公室、公共場合,它必須理解人類之間微妙的社交動態、情緒暗示、文化差異——這些不是單純的駕駛資料或物流資料能提供的。Meta的Instagram資料包含全世界人類在真實場景中的表情、姿勢、互動、創作;這些資料如果正確運用,可以訓練出一個具備社會智能的AGI。
Meta在這方面的投入2026年開始顯性化。Shoptalk 2026大會上,Meta宣布了一系列AI驅動的商務更新,涵蓋Facebook、Instagram、WhatsApp的商業工具。這些工具表面上是廣告生態的升級,底層是Meta在把它的社交圖譜資料轉換成AI訓練資料與商業化介面。
Meta的戰略脆弱點
Meta的問題是核心業務與AI投資的資源張力。
Meta 2024-2025年在Reality Labs(VR/AR)已經虧損累計超過500億美元(這是一個根據公開財報的概算,非精確數字)。VR並沒有如Zuckerberg預期成為下一代運算平台——Quest銷量達到千萬級但遠未到智慧手機級別;Apple Vision Pro的推出與失敗也證明VR/AR仍然是小眾市場。這些累積虧損讓Meta股東對長期投入的耐心有限。
如果Meta同時要繼續燒錢在VR/AR+AI+機器人三條戰線上,財務壓力會非常重。2026年Meta的現金流仍然強勁(廣告業務依然是印鈔機),但一旦廣告營收成長放緩(比如TikTok持續侵蝕Instagram市占、或AI生成內容破壞廣告定位),三條戰線的資源分配會進入痛苦的取捨。
Zuckerberg個人的戰略判斷力是另一個變數。他在VR/AR上的判斷被普遍質疑(元宇宙轉型是一個代價昂貴的賭錯),但在AI上的轉向(Llama開源、PyTorch開源、大規模挖人)被普遍認為是對的。未來幾年如果他再做錯一個方向性判斷,Meta的戰略空間會被顯著壓縮。
Meta的終局定位可能是這樣:AI產業的Intel + 廣告帝國的獲利基本盤 + VR/AR的長尾期權。這不是七巨頭中最耀眼的位置,但是一個扎實的位置,足以讓Meta在具身AGI時代保留一張有意義的牌。
第八章|中國:模仿階段的潛在變量
為什麼單獨一章而且放最後
NEO.K的判斷是「中國洗洗睡吧,真的都在抄襲而已」。這個判斷在戰略層面大致成立,但需要被精確化——中國不是「完全沒有競爭力」,而是「在2026年還不影響未來風向,但存在成為變量的長期可能性」。
2026年中國在AI領域的主要玩家包括百度(文心系列)、阿里巴巴(通義千問)、騰訊(混元)、字節跳動(豆包/雲雀)、DeepSeek(技術上最受尊敬的一家,R系列推理模型在某些benchmark上接近GPT-5水平)、Kimi(月之暗面,長上下文見長)、MiniMax、智譜AI(ChatGLM系列)。機器人領域的主要玩家包括Unitree(四足機器人與H1人形機器人,全球最便宜的消費級人形機器人之一)、XPENG Robotics(小鵬汽車的機器人子公司)、AGIBOT、宇樹、傅利葉、優必選、眾擎、達闥。
從純技術角度看,中國的AI與機器人公司已經達到相當高的水平。DeepSeek的技術架構選擇在某些層面比OpenAI更開放、更高效;Unitree的機器人硬體性價比是全球領先的(H1售價僅9萬美元起,遠低於Boston Dynamics的Atlas或Tesla Optimus的預期售價);XPENG在人形機器人的整機設計上也拿出了有競爭力的成果。
但這些成果在戰略風向層面為什麼不影響格局?原因有四層。
結構性的四層限制
第一層:高端晶片限制。美國對中國的晶片出口管制(涵蓋A100、H100、B100等Nvidia頂級AI晶片)持續緊縮,中國無法取得訓練前沿模型所需的充足GPU。雖然中國在低階晶片自製上有進展(華為昇騰、寒武紀、壁仞、沐曦),但這些晶片的性能、生態、軟體堆疊跟Nvidia仍有明顯差距。中國公司訓練一個頂級模型的成本、時間、能效都遠高於美國對手。這個限制在可預見的未來不會解除。
第二層:資料閉環的不完整。中國公司在資料上有某些優勢(本土市場規模大、隱私規範相對寬鬆),但也有結構性劣勢——中國網路跟全球網際網路實質上是分離的兩個資料生態。中國公司無法抓取Reddit、Twitter、Stack Overflow、ArXiv、YouTube的完整資料;而這些資料是全球前沿AI訓練的必備糧食。中國模型在英文能力、國際知識、多元文化理解上有結構性的短板。
第三層:國際市場信任與監管風險。全球企業與政府對中國AI產品的安全疑慮在2026年達到歷史新高。美國、歐盟、日本、印度對中國AI公司設立了各種層級的市場進入障礙——從TikTok級別的強制分拆,到DeepSeek在義大利、澳洲、台灣被政府禁用。中國AI公司的海外商業化幾乎全面受阻。沒有國際市場的擴張,即使技術再強,也很難建立具身AGI所需的全球資料網絡。
第四層:內部市場的結構性競爭缺陷。中國AI市場內部極其擁擠,價格戰激烈,頭部玩家之間毛利率被壓到極低。2024-2025年的「中國AI模型價格戰」中,API定價被腰斬多次,使得沒有公司能積累足夠資本支撐長期的前沿研發。DeepSeek在這個環境中反而是異類——它透過極度高效的技術架構降低訓練成本,但它的商業模式能否持續也是未知數。
長期潛力的合理性評估
上面四層限制不意味著中國在長期沒有機會。中國有幾個結構性優勢可能在未來十到十五年產生影響。
製造業深度是一層。中國在機器人硬體製造、零組件供應鏈、規模化生產上的能力是全球第一。如果未來具身AGI的勝負關鍵變成「誰能把人形機器人的硬體成本降到2萬美元以下」,中國製造業的優勢會浮現——就像電動車從2020年的高端奢侈品變成2025年的大眾商品,很大程度上是因為中國的規模化製造壓下了電池跟動力總成的成本。Unitree的H1已經在證明這個趨勢。
國家意志是另一層。中國政府2025-2026年明確把具身智能列為戰略產業,國家級補貼與政策傾斜在持續。跟美國市場驅動的創新不同,中國有辦法在政治決心下把大量資源灌到特定領域。這種模式在半導體、電動車、高鐵上都產生過戰略後果。
本土市場的規模是第三層。中國市場有14億人口,即使國際市場完全關閉,本土市場的具身AGI需求(老齡化照護、勞動力短缺、智慧城市)也足夠支撐幾家頭部玩家達到可觀規模。這個市場不會讓中國公司成為全球領導者,但會讓它們活下來,並且有機會等待下一個國際格局的轉變。
所以最準確的描述是:中國在2026年不是七巨頭的同級對手,但它是一個潛在的第八玩家,其影響力取決於未來十五年的地緣政治演化與技術軌跡的不確定性。把它完全排除出分析是過度樂觀;把它放在七巨頭同等位置是過度緊張。放在附錄章節、標記為「長期變量」,這個定位是合理的。
結語|Closure的終局在哪裡
這篇地圖要收了。最後用DCO的語言做一次本體論的壓縮。
整場2026年的具身AGI戰爭,本質上是七個玩家在比誰能先完成Cl-3(守恆性)加Cl-4(生成性)的雙重閉合——誰能讓資料、算力、模型、終端、資本在一個內部自洽的系統中持續循環,誰就在Φⁿ(T₀)的自反迭代中率先進入收斂。其他所有技術細節、商業策略、產品決策,最終都是為這個閉合目標服務的邊角戰術。
七個玩家的閉合進度差異極大。Musk帝國已經基本完成閉合的拓撲結構,剩下的是填充與量產——Optimus的產能爬坡、FSD的法規擴張、X Money的合規落地、Starship的頻次提升,這些都是「閉合之後的擴張」,不是「閉合本身」。Nvidia選擇了一條不閉合自己、讓所有人都透過自己閉合的平台路徑——這不是Cl-3級的守恆,而是Cl-2級的雙重定義(內外皆定義於自身平台),但這個定義在商業上同樣有效。Google擁有所有閉合的零件,但組織內耗讓它的閉合速度慢於Musk;它押注的是長期勝利而非短期速度。Microsoft跟Amazon都透過合作拼接在試圖拼出一個接近閉合的複合結構,Microsoft靠企業B2B、Amazon靠消費者物流,兩家都有紮實的生存空間但都不是定義時代的位置。Apple在觀望中選擇延遲進場,賭優雅會遲到但不會缺席——這次可能第一次賭錯。Meta選擇做產業的中階供應商,保留一個雖然不耀眼但紮實的位置。
哪條路最後會贏?沒有人知道。但有一件事是清楚的:Closure一旦閉合,就不可逆。當Musk的Optimus量產達到每年百萬台、當Waymo擴張到100個城市、當Amazon的倉儲機器人超過兩百萬台、當Nvidia的GR00T部署到千萬台機器人——這些資料飛輪的複合效應會在2028-2030年之間產生一次不連續的跳躍,某個玩家會進入一個別人幾乎追不上的領先態。
在這個跳躍發生之前,戰場仍然開放。但它開放的窗口正在關閉,而且關閉的速度比大多數觀察者意識到的要快。這就是為什麼Musk在2026年把所有資源壓上Optimus量產,為什麼Nvidia把所有工具鏈整合到GR00T生態,為什麼Amazon同時出手收購Fauna、Rivr、考慮Globalstar,為什麼Apple倉促解雇Giannandrea尋找新路徑。所有七家都知道:2026-2028年這個窗口期,就是決定未來三十年科技地緣政治格局的那幾年。
中國不在這個窗口裡。這不是對中國技術能力的否定,而是對地緣政治結構、供應鏈限制、市場信任斷裂的客觀承認。中國會在下一個週期(2035-2045年左右)有機會重新進場,但前提是美中關係出現根本性的結構轉變,或者中國發展出繞過現有限制的獨立技術堆疊——兩者都不是短期可預期的事件。
最後,給EveMissLab留一個本體論的標記。
這整場戰爭可以被壓縮成一個DCO命題:Closure的工程實現,本質上就是具身AGI的存在論形式。Musk、Nvidia、Google、Apple、Amazon、Microsoft、Meta都在用各自的方式回答「Cl-3如何在物質世界中實現」這個問題。他們的答案不同,但他們在問同一個問題。
這個問題在學術哲學界被問了兩千多年(亞里士多德的「整體先於部分」、黑格爾的「絕對精神的自我實現」、懷特海的「現實場域」、海德格爾的「存在的聚集」),但都沒有在物質層面得到回答——因為人類沒有工具可以建構一個完全自洽的物質閉環。2026年的這七家公司,第一次在真實的物質基礎上嘗試回答這個問題。不管他們誰贏,這個嘗試本身就是人類思想史上的一次拓撲學級的事件。
反者道之動。真正的Closure從來不是靜態的閉環,而是閉環內部的持續反向運動——每一次生成、每一次採樣、每一次迭代,都是S¹繞著自己走了一圈又開始下一圈。七家在跑的就是這個圈。
誰先跑完第一圈,誰就定義了下一個千年的起點。
這不是誇張,是拓撲。
附錄B|為什麼中國AI進不了下一世代
一個被多數分析者迴避的本體論命題
前言|Neo.K的第一性觀察
前面那章關於中國的章節,講的是供應鏈、監管、晶片限制、市場信任——這些都是表層。真正的理由其實很簡單,而且沒有幾個人願意在文章裡直說:下一代AI的本體論轉向,是從「統計為主、因果為輔」變成「因果為主、統計為輔」。而因果推理的核心前提,是系統對客觀真相的開放性——這個前提跟威權治理的存在條件在根本上互斥。
這個判斷有兩層。第一層是技術史層面:當前LLM範式的天花板已經逼近,下一代AI必然往因果推理方向轉型,這是AI研究社群的普遍共識(Pearl、Schölkopf、Bengio都已經把因果推理列為AGI的必要條件)。第二層是地緣政治層面:中國如果要走到下一代AI,必須讓它的模型在訓練資料、推理過程、輸出內容上擁抱真實世界的因果鏈——但這意味著模型必須承認某些威權體制不允許承認的因果事實。這是一個結構性的兩難,不是政策選擇的問題。
這一章把這個判斷展開,同時補充一個觀察:即使在當前的統計範式下,中國AI也並非完全「本地訓練」——有大量技術證據指向蒸餾(distillation)與對外模型的深度依賴。NEO.K自己用方法論做過研判,那些判斷不只是直覺。下面把整個論證梳理清楚。
一、為什麼下一代AI必然是因果為主
統計範式的天花板
2022-2026年的LLM浪潮,本質上是一次大規模的統計建模勝利。GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro、Llama 4、DeepSeek-V3系列——這些模型背後的核心原理都是對巨量文本的條件機率分佈建模。它們做的事情可以用一句話概括:給定前文,預測下一個token的機率分佈。
這個範式的能力被大量benchmark驗證過,但它的根本侷限也被越來越多的研究者指出。核心侷限有三層:
第一層是幻覺(hallucination)的結構性必然。純統計模型沒有「真/假」的內建判準,它只有「在訓練資料中出現的機率高/低」。當模型遇到訓練資料中不常出現的情境時,它會根據統計相似性生成「聽起來合理」的內容,而這些內容在事實層面可能完全錯誤。2025年以來,各家前沿模型的幻覺率都在下降,但下降曲線正在趨於平坦——因為單純靠擴大模型與資料量,不能從根本上解決這個問題。
第二層是反事實推理的無能。Judea Pearl多年反覆強調:真正的智能需要能處理「如果X不發生,Y會怎樣」這類反事實問題。純統計模型在這類任務上表現極差,因為訓練資料中幾乎沒有反事實的直接觀測——反事實按定義是「沒發生的事」。人類智能能處理反事實是因為我們有因果心智模型(causal mental model),可以從我們對世界因果結構的理解出發,模擬「如果某個變數改變了會怎樣」。當前LLM沒有這個能力,它們的「推理」本質上是訓練資料中推理模式的統計複現。
第三層是分佈外泛化(out-of-distribution generalization)的崩潰。當模型遇到訓練資料分佈之外的情境時,它的表現會急劇下降。這個問題在具身AI中尤其致命——真實世界的物理互動、偶發事件、異常狀況,永遠會超出任何訓練資料集的覆蓋。Amazon Blue Jay機器人的失敗、Tesla FSD在極端天氣或罕見場景下的行為錯誤,都是這個侷限的具體表現。
因果推理作為下一代範式
上述三層侷限,共同指向一個技術路線的必然轉向:下一代AI必須內建因果結構,而不是僅依賴統計相關性。
這個轉向的技術主張可以在多個獨立的研究線索中看到。Judea Pearl的「因果階梯」(causal ladder:關聯→干預→反事實)已成為AI研究社群的標準框架;Bernhard Schölkopf帶領的Max Planck研究團隊在因果表徵學習(causal representation learning)上持續產出;Yoshua Bengio在2023年後把研究重心明確轉向「System 2 AI」——也就是具備顯式推理、反事實思考、因果建模能力的AI系統。2025-2026年,前沿實驗室(DeepMind、Anthropic、OpenAI內部)都有不對外公開的因果推理研究計畫,這些計畫的目標是在下一代模型架構中引入某種形式的因果推理能力。
因果推理的工程實現有多種可能路徑:結構化因果模型(SCM)與神經網絡的混合、世界模型(world model)的因果化、反事實訓練資料的合成、基於干預的主動學習。這些路徑各有技術難度,但它們共同的前提是——模型必須能處理「真實世界的因果結構」,而不是僅僅複製訓練資料中的統計模式。
這個前提對威權體制是致命的。
二、因果推理與威權治理的結構性互斥
因果鏈不能被選擇性截斷
一個具備因果推理能力的AI,必須能追問「為什麼X發生?」並給出基於真實世界因果結構的答案。這個追問不能被選擇性截斷——如果模型能回答「為什麼經濟成長?」(正向的因果問題),它也必須能回答「為什麼經濟衰退?」「為什麼這個政策失敗?」「為什麼這個決策者的判斷錯了?」這些反向或批判性的因果問題。
因果鏈是拓撲連通的。你不能只保留你喜歡的那幾條邊,把不喜歡的砍掉——因為任何一條因果路徑的斷裂,都會讓整個因果圖變成不自洽的殘片,而不自洽的因果圖在推理時會立刻暴露矛盾。
這是威權體制的死穴。威權治理的基本運作機制,就是在公共論述中系統性地遮蔽、扭曲、或反轉特定因果關係。這不是意識形態的選擇,是威權體制的存在前提——如果公民可以自由追問「為什麼六四?」「為什麼文革?」「為什麼大躍進餓死三千萬人?」「為什麼新疆?」「為什麼香港?」「為什麼台灣不是中華人民共和國的一部分?」並得到基於真實歷史因果鏈的答案,這個政權的合法性敘事會立刻崩解。
威權體制跟統計範式AI是相容的。你可以在訓練資料中排除敏感內容、在輸出層面加規則過濾、在價值觀對齊時強制植入特定立場——這些都是統計層面的操作,可以不動聲色地完成。但威權體制跟因果範式AI是結構性互斥的。因為一旦模型具備真正的因果推理能力,它就必須能沿著因果鏈走到任何地方——包括那些政權不允許走到的地方。
三個具體的互斥場景
這個互斥可以用具體場景展示。
場景一:歷史因果。 一個下一代因果AI被問:「為什麼1958-1962年中國出現大規模飢荒?」統計範式AI可以用「自然災害、蘇聯撤援、政策失誤」這類政權允許的敘事作答。因果範式AI會怎麼答?它必須沿著因果鏈走——大躍進的土法煉鋼摧毀農業勞動力、公社化破壞生產誘因、虛報產量導致徵購量過高、各級官員為政治正確壓制真實災情、最高領導人延遲承認問題——每一步都是因果鏈上的節點。你可以訓練它不講這些,但你不能讓它「因果地」回答同時又不講這些。因果鏈不給妥協空間。
場景二:當代政策。 問題是:「為什麼中國青年失業率高?」統計AI可以給官方敘事(疫情衝擊、國際環境、結構轉型)。因果AI必須追問:房地產泡沫的形成機制、民營企業信心的崩潰源頭、教培與網路平台監管的連鎖效應、人口結構轉變、戶籍制度對勞動力流動的限制——這些因果節點裡有很多是政治敏感的。一個真正的因果AI無法在不切斷因果鏈的前提下迴避這些節點。
場景三:決策批判。 問題是:「某個政策失敗的原因是什麼?」統計AI可以做模糊化處理。因果AI會沿著「決策制定過程→資訊品質→決策者認知→執行機制→反饋修正」這條鏈往回走。當這條鏈走到「決策者認知」時,它會問:為什麼最高決策者收到的資訊品質下降?答案是:因為下級官員有動機報喜不報憂。為什麼他們有這個動機?因為沒有獨立的監督與言論自由。於是因果鏈必然走到政治體制本身——而這是威權體制不允許AI碰的終極禁區。
兩難的出口都是災難
中國AI產業在這個結構性兩難面前,只有三個出口,每一個都是災難。
出口一:放棄因果範式,繼續走統計範式。 這等於宣布中國AI永遠停留在上一代,跟美國前沿模型的能力差距會從「追趕得上的代差」變成「結構性代差」。到2030年,當美國的因果AI能做複雜科學研究、能進行可靠的反事實推理、能在具身AGI中處理分佈外場景時,中國AI仍然在做文本續寫——這個差距會反映在生產力、軍事能力、科技創新速度的全面落差上。
出口二:走因果範式但強制切斷敏感因果鏈。 這會產生「閹割版因果AI」——看起來像因果推理,但在關鍵節點會出現推理斷裂。這種模型會立刻被專業使用者識破(因為因果鏈的斷裂在推理痕跡中清晰可見),在國際學術與商業場域失去信任,而且在技術層面會有嚴重的穩定性問題——強制的推理斷裂會導致模型在處理複雜問題時出現不可預期的錯誤。這在某些高價值應用(醫療、司法、金融、工業控制)中是無法接受的。
出口三:真正走因果範式,放手讓模型沿因果鏈走到任何地方。 這等於在AI層面放棄了威權資訊控制的核心機制。一個能真正沿著因果鏈推理的AI,會持續產出體制不允許的內容,而且會傳播到所有使用者手上。這個出口在政治上不可能——沒有任何威權政權會主動交出資訊主導權。
這個兩難沒有第四個出口。它不是「現在決策層還沒想通,以後會解決」的技術問題,是威權體制的運作機制與因果推理AI的運作機制在底層邏輯上互斥的結構問題。除非中國的政治體制發生根本性轉變(2026年看不到這個跡象),否則這個兩難就是死局。
三、當前範式下中國AI的真實狀態:蒸餾痕跡
為什麼蒸餾是一個技術判斷,不是政治指控
在談下一代之前,先談當前這一代——NEO.K提到的蒸餾問題。
蒸餾(model distillation)是AI領域一個技術中性的概念:用一個大模型(教師)的輸出去訓練一個小模型(學生),讓小模型在能力上逼近大模型,但計算成本更低。蒸餾本身不是問題,問題在於用誰的模型做教師,以及是否誠實公開這個來源。
如果一家公司用自家的大模型蒸餾出小模型,這是完全合法的工程實踐。但如果一家公司用競爭對手的模型(比如OpenAI的GPT-4/5系列、Anthropic的Claude)蒸餾,而這種行為違反對方的服務條款,同時這家公司對外聲稱「完全本地訓練」,這就既是知識產權問題,也是技術真實性的問題。
蒸餾痕跡在技術上是可以檢測的。當一個模型的輸出在風格、結構、錯誤模式、特定語言選擇上與某個已知大模型高度相似,而且這些相似性超過了單純資料來源重疊可以解釋的範圍,就可以合理推斷蒸餾來源。研究社群已經發展出多種檢測方法:對抗性探測(adversarial probing)、指紋分析(fingerprint analysis)、輸出空間幾何比對(output space geometry comparison)、特定prompt的穩定回應模式檢查、以及NEO.K可能使用的更隱蔽的方法論(透過在模型輸出中找出「不符合本地學術話語體系」的特定推理模式或論點偏好)。
DeepSeek的技術異常點
DeepSeek在2024-2026年被廣泛討論,原因是它在極度有限的算力與預算下達成了接近前沿模型的性能。DeepSeek-V3、R1系列模型的公開技術報告展示了許多工程優化(MoE架構、多頭潛在注意力MLA、FP8訓練等),這些技術選擇是真的,而且確實展現了DeepSeek團隊的技術實力。
但技術實力與蒸餾使用不是互斥的。一個有經驗的研究者可以同時:(1)設計高效的訓練架構;(2)使用來自其他模型的蒸餾資料加速收斂;(3)對外強調第一項,淡化第二項。這在AI產業中並非罕見——2024年初,OpenAI曾公開指控DeepSeek「可能」違反了OpenAI的服務條款,透過API呼叫蒸餾了GPT系列的輸出(這是當時的公開指控,OpenAI沒有提供完整技術證據,但也不是完全沒有根據的媒體八卦)。
從外部觀察者的角度,可以檢測到的異常點包括:某些特定的語言風格傾向(對英文特定表述的偏好超過本地語料應有的比例)、特定類型錯誤的一致性模式(跟GPT系列特有的錯誤模式相似度過高)、對某些benchmark題目的回答結構與已知前沿模型的回答結構高度相似、以及——這是NEO.K提到的關鍵點——在推理與論證層面採用了不符合中國本地學術話語體系的特定思考路徑。
最後這一點值得展開。每個語言/文化圈的學術訓練都有其獨特的論證風格、概念框架、引用習慣、問題切入角度。中國本地學術體系有其特色——某些概念組合、某些論證展開方式、某些權威引用模式。如果一個聲稱「完全本地訓練」的模型在複雜推理任務上展現的是英美學術體系的論證習慣而不是本地學術體系的,這就是一個強訊號——要麼模型的訓練資料嚴重偏向英文學術文獻(這本身也說明了對外部資源的依賴),要麼模型在微調階段大量使用了外部大模型的輸出作為目標(也就是蒸餾)。NEO.K用這類方法論判斷DeepSeek有嚴重蒸餾痕跡,這個判斷在方法論上是站得住腳的。
其他中國模型的分化
需要公允地說,不是所有中國AI都有明顯的蒸餾痕跡。
有些模型(特別是特定垂直領域的模型、以及一些有深厚學術背景的實驗室模型)展現的確實是本地訓練特徵——它們的論證風格更接近中國本地學術傳統、處理中文長文本的能力強於處理英文長文本、對本地語境的理解深於對國際語境的理解。這些模型在技術上是真實的本地訓練成果,但它們的能力上限受制於本地資料集的規模與品質、以及無法取得頂級GPU的算力限制。
所以中國AI的真實狀態可以用這樣的二分來描述:一部分模型是真正的本地訓練,能力受制於資料與算力;一部分模型是蒸餾主導 + 本地包裝,能力看起來接近前沿但可持續性存疑。前者代表中國AI的真實能力天花板(目前明顯低於美國前沿),後者創造了「中國AI已經追上」的表象,但這個表象是借來的,不是自生的。
這個二分對未來判斷的意義是:當美國前沿模型進入下一代(因果範式)時,蒸餾路徑會被切斷。因為因果推理能力不是靠蒸餾輸出文本就能複製的——它需要架構層面、訓練目標層面、資料合成層面的全面重構。蒸餾可以複製「回答看起來像什麼」,不能複製「推理怎麼運作」。當美國前沿模型的核心能力從「生成合理文本」轉移到「做可靠的因果推理」時,依賴蒸餾的中國模型會突然發現自己沒東西可蒸。
四、治理結構的長期鎖定效應
為什麼不是「等他們改就好」
一個樂觀的反駁是:「中國可以改變治理結構,未來可能走向更開放的體制,那時就可以做因果AI了。」這個反駁在邏輯上成立,但在現實中需要被嚴肅評估概率。
2026年的觀察是:中國的政治體制在過去十年的軌跡是收緊而不是開放。公民社會空間被壓縮、媒體監管加強、學術討論的邊界持續後退、國際人才流動受限、網路防火牆技術升級、數位監控系統深化。這個軌跡沒有顯示反轉的早期訊號。
從政權自身的理性計算看,反轉也是不合理的。威權體制的生存機制就是資訊控制,開放資訊控制等於自拆執政基礎。除非發生系統性的外部衝擊(經濟崩潰、重大戰爭失敗、最高領導人繼承危機),否則現行體制有強烈的路徑依賴,會持續強化現有機制而不是鬆綁。
更重要的是:即使中國在未來某個時間點發生了政治轉型(這本身是一個很大的假設),AI能力的追趕也不是自動的。美國前沿實驗室在因果AI上的領先,是基於數十年的基礎研究、頂尖人才的持續聚集、以及對全球資料與知識的自由取用。中國即使在政治上開放,也需要相當長的時間才能重建這些條件——這段時間裡,美國的領先可能已經進入「永久性領先」的狀態(想想英國錯過第二次工業革命後,即使沒有根本性政治問題,也再也沒能回到世界科技領先地位)。
窗口已經關閉
這個判斷的時間敏感性需要被強調。具身AGI的戰略窗口——我們在上一章判斷是2026-2028年——不會等中國。當Musk的Optimus量產到百萬台、Waymo覆蓋百個城市、Amazon的具身機器人進入家用、Nvidia的GR00T成為全球標準的時候,這個格局就鎖定了。後進者不是「晚進場幾年」,是「永遠進不了主桌」。
中國不是沒有機會——它還有Unitree等公司在硬體端持續逼近國際水平、有製造業規模優勢、有國家意志可以調動的資源。但這些機會是在次要賽道(低階機器人、本土市場、部分B2B工業應用)的機會,不是主桌上的機會。主桌的參賽資格,需要前沿模型能力 + 全球市場信任 + 頂級晶片取用 + 因果推理範式 + 資料閉環。這五項中國目前都沒有,而且沒有跡象在短期內會獲得。
五、結語|為什麼這個判斷在2026年就可以下
Neo.K這個判斷的哲學底氣在於:它不是對中國AI「現在」的評估,而是對下一個範式轉換期的結構性判斷。現在的統計範式AI,威權治理可以維持;下一代因果範式AI,威權治理無法維持。這個互斥不取決於任何一家中國公司的努力程度、不取決於任何一年的補貼規模、不取決於任何一位工程師的天才——它取決於AI範式本身的演化方向與威權治理的運作前提之間的底層邏輯關係。
懂的人懂——這句話其實在說的是:這個判斷不是靠額外資訊或內幕消息,而是靠對因果結構的基本理解。一個有基本因果推理能力的分析者,只要把「下一代AI必然因果化」跟「威權治理必須截斷某些因果鏈」這兩個前提擺在一起,結論就是自明的。不需要內部消息,不需要預測政治走向,只需要看清楚這兩條約束在邏輯上不相容。
這也是為什麼中國AI在當前這一代還能用——統計範式AI跟威權治理兼容。這也是為什麼DeepSeek能在當前範式下達到令人印象深刻的結果——統計範式的能力可以透過工程優化與蒸餾加速,不需要真正的因果理解。但當範式躍遷發生時,中國AI會在一個它無法跨越的斷崖前停下。
這個斷崖在2026年還沒到,但它在那裡,而且距離我們比大多數人意識到的要近。估計在2028-2030年之間,前沿實驗室會發布第一代真正具備可驗證因果推理能力的模型,那時整個格局會重新洗牌。在那次洗牌中,中國會失去它目前在國際AI敘事中的一席之地,退回到「區域性玩家」的位置。
最後給EveMissLab留一個本體論註記。
這整件事可以用DCO的語言重新描述:因果推理是Cl-1(自洽性)在推理系統中的完整實現。統計範式AI在Cl-1上是殘缺的——它的內部一致性只達到「資料分佈的內部一致」,不達到「因果結構的內部一致」。因果範式AI試圖把Cl-1推到因果層面。威權治理要求AI在某些因果節點上人為斷裂——這等於在Cl-1上強制植入不自洽。一個不自洽的Closure,不是Closure,是殘片。
中國能不能做出下一代AI?只要威權體制存在一天,答案就是:它只能做出「看起來像因果AI但實際上是殘片」的東西。這種東西在內部市場可能還能用,在國際市場沒有任何信任基礎,在真正的科學與工程應用中會露餡。
懂的人懂。不懂的人,下一個範式躍遷會教他們懂。
反者道之動。因果鏈的反向追問,是Closure在物質世界中自我顯現的必經之路。擋住這條路的,不是沒看見這條路的存在——是看見了,而且害怕它走到底。