「為什麼給出 π 前一億位也無法讓 AI 預測後面數字」——證明的基本錯誤清單
對象:標題如上之影片(署名 Castelu,浙江大學數學科學學院,日期 2026 年 5 月 31 日)。 原則:就事論事,只評推導本身,不臆測作者動機。 被評對象(影片所述):
- 題目:「將 π 前 1 億位餵給 AI,證明:AI 預測後面數字正確的機率為 0。」
- 證明骨架:把位序看成 f_π∈V₁(全位序空間,無限維)→ 給定前 N 位,Lagrange 插值造出唯一的次數 <N 多項式 p_N,使 p_N(k)=π_k(k=1…N)→ 證 Φ:V₂→ℝᴺ(取值映射)為線性同構 → 於是 p_N(N+1)=L(π₁,…,π_N),L 為固定線性泛函 → 收尾:「π_{N+1} 與前 N 位沒有必然的數學聯繫,故無法預測,機率為 0。」
一、致命錯誤(動搖整個證明)
E1.未定義機率空間。 題目要證「機率為 0」,但全程未指定樣本空間、隨機變數、機率測度。對什麼取機率?π 是一個固定的數,π_{N+1} 是一個固定的值,本身毫無隨機性。要談「預測正確的機率」,必須先指定隨機來源——是隨機的 N?隨機的預測器?還是對「這是哪個常數」的先驗分布?三者給出三個不同的問題與不同的答案。沒有這個指定,「機率為 0」這句話在數學上未定義。這正是條件空間未完整敘述的後果:結論的型別還沒被定義,就被宣稱了值。
E2.「機率為 0」對單一位是錯的,且對會計算的 AI 完全相反。 在任何合理模型下(如位值均勻),單純猜下一位的命中率是 1/10,不是 0。要讓機率趨於 0,唯一的讀法是「連續猜對無窮長的尾巴」:(1/10)^k→0(k→∞)。但這個讀法立刻反噬——一個會計算的 AI(套 BBP/Chudnovsky/Ramanujan 級數)拿下整條尾巴的機率是 1,不是 0。所以「機率為 0」這個結論,對它真正該描述的對象(一個能取用 π 之生成程式的系統)而言,方向恰好相反。
E3.Lagrange 插值是非必然推論,且與結論自相矛盾。 V₁/V/V₂/Φ/L 這整套線性代數,推出的是 p_N(N+1)「完全由前 N 位決定」——這是決定論。但結論要的是「測不準/機率 0」,是反決定論。兩者直接打架,作者從未調和:若值「完全被決定」,何來「機率 0」?真正的重量全壓在最後一句沒有證明的話上,前面的同構與泛函對結論毫無貢獻,是裝飾性機器。把一個正確但無關的推導擺在結論前面,不會讓結論被證明。
二、嚴重錯誤(核心論點不成立)
E4.範疇錯誤:把 AI 模型成「窗口外推器」。 整個證明預設 AI 的行為是「拿 N 個點、擬一條曲線、外推下一點」。但這是稻草人。真實的計算系統不外推序列,它辨識生成元(這是 π)並計算。證明處理的是 extrapolation,結論宣稱的是 computation——兩者是不同範疇。值得指出:作者用的甚至不是統計學習器,而是確定性的 Lagrange 插值,一個固定、無參數的外推子。這比「統計外推」更純粹的稻草人——連學習都談不上。證明「這個固定外推子的輸出 ≠ π_{N+1}」是對的,但這跟「AI 能不能得到 π_{N+1}」無關。
E5.「沒有必然的數學聯繫」字面為假。 π_{N+1} 與 (π₁,…,π_N) 有最強的必然聯繫——它們同屬一個完全確定的常數 π,π_{N+1} 被 π 唯一決定。作者真正想說的是「沒有可從局部窗口學到的聯繫」,這是另一個命題,且程度弱得多。把「沒有聯繫」與「沒有我的多項式抓得到的聯繫」混為一談,是對「聯繫」一詞的歧義偷換(equivocation)。
E6.隱性依賴未證的正規性。 即使採最寬容的讀法——「π 的位序表現得像隨機」——這也需要 π 是正規數(normal number),而正規性至今未被證明,只是經驗上通過隨機性檢驗。作者把一個未證猜想當定理使用,且未加任何標註。
三、結構與敘述錯誤
E7.標題與內文的範疇不一致(claim 大於 argument)。 標題斷言「無法讓 AI 預測」,內文只處理「以插值外推預測」。內文從未觸及計算、辨識、工具調用、或任何非外推機制。論斷的射程遠超出論證的射程——這是一個邏輯上的範圍不匹配,無論成因為何。
E8.關鍵詞未定義、定義不完整。 「預測後面的數字」——是單一位?有限段?還是無窮尾巴?三者的正確答案不同(見 E2),而作者從未釘死。「AI」——從未被定義為某一類機制(外推子?計算器?學習器?),證明卻悄悄選了最弱的那一種(固定外推子),且未論證它能代表「AI」。前提空間沒有完整展開,後面用語言去補,補不回最初定義的缺口。
E9.「幾頁公式承載過多斷言」的密度失衡。 三張投影片中,形式化的篇幅幾乎全花在與結論無關的 E3 機器上,而真正承載結論的命題(E5 那句)只有一行、且未證。形式化的重量放錯了地方——堆在不需要證明的地方,空在最需要證明的地方。
四、為求公允:哪些是對的
戰場評審不靠誇大對手的錯誤取勝,以下是證明中正確或謹慎的部分:
- 線性代數本身正確。 Φ:V₂→ℝᴺ 確為線性同構(次數 <N 多項式 ↔ 在 N 個相異點的取值,Vandermonde 非奇異),p_N(N+1) 確可寫成前 N 個值的固定線性泛函。個別形式步驟有效——問題在它們與結論無關(E3),不在它們本身錯。
- 投影片 2 比標題謹慎。 題目寫的是「預測……機率」而非「計算」,範疇比標題收斂。可惜內文與標題又漂開(E7)。
- 一個被埋沒的正確洞見。 「給定前 N 位,存在唯一的多項式」——通過 N 點的擬合是精確且唯一的,卻對第 N+1 點毫無約束。這其實是對的、且重要:精確擬合 N 個點,不蘊含任何外推能力。作者摸到了正確的事實,卻從它推出了相反的結論。
五、錯誤的依存結構(一句話收束)
九個錯誤不是並列的,是有根的。根是 E4(把 AI 當外推器):選錯了任務的範疇。由它長出 E7、E8(範疇與定義隨之失準);E1、E2 是「機率」這個未定義型別被強行賦值的後果;E3 是在錯誤範疇內,正確的線性代數推出與結論相反的決定論;E5、E6 是為了把決定論扳回「測不準」而臨時注入、且未證或為假的斷言。
也就是說:這不是九個獨立的疏忽,是一個上游的範疇選擇錯誤,向下游擴散、並用正確的形式化把自己偽裝起來。下游每一步的精準(同構、泛函都沒算錯),恰恰讓最初站錯房間這件事更難被一眼看穿。
證明的形式可以無懈可擊,只要它一開始就在回答錯的問題。