過去三年,企業 AI 的主導敘事一直是技術敘事:誰的模型最聰明、誰的上下文視窗最長、誰的代理協調最順。四月由史丹佛 Digital Economy Lab 發表的《The Enterprise AI Playbook》——Elisa Pereira、Alvin Wang Graylin、Erik Brynjolfsson 三人針對 41 家組織、9 個產業、51 個成功部署所做的研究——悄悄把這套敘事炸開了。
研究最醒目的發現,幾乎直白到有些失禮:95% 的企業 AI 失敗,可以追溯到組織因素,而不是技術因素。人員尚未準備好、缺乏治理、主管沒有真的扛起責任、流程重新設計從來沒有真的發生。模型,幾乎從來不是那個真正的問題。
那個沒人在討論的 77%
研究指出,企業在 AI 部署過程中遇到最棘手的挑戰,有超過 77% 是「無形的」——變革管理、資料品質、跨團隊協調、流程重新設計。至於技術本身,受訪者的描述一致是「最容易的那一部分」。
這和多數企業現在的 AI 預算配置完全相反。如果你看一份典型的 2026 年財星 500 大 AI 支出表,會看到幾百萬美金流向模型授權、GPU 容量、平台訂閱與 PoC 整合——至於組織變革,幾乎只剩下個「四捨五入誤差」的位置。史丹佛的資料告訴你,這個比例,和價值真正被創造或被摧毀的地方,大致完全相反。
兩家公司買了同一套 AI 平台、鎖定同一個使用情境,最後可以走到完全不同的位置。一家在幾週內看到 71% 的生產力提升,另一家則是開了六個月的會、PoC 永遠上不了線、高階主管默默把那張投影片從下一季董事會上撤掉。同一個模型,同一家供應商,同一項任務。差別,永遠在圍繞它的組織。
自主性紅利
史丹佛研究中最挑釁的一個數字是:當代理式 AI 自主處理 80% 以上的工作量、人類只審查例外情況時,生產力提升的中位數是 71%。但當每一個 AI 輸出都需要完整人類審批時,生產力提升的中位數只剩下 30%。
請再讀一次:自主性,讓 AI 的回報多出一倍以上。
但自主性,恰恰是大多數組織在結構上無法允許的。審批鏈、稽核要求、合規審查、變更顧問委員會,全都預設人類是最後的決策者。真正把「必須有人審核的高風險決策」與「人類審核反而成為瓶頸而非保護的高頻低風險決策」分開來處理的企業,極少。結果就是:代理式 AI 被部署了,但被戴著口罩,組織最後捕捉到的價值不到理論上限的一半。
有趣的是,這 51 個案例中,代理式部署只占 20%。也就是說,大多數企業仍在為一種「結構上無法回報你」的 AI 形態大量付費。真正在重寫審批架構——而不只是重寫技術架構——的公司,正在經濟效益上把競爭對手拋在後面。
失敗是課綱
這是我想最久的一個發現:超過 61% 的成功 AI 專案,前面都至少有一次失敗的嘗試。那次失敗是必要的。沒有它,組織不可能誠實理解哪些流程需要重新設計、哪些資料來源其實早就壞了、哪些利害關係人會抗拒變革。
讓人不太舒服的推論是:現在正在跑第一次 AI PoC 的公司,統計上有很高機率會失敗——而這次失敗並不是浪費,是學費。把第一次失敗當成「該放棄 AI 的訊號」的公司,會看到那些把第一次失敗當成「該把目光轉回自己內部的訊號」的競爭對手,從此永遠把自己拉開。
我的觀點
史丹佛這份 playbook 發布的此刻,幾乎每一場董事會上關於 AI 的討論,依然被供應商 pitch、模型比較與能力展示所主宰。這種框架,到了今天已經有些危險。它讓領導者「買東西」就以為自己在認真做 AI,然而真正該做的事情在內部。
2026 年能真正捕捉到 AI 紅利的公司,會同時在做三件非常不光鮮的事。第一,用外部顧問般的誠實審視自家流程。第二,快速交付夠多的小型失敗,好真實知道自己組織不擅長什麼。第三,重寫審批與治理流程,讓 AI 自主性在結構上成為可能,而不是政治上不可能。
這三件事沒有一件涉及新模型的發布。這三件事都涉及高階主管覺得煩的會議。這就是為什麼 95% 的 AI 失敗是組織性的——技術已經準備好了,多數組織還沒,而且差距還在拉大。