MS&E435系列④：企業 AI 卡住，不是因為模型不夠強：Ali Ghodsi 拆開「context」這道牆

Ali Ghodsi 一開口，就先叫大家冷靜。

不是那種客套的冷靜，而是很直接的「你們不要被 Twitter 上每天的新恐慌牽著走」。在 Stanford MS&E435 第四堂課裡，Apoorv Agrawal 問他：現在 AI 變化這麼快，XAI、Cursor、OpenAI、Anthropic 都在打，Databricks 也從資料公司、lakehouse 公司，變成 AI 公司。你看到的 state of the union 是什麼？

Ali 的答案很反直覺：別太焦慮。超級智慧的敘事被講得太神話了。大家一直移動 AGI 的定義，但如果你問「現在最強模型是否已經比很多你日常互動的人更聰明」，很多人其實會承認答案是 yes。

所以他說：我們已經有 AGI。

但下一句才是整堂課的重點。

如果 AGI 已經存在，為什麼企業裡還沒有到處都是 agent coworker？為什麼公司內部沒有突然變成自動化天堂？為什麼大家做了很多 POC，最後仍然看不到明確生產力？為什麼大型企業的日常工作，看起來還是像《Office Space》那種舊世界：人類搬報表、開會、查資料、問那個「什麼都知道」的 John 或 Jane？

Ali 的答案不是「模型還不夠聰明」。

他的答案是：模型缺 context。

AI jagged frontier

真正的瓶頸不是智慧，是組織記憶

Ali 說，每家公司裡都有一個人，大家遇到問題就說：「去問 John」或「去問 Jane」。那個人可能待了 10 年、20 年、30 年。他知道流程怎麼走，知道例外怎麼處理，知道誰可以批准，知道某個客戶過去發生過什麼，知道系統資料哪裡不乾淨，也知道文件裡沒寫但大家默認的規則。

這些東西就是企業的 context。

今天的模型沒有這些 context。它可能會寫程式，會解數學，會讀文件，會生成報告。但如果它不知道公司真正如何運作，它就會犯很多蠢錯。不是因為模型笨，而是因為它像一個非常聰明、但剛入職第一天的人。你把他丟進公司裡，沒有 onboarding，沒有內部知識，沒有流程脈絡，沒有權限與工具，他當然做不好。

這也是 Ali 對 enterprise AI 的核心判斷：如果你想在世界上創造影響力，就想辦法把組織裡的 context 放進 AI。不是再做一個更炫的聊天框，也不是再買一個模型 API，而是把公司多年累積的流程、資料、判斷、權限和例外處理方式，變成 agent 能讀、能用、能行動的結構。

這句話把企業 AI 的問題從「AI 能不能」改成「組織願不願意重構自己」。

你可以把它想成這樣：模型是大腦，但企業流程是身體。現在很多公司買了一顆很強的大腦，卻沒有神經、手、腳、眼睛和肌肉。大腦再強，也只能在會議室裡回答問題，不能真正把事情做完。

為什麼 POC 會失敗：因為大家把電動馬達塞進舊工廠

Ali 用一個歷史類比解釋這件事。他提到 Paul David 的經典文章〈The Dynamo and the Computer〉。

電力剛出現時，工廠沒有立刻變得更有效率。很多工廠只是把蒸汽引擎換成電動馬達，但仍然沿用舊的 line shaft 結構：一根主軸帶動整棟工廠的皮帶和機器。結果生產力沒有大幅上升。

真正的生產力提升，是後來大家重新設計工廠。既然電力可以分散供應，工廠就不用擠在城市裡，不用圍繞一根主軸設計，不同生產線也能用不同速度運轉。電力的價值不是「替換蒸汽引擎」而已，而是讓工廠 layout 被重新想像。

PC 也一樣。Solow 那句名言大意是：電腦到處都看得到，唯獨生產力統計裡看不到。原因不是電腦沒用，而是很多公司一開始只是把 PC 當打字機。打完列印出來，放進資料夾，再找人分類。工作流程沒有變，工具再新也只是比較貴的打字機。

Ali 說，AI 正在重演這件事。

很多企業把 AI 插進舊流程裡，期待生產力突然暴增。客服流程沒改，權限沒改，資料沒整理，測試方式沒改，審批流程沒改，然後問為什麼 agent 不好用。這就像把電動馬達裝進蒸汽工廠，再抱怨電力沒有帶來革命。

企業 AI 的關鍵不是「把 AI 加到現有流程」。關鍵是問：如果一開始就有 AI，我們會怎麼設計這家公司？

這句話聽起來很大，但 Ali 用 Databricks 自己的 connector 團隊講了一個很小、很具體的例子。

Databricks 的 connector 例子：兩天寫出 toy，九個月才叫 production

Databricks 會替客戶連接 Salesforce、Workday、NetSuite 等系統，把資料整合到平台裡，再做分析和 AI。過去，Databricks 建一個 production-grade connector 大約要三個 quarter，也就是九個月。

Ali 自己用 LLM 試了一下，覺得兩天就能寫出一個 connector。於是他去問團隊：為什麼你們要九個月？

團隊回去分析，最初的答案是：AI 可以幫忙，但大概只能省一個半月。九個月變七個半月。原因也很合理：Ali 兩天寫出的是 toy，不是 production code。真正上線要安全、穩定、支援客戶回饋、處理例外、測試不同系統、文件化、維護，這些都不是模型一口氣寫完就算數。

但故事沒有停在這裡。Ali 又找了一位更 first-principles 的同事重新看流程。那位同事發現，瓶頸不是 coding 本身，而是整個工作流程。

第一個 quarter 被產品需求卡住。高薪、聰明的 PM 會去拜訪客戶，收集需求，最後寫出 60 到 80 頁規格文件。這件事不能靠更快寫程式解決，因為程式還沒開始寫。

第二個瓶頸是測試環境。要測 connector，就要架 Salesforce、Workday、NetSuite 等外部系統。這些不是 Databricks 自己的產品，團隊不熟，準備環境很慢。

第三個瓶頸是 bus factor。每個 connector 只有一個人負責。那個人請假、生病、卡住，整個專案就停。

最後他們不是換模型，而是換流程。需求收斂從一季縮到一週，先快速寫下目前知道的東西。因為 AI 讓重寫成本變低，錯了可以更快改。外部測試環境交給更擅長的供應商處理，用錢換時間。人力配置從一人一個 connector，改成七個人共同做七個 connector，降低單點風險。

結果：一個 quarter 做出七個 connector。

這段最有價值的是 Ali 的結論：這件事和 GPT-7、Opus 6 或更強模型沒有太大關係。真正的改善來自 human refactoring 和 process change。

翻譯成白話：AI 讓寫程式變快，但公司如果還用舊方式收需求、測試、分工和審批，速度仍然會卡在舊流程上。

軟體沒有死，但 UI 護城河正在塌

Apoorv 接著問一個資本市場很關心的問題：software is dead 嗎？

Ali 的回答很乾脆：如果所有軟體都死了，那 OpenAI、Anthropic、NVIDIA 也死了。OpenAI 和 Anthropic 本質上也是一群研究員和工程師寫軟體。NVIDIA 的晶片設計也高度依賴軟體。說「軟體死了」太粗糙。

但他也承認，軟體市場確實變了。兩件事同時發生。

Software revenue multiples at all-time lows

第一，進入門檻下降。AI 讓寫軟體變得更便宜、更快。過去需要一整個工程團隊才能做的東西，現在小團隊可以更快做出原型。這會讓競爭變多。

第二，切換成本下降。過去軟體的 moat 很大一部分來自 UI 習慣。人們學會 Salesforce、SAP、ServiceNow、某套 CRM 或財務系統後，就不想換。換系統不只是資料搬移，也是重新訓練人。

但如果未來你主要是對 agent 說話，UI 的差異會變得不重要。你不需要知道 Salesforce 的按鈕在哪裡，也不需要學 Outlook 或 Gmail 的細節。你只要說你要什麼，agent 去操作底層系統。這會削弱很多 SaaS 公司長期累積的 UI moat。

TechCrunch 今年對 Ali 的訪談也延伸了這點：SaaS systems of record 不會立刻被拔掉，因為資料和核心流程很難搬。但自然語言介面會讓產品變得像水管。使用者不再花多年訓練自己成為某個介面的專家，agent 可以跨系統操作。

所以軟體不是死。死的是只靠舊介面和舊工作流活著的軟體。

真正安全的軟體公司有其他 moat：專有資料、規模經濟、品牌、信任、安全認證、深度流程整合、客戶關係。Ali 引用 Hamilton Helmer 的《7 Powers》脈絡：護城河不是只有程式碼。程式碼變便宜後，其他力量反而更重要。

企業 AI 哪裡有效？先看 context 是否進得去

Apoorv 問 Ali：你們有 20,000 多個客戶，這是觀察企業 AI 的好樣本。哪些地方 AI 正在打全壘打？哪些地方還很粗糙？

Ali 先說：這不是 AI 的錯。

大多數公司現在只是讓 AI 幫某些任務，不是真的把 agent 放進核心流程。支援客服就是好例子。很多人以為 support 會最先被 AI 吃掉，因為客服看起來像問答。但 Ali 說，support 其實很難，尤其是 Databricks 這種高技術產品。

客戶打給 support，不是因為他們不知道按哪個按鈕。通常是機器學習模型 F1 score 不對、資料流程卡住、平台配置有奇怪問題。這些客戶本身就是高薪、受過訓練的技術人員。他們已經試過很多方法才來求助。這時客服不是 FAQ，而是專家診斷。

如果 AI 有 Databricks support engineer 的完整 context，也許能做。但現在多數模型沒有。它不知道這個客戶的設定，不知道過去 ticket，不知道內部 workaround，不知道某個版本的 bug，也不知道公司裡某位老員工腦中的暗知識。

這和 OfficeQA Pro 的研究結果呼應。那個 benchmark 測的是企業文件上的 grounded reasoning。結果顯示，前沿模型只靠自身知識或 web 表現很差，就算直接給文件 corpus，仍有大量問題解不好；把文件轉成更結構化的 representation，平均表現才明顯改善。這不是模型完全沒能力，而是 enterprise context 的格式、結構、檢索、權限、推理鏈都還沒準備好。

企業 AI 的下一階段，不是把所有文件丟進向量資料庫就結束。它要把資料變成 agent 能可靠使用的工作記憶。

為什麼 governance 和 evaluation 不是合規廢話

Databricks 2026 State of AI Agents 的外部整理提到幾個數字：報告基於超過 20,000 個組織的匿名資料，其中包含超過 60% 的 Fortune 500。多 agent workflow 在四個月內成長 327%。77% 客戶使用兩個以上模型家族。使用 AI governance 的企業，把 AI 專案推進 production 的數量是其他企業的 12 倍；使用 evaluation tools 的企業，production 專案數是 6 倍。

這些數字很適合放進 Ali 的框架裡理解。

企業不是缺 demo。企業缺的是能上 production 的系統。Demo 可以很酷，production 要回答很多無聊問題：誰能看什麼資料？模型錯了誰負責？輸出怎麼測？資料 lineage 怎麼追？agent 能不能執行動作？執行前需不需要 approval？怎麼 rollback？敏感資料會不會外洩？

所以 governance 和 evaluation 不是法務部門拖慢創新的東西。它們是 enterprise AI 真正能跑起來的基礎設施。

這也是 Databricks 和 OpenAI 合作 Agent Bricks 的意義。外部公告說，OpenAI 模型會原生進入 Databricks Data Intelligence Platform 和 Agent Bricks，讓企業在受治理的資料上建置、評估、擴張 AI apps 和 agents。這件事的商業邏輯很清楚：模型要進企業，不能只靠聊天框。它要進到資料、權限、治理、MLOps 和 workflow 已經存在的地方。

誰能把模型接到企業資料和流程，誰就比單純提供模型 API 更靠近價值。

價值會往上移：模型層像雲，應用層才可能出現怪物公司

Apoorv 問 Ali，如果把 $100 投在 AI stack 的不同層：energy、chips、infra、model、apps，長期看你會押哪裡？

AI five-layer cake

Ali 說，應用層會贏。

他的理由來自網路時代的經驗。早期大家以為最難、最重要的是 networking。Ali 自己博士時代就在做 multicast。當時很多聰明人都覺得，未來全世界會同時看直播、看球賽，如何高效把同一份資料送給很多人，是網路最重要的問題。結果光纖部署太多，頻寬成本暴跌，multicast 變成沒人記得的問題。

真正的大公司反而長在奇怪的應用上：賣書的 Amazon、叫車的 Uber、出租房間的 Airbnb、發短文字的 Twitter。如果你在 2002 年用白話描述這些點子，很多人會覺得很蠢。但它們才是真正吃掉價值的應用。

Ali 認為 AI 也會如此。今天大家盯著 NVIDIA、OpenAI、Anthropic、DeepMind、chips、frontier models。這些當然重要，但長期最大公司可能出現在大家現在覺得無聊或困難的應用場景。

他點名兩個：healthcare 和 education。

Healthcare 約占美國 GDP 的 17% 到 18%。人們對健康和家人生命的付費意願很高，而現有體驗並不好。如果有一家公司真的看過上億病人的資料，理解你的基因、病史、風險、治療反應，能給你更好的照護，那可能是兆美元公司。

Education 在 VC 圈長期被視為難投資、難變現。但 Ali 反過來看：大家都有孩子，也在意孩子學什麼、怎麼學、是否具備未來能力。教育甚至能影響選舉和文化戰。如果 AI 能真的提供更好的教育成果，這個市場不該被低估。

他的判斷是，模型層會有價值，但會越來越像 cloud 或 token factory。規模很大，玩家不多，毛利和營業利益率會被競爭壓低。開源模型也會持續施壓。真正的厚價值，會往應用、資料、流程和使用者結果移動。

Software vs AI economics

給學生的建議：不要追 multicast

課尾 Ali 給學生的建議很簡單：不要被恐懼牽著走，不要只追今天最吵的題目。

他回憶自己博士時代也曾焦慮。網路正在改變世界，大家都覺得 multicast 是最重要問題。結果那不是問題。Airbnb 也不是因為 2009 年突然有了什麼 2001 年沒有的技術才成立。只是 Brian Chesky 遇到一個真實痛點，想到一個好點子。

好點子很難。人類其實很不擅長想好點子。

所以 Ali 建議學生要拉長時間尺度。像 Bezos 當年在華爾街看到網路是 secular trend，沒有一開始就做很炫的事情，而是從最無聊的書開始。書是標準品，容易上網賣，逐年押對大方向，最後才變成 everything store。

這對 AI 時代的創業者很有提醒。今天最吵的是模型、晶片、agent benchmark、誰融了多少錢、誰發布新模型。但下一個真正的大公司，可能不是今天 Twitter 上最熱門的題目。它可能是某個真實世界痛點，剛好因為 AI 變得可解。

別追 multicast。找長期趨勢裡真正沒被解好的問題。

這堂課真正回答的是：企業 AI 的錢會流向哪裡？

Class #4 的表面主題是 enterprise AI。更深的問題是：AI stack 的價值會流向哪裡？

Ali 的答案很清楚：

模型已經夠強。至少強到可以開始重構企業流程。問題是企業還沒準備好讓模型工作。

SaaS 不會死。系統記錄、資料、客戶、信任和規模仍然有價值。但只靠 UI 習慣、舊流程和十年沒變的產品活著，會很危險。

Agent 不會靠魔法進 production。它需要 context、governance、evaluation、workflow redesign 和資料平台。

模型層會有價值，但會越來越像規模經濟生意。真正厚的價值，會在能把 AI 變成具體結果的應用層。

這堂課最反直覺的一句話，可以這樣總結：

企業 AI 不是缺智慧。企業 AI 缺的是把智慧接上組織的身體。

只要 context 還卡在人腦裡，只要流程還是蒸汽工廠，只要資料還是散在各系統，只要 production 仍然沒有治理與評估，模型再強也只能做 demo。

下一波企業 AI 贏家，不一定是喊 AGI 最大聲的人。會是那些能把組織裡的 John 和 Jane、資料庫、工作流程、權限、評估、客戶回饋和 agent 行動全部接起來的人。

這聽起來不性感。

但 Amazon 一開始也只是賣書。

【資料來源】

課堂紀錄：Stanford MS&E435 Class #4, Apoorv Agrawal with Ali Ghodsi。用途：主要論點、企業 context、SaaS 判斷、connector 案例、AI stack 價值判斷。
MS&E 435 | Economics of the AI Supercycle - Stanford 課程官方頁。用途：課程定位與 Ali Ghodsi 講者背景。
Class #4 | MS&E435 Fact Check - 用途：Class #4 主題、講者主張與外部摘要對照。
TechCrunch: Databricks CEO says SaaS isn’t dead, but AI will soon make it irrelevant - 用途：Ali 對 SaaS、自然語言介面、Databricks AI 收入與 Lakebase 的外部訪談。
Intelligent CIO: Databricks report reveals rapid rise of multi-agent AI systems in the enterprise - 用途：Databricks 2026 State of AI Agents 的多 agent、governance、evaluation 數據。
OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning - 用途：企業文件推理與 context bottleneck 的研究佐證。
Databricks and OpenAI Launch Partnership for Agent Bricks - 用途：Agent Bricks、OpenAI 模型、governed enterprise data 的產品方向查核。

逐字稿與畫面