網易首頁 > 網易號 > 正文申請入駐

OpenAI 罕見認錯：為何放棄一個模型打天下？

2025-12-03 16:03:54　來源: 盛景產業互聯網觀察

北京舉報

分享至

站在2025年末回望，AI行業已然發生了翻天覆地的變化。OpenAI的周活躍用戶已突破驚人的8億大關，這相當于全球10%的人口。在這樣一個巨量規模下，早期的“大一統模型”理論似乎正在失效，取而代之的是專用模型、微調技術與智能體（Agent）的全面爆發。

日前，OpenAI開發者平臺負責人Sherwin Wu與a16z合伙人Martin Casado進行了一場深度對話，詳細拆解了OpenAI如何在模型、定價和基礎設施層面構建其平臺體系。

雙方深入探討了OpenAI發生的轉型：從單一的通用模型，轉向由專業化系統、定制微調選項以及基于節點的智能體工作流組成的產品矩陣。Sherwin還闡述了從“提示工程（Prompt Engineering）”到“上下文設計（Context Design）”的演變。

值得注意的是，在談到定價策略時，Sherwin Wu指出一個關鍵洞察：按結果定價，可能是下一個“單向棘輪”。一旦你嘗到甜頭，你就再也回不去之前的模式了。

他指出，隨著推理時計算（Test-time Compute）的引入，用量和結果其實是高度正相關的。模型思考得越久（用量越大），解決難題的概率（結果）就越高。所以，也許按量計費本身，就是一種近似的“按結果付費”。

早在2025年3月17日，盛景率先提出AI RaaS（Result-as-a-Service，“結果即服務”）的商業模型。AI RaaS模式的核心特點正是按工作量和工作結果付費，從而實現了AI服務方與客戶最大程度的利益綁定。

以下是本次對話的精華實錄，為方便閱讀，盛景新經濟進行了適當編輯，希望對你有所啟發~

平臺悖論：

既做裁判員，又做運動員？

Martin Casado:

Sherwin

是當下最頂尖的

AI

思想領袖之一。

Sherwin

，非常感謝你的加入。

Sherwin Wu:謝謝 Martin，目前我統領 OpenAI 開發者平臺的工程團隊，其中最核心的產品當然是 API。

Martin Casado:

我想聊聊

OpenAI

一個非常獨特的點：你們既是一個

橫向公司

（提供

API

，作為數百萬家公司的基礎設施），又是一個

縱向公司

（擁有

ChatGPT

這樣的超級應用）。這在業界非常罕見。這兩者內部有張力嗎？

API

會不會被視為在幫助那些與你們垂直版本競爭的對手？

Sherwin Wu:確實非常罕見，張力也確實存在。

但我認為這得益于 Sam (Altman) 和 Greg (Brockman) 從第一天起就堅持的原則：我們的使命是實現 AGI（通用人工智能）并將利益廣泛分配。這意味著我們需要盡可能多的接觸面。ChatGPT是獲得8億用戶的最佳途徑，但通過API，我們能觸達更多樣化的場景。我們內部常討論，API覆蓋的終端用戶范圍其實比ChatGPT還要廣。

至于競爭張力，主要體現在產品側。比如 ChatGPT 發布了某個功能，可能會讓基于 API 開發類似產品的客戶感到不滿。

Martin Casado:

這是云計算和操作系統最古老的故事了

平臺與開發者爭利。

Sherwin Wu:對。但我感受到的壓力更多來自 API 客戶本身，他們會擔心：“天哪，你們會不會把我現在做的東西自己做了？”

Martin Casado:

歷史上，做

API

的風險在于容易被

去中介化

Disintermediation

）。開發者可以在云之上構建一層，用戶就不知道底層是哪朵云，這樣開發者可以隨時切換服務商。

但我發現，對于大模型來說，這種

抽象層

很難建立。模型太難被完美封裝了。這幾乎是一種

反去中介化

的技術

你必須把模型直接暴露給用戶。用戶知道自己在用

GPT-5

還是

GPT-4o

Sherwin Wu:非常深刻。整個行業在這個問題上的認知也在轉變。起初我們以為模型會像軟件一樣可以隨意互換。但隨著 GPT-5、o3 等產品的推出，用戶的感知極其敏銳。

Martin Casado:

沒錯，當模型切換時，我甚至能感覺到一種

情感

上的疏離。比如，

你對我沒以前那么好了

Sherwin Wu:是的。而且從技術角度看，開發者，尤其是初創公司，會針對特定模型（比如 GPT-5）進行深度迭代，打磨 Prompt，優化框架。實際上，你是圍繞著那個特定模型構建產品的。所以即使有人試圖做“模型路由”，模型的粘性依然驚人地高。

不會有“大一統模型”，

專用模型或迎來爆發式增長

Martin Casado:

我用

Cursor

寫代碼時也發現了這點。我用

GPT-5

進行規劃，用

Cursor

自帶的模型補全，用

Composer

模型修改。

這就引出了一個大問題：早年大家都認為未來只會有一個超級模型（

AGI

）統治一切，連投資人都不投模型公司。但現在的現實是

模型的大爆發

。這對

AGI

OpenAI

意味著什么？你們會維護一個模型組合嗎？你認為未來這一切會被某個

上帝模型

取代嗎？

Sherwin Wu:這整件事最瘋狂的地方在于大家的想法是如何隨著時間改變的。我清楚地記得，不久前，也就兩三年前，即使在OpenAI內部，當時的想法也是“一個模型統治一切”。那時候我們甚至覺得微調（Fine-tuning）API沒必要存在——為什么要有微調產品？為什么要迭代它？因為主模型會強大到能處理一切。

那也是當時對 AGI 樣貌最簡單的看法。顯然，自那以后情況完全改變了。但也需要記住，未來可能還會變。不過現在越來越清晰的是，各種專用模型將擁有一席之地，很可能會出現各類模型的爆發式增長。

你看我們在Codex模型本身上就這么做了，有GPT-4o、o1、o3、GPT-5等等。我不認為這是壞事。如果說有什么的話，隨著我們向 AGI 邁進，事情變得非常出乎意料，市場和產品組合也隨之演變。

因為不是贏家通吃，也不會有贏家通吃的整合動態。我們內部經常思考，隨著通用AI生態系統的增長，OpenAI從中受益匪淺。這就是為什么我們也開始向其他模型開放我們的部分產品，比如我們的 Evals（評估）產品現在允許你引入其他模型。這也是為什么我們開源了。

強化學習微調的勝利

Martin Casado:

聊聊微調

API

。你們開始轉向更復雜的微調，這某種程度上是不是一種妥協？承認通用模型無法解決所有垂直領域的特定數據問題？正如你所說，與其說是模型擴散，不如說很多數據實際上非常有價值。

在多大程度上這會變成一種

利益交換

？你們暴露將產品數據用于微調的能力，然后你們也從供應商提供的數據中受益？還是說這是

100%

隔離的，他們保留自己的數據？因為感覺這是下一階段擴展的關鍵。

Sherwin Wu:我們最初投資微調 API 的主要原因：第一，人們有巨大的需求想要更多地定制模型；第二，正是你說的，公司們坐擁巨大的數據寶藏，他們想在這波 AI 浪潮中利用這些數據。

有趣的是，回到2022、2023年，微調產品太受限了，人們很難利用這些數據。那只是監督微調（SFT）API。實際上它只對“指令遵循增強版”（Instruction Following++）有用，你改改語氣，指導它一下。

但我認為最近發生的巨大解鎖是強化學習微調（Reinforcement Fine-Tuning, RFT）。有了這套機制，我們現在允許你真正運行RL（強化學習）。這更挑剔、更難，你需要投入更多，但它允許你更充分地利用你的數據。

我想說的關于強化學習微調API的重點是，它將范式從微小的增量改進（如SFT做的語氣改進）轉變為實際上將模型在你知道的特定用例上提升到SOTA（業界頂尖）水平。這就是人們真正開始使用RFT API的地方。

因為如果討論只是“嘿，我可以讓這個模型說話方式更好一點”，那沒那么吸引人；但如果是“嘿，對于醫療保險編碼或 Agent 規劃，你可以用 RFT 和你的數據集打造世界上最好的模型”，這就不同了。

Martin Casado:

你們會想辦法獲取這些數據嗎？比如如果我有數據，我想要便宜的

GPU

，我會跟你換。

Sherwin Wu:我們確實在試點一些定價方案。如果你愿意分享數據，我們可以提供推理折扣甚至免費訓練。這能雙贏。

提示工程已死？

不，這是“上下文工程”的時代

Martin Casado:

你剛才提到在這個過程中，對

提示工程（

Prompt Engineering

的看法也變了？

Sherwin Wu:是的。2022 年，主流觀點（包括我也這么認為）是：未來不需要提示工程。因為根據縮放定律（Scaling Laws），模型會聰明到能和你“心有靈犀”（mind meld），自動理解意圖。

這完全錯了。雖然現在的模型在指令遵循上比 GPT-3.5 強太多，但游戲的規則變了。現在的重點不再是以前那種“念咒語”式的提示工程，而是“上下文工程（Context Engineering）”。即：你給模型什么工具？它什么時候調用什么數據？

Martin Casado:

RAG

（檢索增強生成）就是一個很奇怪的例子。我們居然用余弦相似度（

Cosine Similarity

）這種簡單的算法去檢索信息，然后喂給一個超級智能的大腦。這感覺像是在把智能

外包

給檢索步驟。

Sherwin Wu:RAG 誕生于模型還不夠聰明的時代。但現在有了o3這樣的推理模型——o3 是我最喜歡的模型之一，它是目前最勤奮的模型，能自己決定何時調用工具、何時寫代碼。

范式已經轉移到了：如何構建環境讓模型去推理。

Agent，

是產品還是能力？

Martin Casado:

我們來談談

Agent

。你有

API

（橫向），你有

ChatGPT

（縱向），我們還沒談

Pixel

（圖像）。這些只是語言。

Agent

（智能體）是一種新模態（

Modality

）嗎？還是別的什么？

Sherwin Wu:你說的模態是什么意思？

Martin Casado:

它們對我來說既感覺像垂直也像橫向。對我來說，

ChatGPT

是個產品，我媽都在用。

API

是個開發者工具。

Agent

介于兩者之間。它是一個產品嗎？如果是橫向的

內部是怎么處理的？是有個獨立的團隊做

Agent

嗎？

Sherwin Wu:有趣的是，你剛才的框架聽起來好像 Agent 是一個單一的概念……

Martin Casado:

也許更好的問題是，對你來說什么是

Agent

Sherwin Wu:我對 Agent 的總體看法是：它是一個能代表你采取行動、并且能在長時間跨度上工作的AI。

如果你這樣想，是的，也許這就是你說的模態，但它只是一種使用AI的方式。我們并不把它看作是獨立存在的。

Martin Casado:

讓我解釋一下這個問題的來源。我知道怎么構建產品，我們也知道怎么做產品的市場推廣。我們知道把它們變成平臺的含義。我們也知道怎么做

API

，怎么計費，怎么處理開發者張力。但我一直在試圖弄清楚，對于

Agent

，它屬于哪個陣營？它更像產品陣營嗎？

比如我可以把編碼交給你，你作為用戶直接跟它對話；或者我可以把它嵌入我的

App

里。這對定價和生態系統意味著什么？比如如果我開家公司，完全圍繞

Codex

構建，你會介意嗎？

Sherwin Wu:開一家圍繞它的公司？我覺得那很棒。我們真的很喜歡 Codex SDK，希望人們能用它構建。

實際上，我認為這可能就是你想問的，這也是OpenAI的一個獨特之處：歸根結底，OpenAI是一家AGI公司，是一家智能公司。Agent只是這種智能表現出來的眾多方式之一。

我們在內部思考所有不同產品線——Sora、Codex、API、ChatGPT——的方式是，它們只是部署這種智能的不同界面。并沒有一個單一的團隊在想“這就是Agent”。更多的是每個產品領域都在思考，這種智能如何轉化為一種形式，讓Agent行為成為可能。

在 ChatGPT 這樣的第一方產品中它長什么樣？這就是為什么 Codex 最終變成了它自己的產品。在編碼產品中它長什么樣？我們在 ChatGPT 里探索過，有點用，但實際上 CLI（命令行）界面更有意義，那是另一個部署界面。

如果你看 API 本身，這是另一個部署界面。你的思考方式略有不同，因為是開發者優先的思維，我們在幫別人構建，定價略有不同，但這些都是核心智能——即 Agent 行為——的不同表現形式。

Agent Builder：

既要智能，又要受控

Martin Casado:

你們最近發布了

Agent Builder

（智能體構建器）

，用的是節點（

Nodes

）這種確定性的低代碼方式。很多人對此有爭議，覺得這就變回了老式的

工作流

，不夠

AGI

Sherwin Wu:我在發布 Agent Builder 時也收到了很多質疑。大家問：“為什么還需要節點？為什么不直接讓 AI 端到端解決？”

這里有兩個原因。第一是實用性。模型雖然強，但在長鏈路任務上仍然做不到100% 完美。在此期間，人們想用模型，你能給他們構建什么？

第二，也是更重要的一點，我們發現工作中存在兩類任務。一類是像軟件工程師那樣，目標明確但過程開放的探索性工作；另一類是程序化工作（Procedural Work），也就是基于SOP（標準作業程序）的工作。

比如客戶支持、銷售、合規審核。這些領域的管理者不希望AI發揮創造力，他們需要AI嚴格遵循SOP。比如“只有金額小于多少時才能退款”。這種確定性需求巨大，我覺得硅谷的很多人并沒有意識到有大量的工作實際上屬于這一類。

而帶有節點的 Agent Builder 正是為了解決這類“既要智能又要受控”的問題。

Martin Casado:

就像游戲里的

NPC

（非玩家角色）。你不能讓

NPC

隨便說話，它必須遵循游戲邏輯。所以人們現在會用代碼把邏輯

硬編碼

進去，以此約束模型。

Sherwin Wu:完全正確。這就是我們在嘗試解決的問題。如果不加約束，模型就會放飛自我，這在受監管行業是不可接受的。

定價的終局：

單向棘輪與結果付費

Martin Casado:

聊聊定價。你們現在還是以

Usage-based

（按量計費）為主。

Sherwin Wu:我們在 API 上做基于用量的定價，最簡單的原因就是它最接近實際使用情況。

我們在內部做的一件事是，我們總是確保我們的基于用量定價是從“成本加成”（Cost-plus）的角度來定價的，確保我們在利潤率方面是負責任的。

我們不久前收購了一家公司，關于定價我和公司的創始人聊過。他的觀點是，定價有點像一個“單向棘輪（One-way Ratchet）”。一旦你嘗到了基于用量定價的甜頭，你就再也回不去那種按部署付費的模式了。

這是真的，因為它越來越接近你實際獲得的效用。唯一的痛點在于，你要維護大量賬務系統才能做到這一點。但如果你能做到，他認為這就是一個單向的趨勢——沒有回頭路。

現在最熱門的新事物是：“有了AI，你可以衡量結果（Outcomes）了。”如果那能行，也許那是下一個“單向棘輪”。

我思考過基于結果的定價（Outcome-based pricing），這在第一方產品側可能更多見，在 API 側有點難。

API側，這是一個典型的 usage-based 場景，我們必須打造支持這套體系的基礎設施，所以我們應該會繼續使用量計費。

但未來可能會有一種情況：AI 本身可以準確判斷這些價值，然后把它綁定到計費上。

Martin Casado

這就是

AI

討論的問題：任何時候你都可以說

未來它會變得足夠好

Sherwin Wu：但到了那一步，它就真的不是問題了。結果導向的定價聽起來非常吸引人——如果它能跑通。

但我開始發現的一件事是，隨著推理時計算（Test-time Compute）的引入，用量和結果其實是高度正相關的。模型思考得越久（用量越大），解決難題的概率（結果）就越高。

所以，也許按量計費本身，就是一種近似的“按結果付費”。

我個人會持續關注結果導向定價是否真正可行。

開源的戰略思考

Martin Casado:

你怎么看開源？競爭？互相蠶食？戰略目標是什么？

Sherwin Wu:我個人很喜歡開源。如果沒有開源，互聯網就不會存在，云也不會存在。

有趣的是，在我們發布開源模型之前，我知道 Sam 也有這種感覺。有一種奇怪的心態，因為 OpenAI 沒發布任何東西，看起來好像 OpenAI 超級反開源。但我自從加入以來就一直和 Sam 討論開源模型。我們試圖思考如何排序。算力總是個難題。我們一直想做這個。我很高興我們終于在今年早些時候做了……也就是發布GPT-OS的時候。

我對此的看法是：第一，作為一個既垂直又橫向的公司，我們想繼續投資生態系統。第二，從OpenAI的角度看，如果AI生態系統增長，水漲船高對我們有幫助。如果我們發布開源模型能解鎖其他行業的用例，那很好。

Martin Casado:

人們很少談論的是這些開源

AI

商業模式其實運作得很好，因為互相蠶食的風險其實很低。并不是說他們拿了權重就能重現你的服務。而且推理其實超級難。

Sherwin Wu:推理是個難題。所以我個人認為開源與API業務的關系是：第一，沒看到蠶食風險。第二，特別是對所有大實驗室來說，通常有兩三個模型產生了所有的影響和收入。那些是我們投入大量資源改進的模型，也是推理極其困難的模型。

如果你看我們的推理團隊，真的很強。我的感覺是，即使我們開源了 GPT-5，要以我們能做到的水平去運行推理也是非常非常難的。

Martin Casado:

是否可能為產品垂直化模型？

Sherwin Wu:我覺得我們在向那個方向移動。問題是垂直化多深。我們做的大部分是在后訓練（Post-training）、工具使用層面。比如 GPT-5 Codex 特別擅長使用 Codex 框架。但還有更深層的垂直化。

Martin Casado:

我這很多的思維模型來自

Pixel

（圖像）領域。你可以

LoRA

一堆圖像模型，做很多事讓它更適合某些產品。你會相信你可以為編輯或剪切粘貼垂直化一個模型。但在文本領域你看不到這個。幾乎總是你只是暴露一個模型。

Sherwin Wu:我認為圖像模型和文本模型有區別。圖像模型往往小得多，迭代快得多。這就是為什么圖像模型那邊有瘋狂的爆發。而對于文本模型，總會有這個非常大的預訓練模型。即使是后訓練也不容易，算力還是挺重的。所以我認為那是更大的瓶頸。在圖像方面，你可以微調它讓它極其擅長編輯人臉……然后圍繞它構建產品。

Martin Casado:

我得說，在同一家公司做語言模型和像

Pixel

這樣的擴散模型有點

反模式

Anti-pattern

）。大多數嘗試過的公司都覺得很笨重。但你們和

Google

是兩個反例。這些基礎設施能融合嗎？是不同的組織嗎？共享基礎設施嗎？

Sherwin Wu:我覺得你完全沒錯，這是反模式，很難搞定。我覺得要歸功于我們的研究團隊，架構得很好。但我認為最重要的是，我們的世界模擬團隊（構建 Sora 的團隊）非常扎實。

Martin Casado:

是同樣的基礎設施嗎？

Sherwin Wu:是同樣的……其實相當獨立。這也是我們能做到的原因之一。團隊必須極強，而且它們運行得非常獨立。它們思考自己的路線圖，獨立思考產品化（這也是 Sora App 誕生的原因）。甚至推理棧也略有不同。

Martin Casado:

我以為

API

主要是基于文本的。你們做實際的基于圖像的東西嗎？

Sherwin Wu:做，我們有一堆。DALL-E API。DALL-E 2 是那個讓我決定加入 OpenAI 的模型。我記得讓它畫一只鴨子，它生成了一張白鴨子的照片，那讓我決定加入。我們在 API 里有圖像生成，也有視頻生成。

Martin Casado:

我還有一百萬個問題想問你，但時間到了。非常感謝。

Sherwin Wu:謝謝。

2025盛景半年回顧

人生只有四千周，而企業生存期更短，跨越10年經營期的企業少之又少，企業要想有質量地活下去，活得更好更久，“極簡增長”就是看透并掌控事物本質的那個關鍵點。

選對了路，路就不會遠。盛景推出《極簡增長立竿見影》在線課程，期望能夠幫助更多的企業走上增長道路。未來有多近，在于我們已經走了多遠。未來有多遠，在于我們與誰同行。期待與你同行、共勉。

歡迎大家點擊底部【閱讀原文】觀看《極簡增長立竿見影》的在線視頻課程，了解如何用極致簡單的增長方法論，實現快速增長。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.