![]()
站在2025年末回望,AI行業已然發生了翻天覆地的變化。OpenAI的周活躍用戶已突破驚人的8億大關,這相當于全球10%的人口。在這樣一個巨量規模下,早期的“大一統模型”理論似乎正在失效,取而代之的是專用模型、微調技術與智能體(Agent)的全面爆發。
日前,OpenAI開發者平臺負責人Sherwin Wu與a16z合伙人Martin Casado進行了一場深度對話,詳細拆解了OpenAI如何在模型、定價和基礎設施層面構建其平臺體系。
雙方深入探討了OpenAI發生的轉型:從單一的通用模型,轉向由專業化系統、定制微調選項以及基于節點的智能體工作流組成的產品矩陣。Sherwin還闡述了從“提示工程(Prompt Engineering)”到“上下文設計(Context Design)”的演變。
值得注意的是,在談到定價策略時,Sherwin Wu指出一個關鍵洞察:按結果定價,可能是下一個“單向棘輪”。一旦你嘗到甜頭,你就再也回不去之前的模式了。
他指出,隨著推理時計算(Test-time Compute)的引入,用量和結果其實是高度正相關的。模型思考得越久(用量越大),解決難題的概率(結果)就越高。所以,也許按量計費本身,就是一種近似的“按結果付費”。
早在2025年3月17日,盛景率先提出AI RaaS(Result-as-a-Service,“結果即服務”)的商業模型。AI RaaS模式的核心特點正是按工作量和工作結果付費,從而實現了AI服務方與客戶最大程度的利益綁定。
以下是本次對話的精華實錄,為方便閱讀,盛景新經濟進行了適當編輯,希望對你有所啟發~
01
平臺悖論:
既做裁判員,又做運動員?
Martin Casado:
Sherwin
是當下最頂尖的
AI
思想領袖之一。
Sherwin
,非常感謝你的加入。
Sherwin Wu:謝謝 Martin,目前我統領 OpenAI 開發者平臺的工程團隊,其中最核心的產品當然是 API。
Martin Casado:
我想聊聊
OpenAI
一個非常獨特的點:你們既是一個
橫向公司
(提供
API
,作為數百萬家公司的基礎設施),又是一個
縱向公司
(擁有
ChatGPT
這樣的超級應用)。這在業界非常罕見。這兩者內部有張力嗎?
API
會不會被視為在幫助那些與你們垂直版本競爭的對手?
Sherwin Wu:確實非常罕見,張力也確實存在。
但我認為這得益于 Sam (Altman) 和 Greg (Brockman) 從第一天起就堅持的原則:我們的使命是實現 AGI(通用人工智能)并將利益廣泛分配。這意味著我們需要盡可能多的接觸面。ChatGPT是獲得8億用戶的最佳途徑,但通過API,我們能觸達更多樣化的場景。我們內部常討論,API覆蓋的終端用戶范圍其實比ChatGPT還要廣。
至于競爭張力,主要體現在產品側。比如 ChatGPT 發布了某個功能,可能會讓基于 API 開發類似產品的客戶感到不滿。
Martin Casado:
這是云計算和操作系統最古老的故事了
平臺與開發者爭利。
Sherwin Wu:對。但我感受到的壓力更多來自 API 客戶本身,他們會擔心:“天哪,你們會不會把我現在做的東西自己做了?”
Martin Casado:
歷史上,做
API
的風險在于容易被
去中介化
Disintermediation
)。開發者可以在云之上構建一層,用戶就不知道底層是哪朵云,這樣開發者可以隨時切換服務商。
但我發現,對于大模型來說,這種
抽象層
很難建立。模型太難被完美封裝了。這幾乎是一種
反去中介化
的技術
你必須把模型直接暴露給用戶。用戶知道自己在用
GPT-5
還是
GPT-4o
Sherwin Wu:非常深刻。整個行業在這個問題上的認知也在轉變。起初我們以為模型會像軟件一樣可以隨意互換。但隨著 GPT-5、o3 等產品的推出,用戶的感知極其敏銳。
Martin Casado:
沒錯,當模型切換時,我甚至能感覺到一種
情感
上的疏離。比如,
你對我沒以前那么好了
Sherwin Wu:是的。而且從技術角度看,開發者,尤其是初創公司,會針對特定模型(比如 GPT-5)進行深度迭代,打磨 Prompt,優化框架。實際上,你是圍繞著那個特定模型構建產品的。所以即使有人試圖做“模型路由”,模型的粘性依然驚人地高。
02
不會有“大一統模型”,
專用模型或迎來爆發式增長
Martin Casado:
我用
Cursor
寫代碼時也發現了這點。我用
GPT-5
進行規劃,用
Cursor
自帶的模型補全,用
Composer
模型修改。
這就引出了一個大問題:早年大家都認為未來只會有一個超級模型(
AGI
)統治一切,連投資人都不投模型公司。但現在的現實是
模型的大爆發
。這對
AGI
OpenAI
意味著什么?你們會維護一個模型組合嗎?你認為未來這一切會被某個
上帝模型
取代嗎?
Sherwin Wu:這整件事最瘋狂的地方在于大家的想法是如何隨著時間改變的。我清楚地記得,不久前,也就兩三年前,即使在OpenAI內部,當時的想法也是“一個模型統治一切”。那時候我們甚至覺得微調(Fine-tuning)API沒必要存在——為什么要有微調產品?為什么要迭代它?因為主模型會強大到能處理一切。
那也是當時對 AGI 樣貌最簡單的看法。顯然,自那以后情況完全改變了。但也需要記住,未來可能還會變。不過現在越來越清晰的是,各種專用模型將擁有一席之地,很可能會出現各類模型的爆發式增長。
你看我們在Codex模型本身上就這么做了,有GPT-4o、o1、o3、GPT-5等等。我不認為這是壞事。如果說有什么的話,隨著我們向 AGI 邁進,事情變得非常出乎意料,市場和產品組合也隨之演變。
因為不是贏家通吃,也不會有贏家通吃的整合動態。我們內部經常思考,隨著通用AI生態系統的增長,OpenAI從中受益匪淺。這就是為什么我們也開始向其他模型開放我們的部分產品,比如我們的 Evals(評估)產品現在允許你引入其他模型。這也是為什么我們開源了。
03
強化學習微調的勝利
Martin Casado:
聊聊微調
API
。你們開始轉向更復雜的微調,這某種程度上是不是一種妥協?承認通用模型無法解決所有垂直領域的特定數據問題?正如你所說,與其說是模型擴散,不如說很多數據實際上非常有價值。
在多大程度上這會變成一種
利益交換
?你們暴露將產品數據用于微調的能力,然后你們也從供應商提供的數據中受益?還是說這是
100%
隔離的,他們保留自己的數據?因為感覺這是下一階段擴展的關鍵。
Sherwin Wu:我們最初投資微調 API 的主要原因:第一,人們有巨大的需求想要更多地定制模型;第二,正是你說的,公司們坐擁巨大的數據寶藏,他們想在這波 AI 浪潮中利用這些數據。
有趣的是,回到2022、2023年,微調產品太受限了,人們很難利用這些數據。那只是監督微調(SFT)API。實際上它只對“指令遵循增強版”(Instruction Following++)有用,你改改語氣,指導它一下。
但我認為最近發生的巨大解鎖是強化學習微調(Reinforcement Fine-Tuning, RFT)。有了這套機制,我們現在允許你真正運行RL(強化學習)。這更挑剔、更難,你需要投入更多,但它允許你更充分地利用你的數據。
我想說的關于強化學習微調API的重點是,它將范式從微小的增量改進(如SFT做的語氣改進)轉變為實際上將模型在你知道的特定用例上提升到SOTA(業界頂尖)水平。這就是人們真正開始使用RFT API的地方。
因為如果討論只是“嘿,我可以讓這個模型說話方式更好一點”,那沒那么吸引人;但如果是“嘿,對于醫療保險編碼或 Agent 規劃,你可以用 RFT 和你的數據集打造世界上最好的模型”,這就不同了。
Martin Casado:
你們會想辦法獲取這些數據嗎?比如如果我有數據,我想要便宜的
GPU
,我會跟你換。
Sherwin Wu:我們確實在試點一些定價方案。如果你愿意分享數據,我們可以提供推理折扣甚至免費訓練。這能雙贏。
04
提示工程已死?
不,這是“上下文工程”的時代
Martin Casado:
你剛才提到在這個過程中,對
提示工程(
Prompt Engineering
的看法也變了?
Sherwin Wu:是的。2022 年,主流觀點(包括我也這么認為)是:未來不需要提示工程。因為根據縮放定律(Scaling Laws),模型會聰明到能和你“心有靈犀”(mind meld),自動理解意圖。
這完全錯了。雖然現在的模型在指令遵循上比 GPT-3.5 強太多,但游戲的規則變了。現在的重點不再是以前那種“念咒語”式的提示工程,而是“上下文工程(Context Engineering)”。即:你給模型什么工具?它什么時候調用什么數據?
Martin Casado:
RAG
(檢索增強生成)就是一個很奇怪的例子。我們居然用余弦相似度(
Cosine Similarity
)這種簡單的算法去檢索信息,然后喂給一個超級智能的大腦。這感覺像是在把智能
外包
給檢索步驟。
Sherwin Wu:RAG 誕生于模型還不夠聰明的時代。但現在有了o3這樣的推理模型——o3 是我最喜歡的模型之一,它是目前最勤奮的模型,能自己決定何時調用工具、何時寫代碼。
范式已經轉移到了:如何構建環境讓模型去推理。
05
Agent,
是產品還是能力?
Martin Casado:
我們來談談
Agent
。你有
API
(橫向),你有
ChatGPT
(縱向),我們還沒談
Pixel
(圖像)。這些只是語言。
Agent
(智能體)是一種新模態(
Modality
)嗎?還是別的什么?
Sherwin Wu:你說的模態是什么意思?
Martin Casado:
它們對我來說既感覺像垂直也像橫向。對我來說,
ChatGPT
是個產品,我媽都在用。
API
是個開發者工具。
Agent
介于兩者之間。它是一個產品嗎?如果是橫向的
內部是怎么處理的?是有個獨立的團隊做
Agent
嗎?
Sherwin Wu:有趣的是,你剛才的框架聽起來好像 Agent 是一個單一的概念……
Martin Casado:
也許更好的問題是,對你來說什么是
Agent
Sherwin Wu:我對 Agent 的總體看法是:它是一個能代表你采取行動、并且能在長時間跨度上工作的AI。
如果你這樣想,是的,也許這就是你說的模態,但它只是一種使用AI的方式。我們并不把它看作是獨立存在的。
Martin Casado:
讓我解釋一下這個問題的來源。我知道怎么構建產品,我們也知道怎么做產品的市場推廣。我們知道把它們變成平臺的含義。我們也知道怎么做
API
,怎么計費,怎么處理開發者張力。但我一直在試圖弄清楚,對于
Agent
,它屬于哪個陣營?它更像產品陣營嗎?
比如我可以把編碼交給你,你作為用戶直接跟它對話;或者我可以把它嵌入我的
App
里。這對定價和生態系統意味著什么?比如如果我開家公司,完全圍繞
Codex
構建,你會介意嗎?
Sherwin Wu:開一家圍繞它的公司?我覺得那很棒。我們真的很喜歡 Codex SDK,希望人們能用它構建。
實際上,我認為這可能就是你想問的,這也是OpenAI的一個獨特之處:歸根結底,OpenAI是一家AGI公司,是一家智能公司。Agent只是這種智能表現出來的眾多方式之一。
我們在內部思考所有不同產品線——Sora、Codex、API、ChatGPT——的方式是,它們只是部署這種智能的不同界面。并沒有一個單一的團隊在想“這就是Agent”。更多的是每個產品領域都在思考,這種智能如何轉化為一種形式,讓Agent行為成為可能。
在 ChatGPT 這樣的第一方產品中它長什么樣?這就是為什么 Codex 最終變成了它自己的產品。在編碼產品中它長什么樣?我們在 ChatGPT 里探索過,有點用,但實際上 CLI(命令行)界面更有意義,那是另一個部署界面。
如果你看 API 本身,這是另一個部署界面。你的思考方式略有不同,因為是開發者優先的思維,我們在幫別人構建,定價略有不同,但這些都是核心智能——即 Agent 行為——的不同表現形式。
06
Agent Builder:
既要智能,又要受控
Martin Casado:
你們最近發布了
Agent Builder
(智能體構建器)
,用的是節點(
Nodes
)這種確定性的低代碼方式。很多人對此有爭議,覺得這就變回了老式的
工作流
,不夠
AGI
Sherwin Wu:我在發布 Agent Builder 時也收到了很多質疑。大家問:“為什么還需要節點?為什么不直接讓 AI 端到端解決?”
這里有兩個原因。第一是實用性。模型雖然強,但在長鏈路任務上仍然做不到100% 完美。在此期間,人們想用模型,你能給他們構建什么?
第二,也是更重要的一點,我們發現工作中存在兩類任務。一類是像軟件工程師那樣,目標明確但過程開放的探索性工作;另一類是程序化工作(Procedural Work),也就是基于SOP(標準作業程序)的工作。
比如客戶支持、銷售、合規審核。這些領域的管理者不希望AI發揮創造力,他們需要AI嚴格遵循SOP。比如“只有金額小于多少時才能退款”。這種確定性需求巨大,我覺得硅谷的很多人并沒有意識到有大量的工作實際上屬于這一類。
而帶有節點的 Agent Builder 正是為了解決這類“既要智能又要受控”的問題。
Martin Casado:
就像游戲里的
NPC
(非玩家角色)。你不能讓
NPC
隨便說話,它必須遵循游戲邏輯。所以人們現在會用代碼把邏輯
硬編碼
進去,以此約束模型。
Sherwin Wu:完全正確。這就是我們在嘗試解決的問題。如果不加約束,模型就會放飛自我,這在受監管行業是不可接受的。
07
定價的終局:
單向棘輪與結果付費
Martin Casado:
聊聊定價。你們現在還是以
Usage-based
(按量計費)為主。
Sherwin Wu:我們在 API 上做基于用量的定價,最簡單的原因就是它最接近實際使用情況。
我們在內部做的一件事是,我們總是確保我們的基于用量定價是從“成本加成”(Cost-plus)的角度來定價的,確保我們在利潤率方面是負責任的。
我們不久前收購了一家公司,關于定價我和公司的創始人聊過。他的觀點是,定價有點像一個“單向棘輪(One-way Ratchet)”。一旦你嘗到了基于用量定價的甜頭,你就再也回不去那種按部署付費的模式了。
這是真的,因為它越來越接近你實際獲得的效用。唯一的痛點在于,你要維護大量賬務系統才能做到這一點。但如果你能做到,他認為這就是一個單向的趨勢——沒有回頭路。
現在最熱門的新事物是:“有了AI,你可以衡量結果(Outcomes)了。”如果那能行,也許那是下一個“單向棘輪”。
我思考過基于結果的定價(Outcome-based pricing),這在第一方產品側可能更多見,在 API 側有點難。
API側,這是一個典型的 usage-based 場景,我們必須打造支持這套體系的基礎設施,所以我們應該會繼續使用量計費。
但未來可能會有一種情況:AI 本身可以準確判斷這些價值,然后把它綁定到計費上。
Martin Casado
這就是
AI
討論的問題:任何時候你都可以說
未來它會變得足夠好
Sherwin Wu:但到了那一步,它就真的不是問題了。結果導向的定價聽起來非常吸引人——如果它能跑通。
但我開始發現的一件事是,隨著推理時計算(Test-time Compute)的引入,用量和結果其實是高度正相關的。模型思考得越久(用量越大),解決難題的概率(結果)就越高。
所以,也許按量計費本身,就是一種近似的“按結果付費”。
我個人會持續關注結果導向定價是否真正可行。
08
開源的戰略思考
Martin Casado:
你怎么看開源?競爭?互相蠶食?戰略目標是什么?
Sherwin Wu:我個人很喜歡開源。如果沒有開源,互聯網就不會存在,云也不會存在。
有趣的是,在我們發布開源模型之前,我知道 Sam 也有這種感覺。有一種奇怪的心態,因為 OpenAI 沒發布任何東西,看起來好像 OpenAI 超級反開源。但我自從加入以來就一直和 Sam 討論開源模型。我們試圖思考如何排序。算力總是個難題。我們一直想做這個。我很高興我們終于在今年早些時候做了……也就是發布GPT-OS的時候。
我對此的看法是:第一,作為一個既垂直又橫向的公司,我們想繼續投資生態系統。第二,從OpenAI的角度看,如果AI生態系統增長,水漲船高對我們有幫助。如果我們發布開源模型能解鎖其他行業的用例,那很好。
Martin Casado:
人們很少談論的是這些開源
AI
商業模式其實運作得很好,因為互相蠶食的風險其實很低。并不是說他們拿了權重就能重現你的服務。而且推理其實超級難。
Sherwin Wu:推理是個難題。所以我個人認為開源與API業務的關系是:第一,沒看到蠶食風險。第二,特別是對所有大實驗室來說,通常有兩三個模型產生了所有的影響和收入。那些是我們投入大量資源改進的模型,也是推理極其困難的模型。
如果你看我們的推理團隊,真的很強。我的感覺是,即使我們開源了 GPT-5,要以我們能做到的水平去運行推理也是非常非常難的。
Martin Casado:
是否可能為產品垂直化模型?
Sherwin Wu:我覺得我們在向那個方向移動。問題是垂直化多深。我們做的大部分是在后訓練(Post-training)、工具使用層面。比如 GPT-5 Codex 特別擅長使用 Codex 框架。但還有更深層的垂直化。
Martin Casado:
我這很多的思維模型來自
Pixel
(圖像)領域。你可以
LoRA
一堆圖像模型,做很多事讓它更適合某些產品。你會相信你可以為編輯或剪切粘貼垂直化一個模型。但在文本領域你看不到這個。幾乎總是你只是暴露一個模型。
Sherwin Wu:我認為圖像模型和文本模型有區別。圖像模型往往小得多,迭代快得多。這就是為什么圖像模型那邊有瘋狂的爆發。而對于文本模型,總會有這個非常大的預訓練模型。即使是后訓練也不容易,算力還是挺重的。所以我認為那是更大的瓶頸。在圖像方面,你可以微調它讓它極其擅長編輯人臉……然后圍繞它構建產品。
Martin Casado:
我得說,在同一家公司做語言模型和像
Pixel
這樣的擴散模型有點
反模式
Anti-pattern
)。大多數嘗試過的公司都覺得很笨重。但你們和
是兩個反例。這些基礎設施能融合嗎?是不同的組織嗎?共享基礎設施嗎?
Sherwin Wu:我覺得你完全沒錯,這是反模式,很難搞定。我覺得要歸功于我們的研究團隊,架構得很好。但我認為最重要的是,我們的世界模擬團隊(構建 Sora 的團隊)非常扎實。
Martin Casado:
是同樣的基礎設施嗎?
Sherwin Wu:是同樣的……其實相當獨立。這也是我們能做到的原因之一。團隊必須極強,而且它們運行得非常獨立。它們思考自己的路線圖,獨立思考產品化(這也是 Sora App 誕生的原因)。甚至推理棧也略有不同。
Martin Casado:
我以為
API
主要是基于文本的。你們做實際的基于圖像的東西嗎?
Sherwin Wu:做,我們有一堆。DALL-E API。DALL-E 2 是那個讓我決定加入 OpenAI 的模型。我記得讓它畫一只鴨子,它生成了一張白鴨子的照片,那讓我決定加入。我們在 API 里有圖像生成,也有視頻生成。
Martin Casado:
我還有一百萬個問題想問你,但時間到了。非常感謝。
Sherwin Wu:謝謝。
2025盛景半年回顧
![]()
人生只有四千周,而企業生存期更短,跨越10年經營期的企業少之又少,企業要想有質量地活下去,活得更好更久,“極簡增長”就是看透并掌控事物本質的那個關鍵點。
選對了路,路就不會遠。盛景推出《極簡增長 立竿見影》在線課程,期望能夠幫助更多的企業走上增長道路。未來有多近,在于我們已經走了多遠。未來有多遠,在于我們與誰同行。期待與你同行、共勉。
歡迎大家點擊底部【閱讀原文】觀看《極簡增長 立竿見影》的在線視頻課程,了解如何用極致簡單的增長方法論,實現快速增長。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.