網易首頁 > 網易號 > 正文申請入駐

復盤50+個實戰案例，終于找到了AI產品落地的關鍵

2026-01-19 19:41:22　來源: 硅基觀察Pro

北京舉報

分享至

盡管技術飛速進步，許多團隊在將AI融入實際業務時，卻陷入迭代混亂、投入巨大而收效甚微的困境。

Aishwarya Naresh Reganti與Kiriti Badam對此有著截然不同的清醒洞察。

Kiriti在OpenAI領導Kodex團隊，擁有在谷歌構建十年AI基礎設施的深厚背景；Ash則是Alexa與微軟的早期AI研究員，發表了超過35篇論文。他們共同主導了從亞馬遜、Databricks到眾多初創企業在內的超過50個AI產品部署，深諳其中溝壑。

在本次深度對談中，他們直指核心：問題往往不在于模型能力，而在于方法謬誤。

行業癡迷于追逐“全自動代理”的炫目未來，卻忽略了AI與非AI產品的根本性差異——非確定性。這導致團隊常常從錯誤的地方開始，在復雜性的泥潭中掙扎，最終迷失了本該解決的真實問題。

他們提出一套被反復驗證的務實框架：放棄對“終極智能”的一步到位幻想，轉向一種“漸進式自主”的產品哲學。

即從高控制、低風險的場景起步，構建持續學習和校準的“飛輪”，隨著信任的積累逐步移交自主權。這不僅關乎技術路徑，更涉及領導力重塑、組織文化轉型以及對工作流程的深刻解構。

以下便是兩位實戰派專家帶來的完整經驗凝結，enjoy~

擁抱非確定性與控制權的權衡

主持人

：我們一起寫了一篇客座文章。他們有一個非常關鍵的洞見，就是

構建AI產品與開發非AI產品非常不同

Aishwarya Naresh Reganti：大多數人往往忽視這種非確定性。你不知道用戶會如何使用你的產品，也不知道大型語言模型會如何回應。第二個區別是能動控制權的權衡。每次你把決策能力交給智能系統時，你其實是在放棄你那邊的某種控制權。

Kiriti Badam：因此，我們建議逐步構建。當你從小處開始時，它迫使你思考你要解決的問題。在AI的這些進步中，一個簡單而滑溜的路就是不斷思考解決方案的復雜性，而忘記你正在解決的問題。

Aishwarya Naresh Reganti：這并不是說你是第一家在競爭對手中擁有經紀人的公司。關鍵是你是否已經建立了正確的飛輪，以便隨著時間推移不斷改進。

主持人

：你認為當前公司在開發AI產品時，主要遇到了哪些問題？進展如何？

Aishwarya Naresh Reganti：我認為2025年和2024年有很大不同。第一，懷疑情緒明顯減少了。去年很多領導者認為這可能只是又一波加密貨幣浪潮，持懷疑態度。當時的很多用例更多是對你數據的閑聊，就自稱是AI產品。

今年，公司們開始重新思考用戶體驗和工作流程，真正理解到必須拆解和重構流程，才能打造成功的AI產品。這是精彩之處。

糟糕的是執行依然很混亂。這就像三歲馬場，沒有戰術手冊，沒有教科書，你真的需要邊做邊摸索。而且AI生命周期，無論是部署前還是部署后，都與傳統軟件生命周期有很大不同。

傳統角色之間的舊合同和交接，比如產品經理、工程師和數據人員，現在已經被打破。人們正在適應新的合作方式，擁有相同的反饋循環。以前，項目經理、工程師都有自己的優化反饋循環。

現在你們可能需要坐在同一個房間里，一起看“試劑痕跡”，或者說數據反饋，共同決定產品應該如何表現。這是一種更緊密的協作形式，公司們還在摸索中，這也是我今年在咨詢業務中看到的情況。

我要強調，構建AI系統和軟件系統有相似之處，但也有一些東西從根本上改變了開發方式。其中一個常被忽視的就是非確定性。你使用的是一個非確定性的API，而不是傳統軟件。

在傳統軟件中，比如Booking.com，你有一個完善的決策引擎。你想在舊金山預訂兩晚，產品設計會將你的意圖轉化為具體動作，你點擊按鈕、填寫表單，最終實現意圖。

但在AI產品中，這一層被一個流動的界面取代，主要是自然語言。這意味著用戶可以用無數種方式表達意圖。輸入端是不可預測的。輸出端，你面對的是一個非確定性的概率API。大型語言模型對提示非常敏感，且基本是黑箱。你不知道輸出會是什么樣子。

所以，你既不知道用戶會如何使用產品，也不知道模型會如何響應。你在處理輸入、輸出和過程，對這三者都不完全了解。你必須試圖預判行為并為此做準備。

這就引出了第二個區別：代理控制權的權衡。

很多人癡迷于構建能自主完成任務的系統。但每次你把決策能力交給智能系統時，你其實是在放棄某種控制權。你必須確保你的代理已經贏得了信任，足夠可靠。這就是權衡所在：給AI更多自主權，你就會失去一些控制權，因此必須確保系統隨著時間積累了足夠的信任。

主持人

：傳統軟件追求確定性，而AI具有非確定性。其核心挑戰在于如何權衡自動化與人類控制，這正深刻改變產品設計的根本邏輯。

Kiriti Badam：這是對你提供的文本進行的精簡和潤色版本。我保留了核心的“優勝美地徒步”類比、關于“漸進式自主”的邏輯，以及“好事與壞事”的辯證觀點，主要刪減了口語中的重復、自我修正和冗余的連接詞，使表達更緊湊有力。

是的，這絕對是你剛開始建造時，腦海中必須明確的關鍵點之一。

比如，想想你的目標是徒步優勝美地的半圓頂峰。你不會每天都去徒步，而是從小部分開始訓練，然后慢慢進步，最終達到終點。我覺得這和打造AI產品非常相似。因為你一開始在公司里并沒有所有的工具和背景，不能期望它立刻在最高層面工作甚至自我調整。

你需要有意識地從影響最小、人為控制最多的地方開始。這樣你才能很好地掌握當前的能力邊界和可實現的范圍，然后再慢慢轉向更具自主性、控制更少的部分。這能給你信心：“這就是我面臨的具體問題，AI能夠解決到這個程度?！?然后你再思考需要引入哪些背景、添加哪些工具來提升體驗。

所以我覺得這既是好事也是壞事。

好處在于，你不必一開始就面對外部那些復雜的AI代理能力而感到自己做不到。每個人都是從非常極簡的結構開始，然后不斷演變。壞處，或者說挑戰在于，當你試圖將這種“一鍵代理”融入公司時，你可能會被這種復雜性壓垮。但實際上，你可以慢慢“畢業”。

這非常重要，我們看到這種模式一再重復。

主持人：請以具體示例說明，如何從基礎的行動與控制模塊開始，逐步構建更復雜的AI代理或產品。

Kiriti Badam：例如，AI代理一個非常重要且普遍的應用是客戶支持。想象一下，你是一家客戶支持工單量很大的公司——其實不用想象，OpenAI在推出Image、GPT-5等成功產品時，支持量就激增。你會發現客戶帶來的問題類型各不相同。

所以，這并不是簡單地把所有幫助中心文章都塞進AI代理。你需要大致明白自己能構建什么。最初的第一步是，比如你有人類支持代理，AI會先給出建議：“我認為這是正確的做法?！?/p>

然后你會得到人類反饋：這是個好建議，或者這是個壞建議。接著你可以回頭分析，找出AI的缺點或盲點，并思考如何解決。一旦掌握了這些，你就可以提高自主權，不再需要向人類建議，而是直接把答案展示給客戶。

之后，我們可以進一步增加復雜度。比如，之前只是基于幫助中心文章回答問題，現在可以添加新功能：我可以直接給客戶退款，也可以向工程團隊提出功能請求。如果從第一天就做這些，控制復雜性會非常困難。所以我們建議逐步積累，再逐步增加功能。

從“高控制、低自主”起步的漸進式自主

主持人

：核心是動態授權模型，從嚴控起步，隨著AI可靠性得到驗證，逐步擴大其自主權。這是一個基于信任增長的漸進過程。

Aishwarya Naresh Reganti：我認為更高級的概念在于AI系統的行為校準。事先預測系統表現幾乎不可能，那該怎么辦？關鍵是不能破壞客戶或最終用戶體驗。保持原有流程，但移除人類的控制權，而且并沒有唯一正確的做法。

你可以自主決定如何限制權限。另一個限制自主性的例子是預授權用例。保險預授權非常適合AI，因為臨床醫生花費大量時間預先批準血液檢查、核磁共振等。有些案例比較容易實現，比如MRI和阻滯檢測——一旦掌握患者信息，AI就能處理批準流程；而像侵入性手術等風險較高的操作，則不適合完全交由AI。

因此，你可以大致判斷哪些用例需要人工審核或循環介入，哪些適合AI處理。在整個過程中，還要記錄人類的操作，以此構建一個改進系統的飛輪。這樣既不影響用戶體驗，也不削弱信任，同時通過記錄人類原本的決策來持續優化系統。

主持人

：你建議的進階策略是：從高控制、低主動的版本開始，逐步增加自動化。例如，編碼助手 V1 做內聯補全，V2 生成可審核的模塊，V3 自動提交 PR。市場助理 V1 起草文案，后續版本逐步自動化：V2 構建并運行多步驟戰役，V3 通過 A/B 測試跨渠道自動優化廣告活動。

AI 產品不同，它們是非確定性的，用戶體驗也是非確定性的。人們會看到不同的內容、輸出和聊天對話，甚至界面設計也可能不同。而且輸出顯然是非終結性的，這既是問題也是挑戰。

Aishwarya Naresh Reganti：我們都比跟著一堆按鈕走更自在，所以使用 AI 產品的門檻要低得多，因為你可以像和人類一樣自然交流。但這也是問題所在：我們有很多交流方式，你要確保意圖被正確傳達，并觸發正確的行動。因為大多數系統是確定性的，你希望得到確定性的結果，但非確定性技術就比較復雜。

主持人

：設計時需權衡自主與控制。人們常急于追求理想模型，如V3，卻因實現困難而受挫，甚至輕易放棄。

Kiriti Badam：沒錯。在達到V3之前，你需要對很多事情有信心。你很容易不知所措，代理在百種方式上出錯，你不可能全部統計并修正。即使學會了評估流程，如果起點錯誤，也很難糾正。從小處、高控制、低能動性開始，迫使你思考到底要解決什么問題——我們叫“問題優先”。

顯而易見，卻常被忽視：AI進步讓人一頭扎進解決方案的復雜性，而忘記真正要解決的問題。

Aishwarya Naresh Reganti：所以大多數時候，如果你對問題本身著迷，并且非常了解自己的工作流程，你會知道如何隨著時間推移改進你的客服，而不是一開始就隨便打個客服，假設它能成功。我甚至會說，如果有人賣給你一鍵代理，那純粹是營銷。你不想為這種想法買單。

我更愿意選擇那種“我們會為你建造這條流水線”的公司，他們會隨著時間學習并構建一個改進的飛輪，而不是一個開箱即用的產品。要替換任何關鍵工作流程或構建能夠帶來顯著投資回報的系統，即使你擁有最好的數據層和基礎設施層，通常也需要四到六個月的工作時間。

超越技術的領導力、文化與流程重構

主持人

：你在成功打造AI產品的公司中還看到哪些模式和工作方式？人們最常陷入的陷阱是什么？

Aishwarya Naresh Reganti：我把成功看作一個三維三角，但不總是技術性的。每一個技術問題首先都是人的問題。我們合作過的公司，成功通常來自三點：優秀的領導者、良好的文化和技術能力。

在領導者方面，很多公司的領導者在過去10到15年里建立了直覺，并因此備受推崇。但有了AI，這些直覺必須被重新學習，領導者也必須保持脆弱性。

我曾與Rackspace的首席執行官Gagan共事。他每天早上4點到6點都會專門用來趕上AI的進度，不安排會議，只收聽最新的AI播客或信息。他甚至會在周末舉辦編程聚會。我認為領導者必須回歸親力親為，不是為了執行任務，而是為了重建直覺。

你必須接受自己的直覺可能不對，甚至可能是房間里最笨的人，并愿意向每個人學習。這是那些打造成功產品的公司的顯著區別，因為這引入了自上而下的策略。

如果一群工程師不信任技術或對其期望不一致，你就很難爭取到領導者的支持。很多同事說，領導者根本不了解AI能解決問題的程度，或者以為隨便寫點代碼就能上環境。你真的需要了解AI今天的能力范圍，才能指導公司內部的決策。

第二個是文化。我合作的很多企業并不是AI原生的，他們引入AI往往是因為競爭對手在做。雖然很多用例已經成熟，但過程中常伴隨FOMO和對被取代的恐懼。

領域專家在構建有效AI產品中至關重要，因為你需要咨詢他們來定義AI的理想行為。但我也遇到過很多領域專家不愿交流，因為他們覺得工作受到威脅。這一切還是源于領導者。

你需要建立一種賦權文化，讓員工明白AI是用來融入工作流程、讓生產力提升十倍的工具，而不是取代他們的威脅。你希望整個組織團結一致，讓AI為你工作，而不是讓員工試圖守住自己的飯碗。

第三個是技術部分。成功的人非常執著于理解自己的工作流程，并明確哪些部分適合AI，哪些需要人工。

自動化通常不是單靠AI代理就能解決的，往往需要機器學習模型和確定性代碼配合。你需要專注于理解工作流程，才能為問題選擇合適的工具，而不是執著于技術本身。另一個模式是理解使用非確定性API的理念，這意味著AI開發生命周期結構不同，迭代速度很快。關鍵是能否快速迭代并提供足夠的數據來估算行為，從而制造出飛輪。

截至目前，關鍵不在于成為第一家擁有代理的公司，而在于是否組裝好了合適的飛輪以便持續改進。如果有人說“我們有一鍵代理，兩三天就能部署并顯示顯著提升”，我會持懷疑態度。這不是因為模型不存在，而是因為企業數據和基礎設施通常非?；靵y，存在大量技術債務。

主持人

：在我們進入這個框架的其他話題之前，還有什么你認為大家需要特別了解的嗎？

Aishwarya Naresh Reganti：我們最常被問到的問題是：如何判斷是否需要進入下一階段，或者當前階段是否已校準足夠？其實沒有嚴格的規則書，關鍵是盡量減少意外。

比如，如果你每隔一兩天校準一次，卻發現沒有新的數據分布模式，用戶的使用方式也趨于一致，你獲得的信息量變得非常少，這時就知道可以進入下一階段了。判斷標準很簡單：當你不再收到新信息時，就是準備好了。

但也要理解，有時會有事件徹底破壞系統校準。例如，GPT-4o被棄用，大多數公司必須切換到GPT-5，而兩者特性差異巨大，這就意味著你的校準失效了，必須重做。

此外，用戶行為也會隨時間演變。即使是消費品，你現在與ChatGPT交流的方式也不同于兩年前，因為你知道它的能力提升了。當系統能解決一個任務時，人們會興奮，并想在其他任務上嘗試。

我們曾為核保人開發過一個系統，幫助他們從30到40頁的協議文件中篩選政策信息以批準貸款。起初的三四個月，大家印象深刻，甚至報告了工作時間的變化。但隨后我們發現，他們因興奮而開始提出未預料到的深刻問題。例如，他們會直接上傳整個申請文件，問：“對于這種情況，之前的核保人是怎么做的？”

對用戶來說，這似乎是自然延伸，但對產品架構卻是巨大挑戰。現在系統不僅要知道政策X、Y、Z，還需要理解貸款背后的含義，如收入范圍、地理區域等，并分析歷史文件來給出答案。

所以，看似自然的用戶需求，對開發者可能很難實現。當你發現用戶行為發生這種演變時，就知道需要回頭重新校準了。

主持人

：從產品角度來看，你認為明年的AI會是什么樣子？請給我們一個你認為未來會怎樣發展的愿景，比如到2026年底

Kiriti Badam：我認為背景Agent潛力巨大。AI目前難以創造價值，主要是因為缺乏上下文理解，而這源于它未連接到工作發生的實際場景。通過賦予代理更多背景信息，它能理解你的優化指標和活動意圖，從而主動提供價值。

例如，我們已通過ChatGPT實現了每日更新，提示你可能關心的事項，激發新的思考。擴展到復雜任務，如編碼時，它甚至能自動修復工單并生成補丁供你在一天開始時審閱。這將是2026年產品發展的強勁方向。

Aishwarya Naresh Reganti：我全力支持2026年的多模態體驗。2025年我們在生成與理解上均有進步，但人類本質上是多模態生物，交流中包含大量非語言信號，如點頭或表情，這些維度尚未被充分探索。

更好的多模態體驗將帶來更接近人類的對話豐富度。此外，多模態理解的提升將能處理大量手寫文檔和混亂PDF等現有模型難以應付的數據，釋放巨大的信息價值。

PS：如果你對AI大模型領域有獨特的看法，歡迎掃碼加入我們的大模型交流群。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.