337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

復盤50+個實戰案例,終于找到了AI產品落地的關鍵

0
分享至


盡管技術飛速進步,許多團隊在將AI融入實際業務時,卻陷入迭代混亂、投入巨大而收效甚微的困境。

Aishwarya Naresh Reganti與Kiriti Badam對此有著截然不同的清醒洞察。

Kiriti在OpenAI領導Kodex團隊,擁有在谷歌構建十年AI基礎設施的深厚背景;Ash則是Alexa與微軟的早期AI研究員,發表了超過35篇論文。他們共同主導了從亞馬遜、Databricks到眾多初創企業在內的超過50個AI產品部署,深諳其中溝壑。

在本次深度對談中,他們直指核心:問題往往不在于模型能力,而在于方法謬誤。

行業癡迷于追逐“全自動代理”的炫目未來,卻忽略了AI與非AI產品的根本性差異——非確定性。這導致團隊常常從錯誤的地方開始,在復雜性的泥潭中掙扎,最終迷失了本該解決的真實問題。

他們提出一套被反復驗證的務實框架:放棄對“終極智能”的一步到位幻想,轉向一種“漸進式自主”的產品哲學。

即從高控制、低風險的場景起步,構建持續學習和校準的“飛輪”,隨著信任的積累逐步移交自主權。這不僅關乎技術路徑,更涉及領導力重塑、組織文化轉型以及對工作流程的深刻解構。

以下便是兩位實戰派專家帶來的完整經驗凝結,enjoy~

擁抱非確定性與控制權的權衡

主持人

:我們一起寫了一篇客座文章。他們有一個非常關鍵的洞見,就是
構建AI產品與開發非AI產品非常不同

Aishwarya Naresh Reganti:大多數人往往忽視這種非確定性。你不知道用戶會如何使用你的產品,也不知道大型語言模型會如何回應。第二個區別是能動控制權的權衡。每次你把決策能力交給智能系統時,你其實是在放棄你那邊的某種控制權。

Kiriti Badam:因此,我們建議逐步構建。當你從小處開始時,它迫使你思考你要解決的問題。在AI的這些進步中,一個簡單而滑溜的路就是不斷思考解決方案的復雜性,而忘記你正在解決的問題。

Aishwarya Naresh Reganti:這并不是說你是第一家在競爭對手中擁有經紀人的公司。關鍵是你是否已經建立了正確的飛輪,以便隨著時間推移不斷改進。

主持人

:你認為當前公司在開發AI產品時,主要遇到了哪些問題?進展如何?

Aishwarya Naresh Reganti:我認為2025年和2024年有很大不同。第一,懷疑情緒明顯減少了。去年很多領導者認為這可能只是又一波加密貨幣浪潮,持懷疑態度。當時的很多用例更多是對你數據的閑聊,就自稱是AI產品。

今年,公司們開始重新思考用戶體驗和工作流程,真正理解到必須拆解和重構流程,才能打造成功的AI產品。這是精彩之處。

糟糕的是執行依然很混亂。這就像三歲馬場,沒有戰術手冊,沒有教科書,你真的需要邊做邊摸索。而且AI生命周期,無論是部署前還是部署后,都與傳統軟件生命周期有很大不同。

傳統角色之間的舊合同和交接,比如產品經理、工程師和數據人員,現在已經被打破。人們正在適應新的合作方式,擁有相同的反饋循環。以前,項目經理、工程師都有自己的優化反饋循環。

現在你們可能需要坐在同一個房間里,一起看“試劑痕跡”,或者說數據反饋,共同決定產品應該如何表現。這是一種更緊密的協作形式,公司們還在摸索中,這也是我今年在咨詢業務中看到的情況。

我要強調,構建AI系統和軟件系統有相似之處,但也有一些東西從根本上改變了開發方式。其中一個常被忽視的就是非確定性。你使用的是一個非確定性的API,而不是傳統軟件。

在傳統軟件中,比如Booking.com,你有一個完善的決策引擎。你想在舊金山預訂兩晚,產品設計會將你的意圖轉化為具體動作,你點擊按鈕、填寫表單,最終實現意圖。

但在AI產品中,這一層被一個流動的界面取代,主要是自然語言。這意味著用戶可以用無數種方式表達意圖。輸入端是不可預測的。輸出端,你面對的是一個非確定性的概率API。大型語言模型對提示非常敏感,且基本是黑箱。你不知道輸出會是什么樣子。

所以,你既不知道用戶會如何使用產品,也不知道模型會如何響應。你在處理輸入、輸出和過程,對這三者都不完全了解。你必須試圖預判行為并為此做準備。

這就引出了第二個區別:代理控制權的權衡。

很多人癡迷于構建能自主完成任務的系統。但每次你把決策能力交給智能系統時,你其實是在放棄某種控制權。你必須確保你的代理已經贏得了信任,足夠可靠。這就是權衡所在:給AI更多自主權,你就會失去一些控制權,因此必須確保系統隨著時間積累了足夠的信任。

主持人

:傳統軟件追求確定性,而AI具有非確定性。其核心挑戰在于如何權衡自動化與人類控制,這正深刻改變產品設計的根本邏輯。

Kiriti Badam:這是對你提供的文本進行的精簡和潤色版本。我保留了核心的“優勝美地徒步”類比、關于“漸進式自主”的邏輯,以及“好事與壞事”的辯證觀點,主要刪減了口語中的重復、自我修正和冗余的連接詞,使表達更緊湊有力。

是的,這絕對是你剛開始建造時,腦海中必須明確的關鍵點之一。

比如,想想你的目標是徒步優勝美地的半圓頂峰。你不會每天都去徒步,而是從小部分開始訓練,然后慢慢進步,最終達到終點。我覺得這和打造AI產品非常相似。因為你一開始在公司里并沒有所有的工具和背景,不能期望它立刻在最高層面工作甚至自我調整。

你需要有意識地從影響最小、人為控制最多的地方開始。這樣你才能很好地掌握當前的能力邊界和可實現的范圍,然后再慢慢轉向更具自主性、控制更少的部分。這能給你信心:“這就是我面臨的具體問題,AI能夠解決到這個程度?!?然后你再思考需要引入哪些背景、添加哪些工具來提升體驗。

所以我覺得這既是好事也是壞事。

好處在于,你不必一開始就面對外部那些復雜的AI代理能力而感到自己做不到。每個人都是從非常極簡的結構開始,然后不斷演變。壞處,或者說挑戰在于,當你試圖將這種“一鍵代理”融入公司時,你可能會被這種復雜性壓垮。但實際上,你可以慢慢“畢業”。

這非常重要,我們看到這種模式一再重復。

主持人:請以具體示例說明,如何從基礎的行動與控制模塊開始,逐步構建更復雜的AI代理或產品。

Kiriti Badam:例如,AI代理一個非常重要且普遍的應用是客戶支持。想象一下,你是一家客戶支持工單量很大的公司——其實不用想象,OpenAI在推出Image、GPT-5等成功產品時,支持量就激增。你會發現客戶帶來的問題類型各不相同。

所以,這并不是簡單地把所有幫助中心文章都塞進AI代理。你需要大致明白自己能構建什么。最初的第一步是,比如你有人類支持代理,AI會先給出建議:“我認為這是正確的做法?!?/p>

然后你會得到人類反饋:這是個好建議,或者這是個壞建議。接著你可以回頭分析,找出AI的缺點或盲點,并思考如何解決。一旦掌握了這些,你就可以提高自主權,不再需要向人類建議,而是直接把答案展示給客戶。

之后,我們可以進一步增加復雜度。比如,之前只是基于幫助中心文章回答問題,現在可以添加新功能:我可以直接給客戶退款,也可以向工程團隊提出功能請求。如果從第一天就做這些,控制復雜性會非常困難。所以我們建議逐步積累,再逐步增加功能。

從“高控制、低自主”起步的漸進式自主

主持人

:核心是動態授權模型,從嚴控起步,隨著AI可靠性得到驗證,逐步擴大其自主權。這是一個基于信任增長的漸進過程。

Aishwarya Naresh Reganti:我認為更高級的概念在于AI系統的行為校準。事先預測系統表現幾乎不可能,那該怎么辦?關鍵是不能破壞客戶或最終用戶體驗。保持原有流程,但移除人類的控制權,而且并沒有唯一正確的做法。

你可以自主決定如何限制權限。另一個限制自主性的例子是預授權用例。保險預授權非常適合AI,因為臨床醫生花費大量時間預先批準血液檢查、核磁共振等。有些案例比較容易實現,比如MRI和阻滯檢測——一旦掌握患者信息,AI就能處理批準流程;而像侵入性手術等風險較高的操作,則不適合完全交由AI。

因此,你可以大致判斷哪些用例需要人工審核或循環介入,哪些適合AI處理。在整個過程中,還要記錄人類的操作,以此構建一個改進系統的飛輪。這樣既不影響用戶體驗,也不削弱信任,同時通過記錄人類原本的決策來持續優化系統。

主持人

:你建議的進階策略是:從高控制、低主動的版本開始,逐步增加自動化。例如,編碼助手 V1 做內聯補全,V2 生成可審核的模塊,V3 自動提交 PR。市場助理 V1 起草文案,后續版本逐步自動化:V2 構建并運行多步驟戰役,V3 通過 A/B 測試跨渠道自動優化廣告活動。


AI 產品不同,它們是非確定性的,用戶體驗也是非確定性的。人們會看到不同的內容、輸出和聊天對話,甚至界面設計也可能不同。而且輸出顯然是非終結性的,這既是問題也是挑戰。

Aishwarya Naresh Reganti:我們都比跟著一堆按鈕走更自在,所以使用 AI 產品的門檻要低得多,因為你可以像和人類一樣自然交流。但這也是問題所在:我們有很多交流方式,你要確保意圖被正確傳達,并觸發正確的行動。因為大多數系統是確定性的,你希望得到確定性的結果,但非確定性技術就比較復雜。

主持人

:設計時需權衡自主與控制。人們常急于追求理想模型,如V3,卻因實現困難而受挫,甚至輕易放棄。

Kiriti Badam:沒錯。在達到V3之前,你需要對很多事情有信心。你很容易不知所措,代理在百種方式上出錯,你不可能全部統計并修正。即使學會了評估流程,如果起點錯誤,也很難糾正。從小處、高控制、低能動性開始,迫使你思考到底要解決什么問題——我們叫“問題優先”。

顯而易見,卻常被忽視:AI進步讓人一頭扎進解決方案的復雜性,而忘記真正要解決的問題。

Aishwarya Naresh Reganti:所以大多數時候,如果你對問題本身著迷,并且非常了解自己的工作流程,你會知道如何隨著時間推移改進你的客服,而不是一開始就隨便打個客服,假設它能成功。我甚至會說,如果有人賣給你一鍵代理,那純粹是營銷。你不想為這種想法買單。

我更愿意選擇那種“我們會為你建造這條流水線”的公司,他們會隨著時間學習并構建一個改進的飛輪,而不是一個開箱即用的產品。要替換任何關鍵工作流程或構建能夠帶來顯著投資回報的系統,即使你擁有最好的數據層和基礎設施層,通常也需要四到六個月的工作時間。

超越技術的領導力、文化與流程重構

主持人

:你在成功打造AI產品的公司中還看到哪些模式和工作方式?人們最常陷入的陷阱是什么?

Aishwarya Naresh Reganti:我把成功看作一個三維三角,但不總是技術性的。每一個技術問題首先都是人的問題。我們合作過的公司,成功通常來自三點:優秀的領導者、良好的文化和技術能力

在領導者方面,很多公司的領導者在過去10到15年里建立了直覺,并因此備受推崇。但有了AI,這些直覺必須被重新學習,領導者也必須保持脆弱性。

我曾與Rackspace的首席執行官Gagan共事。他每天早上4點到6點都會專門用來趕上AI的進度,不安排會議,只收聽最新的AI播客或信息。他甚至會在周末舉辦編程聚會。我認為領導者必須回歸親力親為,不是為了執行任務,而是為了重建直覺。

你必須接受自己的直覺可能不對,甚至可能是房間里最笨的人,并愿意向每個人學習。這是那些打造成功產品的公司的顯著區別,因為這引入了自上而下的策略。

如果一群工程師不信任技術或對其期望不一致,你就很難爭取到領導者的支持。很多同事說,領導者根本不了解AI能解決問題的程度,或者以為隨便寫點代碼就能上環境。你真的需要了解AI今天的能力范圍,才能指導公司內部的決策。

第二個是文化。我合作的很多企業并不是AI原生的,他們引入AI往往是因為競爭對手在做。雖然很多用例已經成熟,但過程中常伴隨FOMO和對被取代的恐懼。

領域專家在構建有效AI產品中至關重要,因為你需要咨詢他們來定義AI的理想行為。但我也遇到過很多領域專家不愿交流,因為他們覺得工作受到威脅。這一切還是源于領導者。

你需要建立一種賦權文化,讓員工明白AI是用來融入工作流程、讓生產力提升十倍的工具,而不是取代他們的威脅。你希望整個組織團結一致,讓AI為你工作,而不是讓員工試圖守住自己的飯碗。

第三個是技術部分。成功的人非常執著于理解自己的工作流程,并明確哪些部分適合AI,哪些需要人工。

自動化通常不是單靠AI代理就能解決的,往往需要機器學習模型和確定性代碼配合。你需要專注于理解工作流程,才能為問題選擇合適的工具,而不是執著于技術本身。另一個模式是理解使用非確定性API的理念,這意味著AI開發生命周期結構不同,迭代速度很快。關鍵是能否快速迭代并提供足夠的數據來估算行為,從而制造出飛輪。

截至目前,關鍵不在于成為第一家擁有代理的公司,而在于是否組裝好了合適的飛輪以便持續改進。如果有人說“我們有一鍵代理,兩三天就能部署并顯示顯著提升”,我會持懷疑態度。這不是因為模型不存在,而是因為企業數據和基礎設施通常非?;靵y,存在大量技術債務。

主持人

:在我們進入這個框架的其他話題之前,還有什么你認為大家需要特別了解的嗎?

Aishwarya Naresh Reganti:我們最常被問到的問題是:如何判斷是否需要進入下一階段,或者當前階段是否已校準足夠?其實沒有嚴格的規則書,關鍵是盡量減少意外。

比如,如果你每隔一兩天校準一次,卻發現沒有新的數據分布模式,用戶的使用方式也趨于一致,你獲得的信息量變得非常少,這時就知道可以進入下一階段了。判斷標準很簡單:當你不再收到新信息時,就是準備好了。

但也要理解,有時會有事件徹底破壞系統校準。例如,GPT-4o被棄用,大多數公司必須切換到GPT-5,而兩者特性差異巨大,這就意味著你的校準失效了,必須重做。

此外,用戶行為也會隨時間演變。即使是消費品,你現在與ChatGPT交流的方式也不同于兩年前,因為你知道它的能力提升了。當系統能解決一個任務時,人們會興奮,并想在其他任務上嘗試。

我們曾為核保人開發過一個系統,幫助他們從30到40頁的協議文件中篩選政策信息以批準貸款。起初的三四個月,大家印象深刻,甚至報告了工作時間的變化。但隨后我們發現,他們因興奮而開始提出未預料到的深刻問題。例如,他們會直接上傳整個申請文件,問:“對于這種情況,之前的核保人是怎么做的?”

對用戶來說,這似乎是自然延伸,但對產品架構卻是巨大挑戰。現在系統不僅要知道政策X、Y、Z,還需要理解貸款背后的含義,如收入范圍、地理區域等,并分析歷史文件來給出答案。

所以,看似自然的用戶需求,對開發者可能很難實現。當你發現用戶行為發生這種演變時,就知道需要回頭重新校準了。

主持人

:從產品角度來看,你認為明年的AI會是什么樣子?請給我們一個你認為未來會怎樣發展的愿景,比如到2026年底

Kiriti Badam:我認為背景Agent潛力巨大。AI目前難以創造價值,主要是因為缺乏上下文理解,而這源于它未連接到工作發生的實際場景。通過賦予代理更多背景信息,它能理解你的優化指標和活動意圖,從而主動提供價值。

例如,我們已通過ChatGPT實現了每日更新,提示你可能關心的事項,激發新的思考。擴展到復雜任務,如編碼時,它甚至能自動修復工單并生成補丁供你在一天開始時審閱。這將是2026年產品發展的強勁方向。

Aishwarya Naresh Reganti:我全力支持2026年的多模態體驗。2025年我們在生成與理解上均有進步,但人類本質上是多模態生物,交流中包含大量非語言信號,如點頭或表情,這些維度尚未被充分探索。

更好的多模態體驗將帶來更接近人類的對話豐富度。此外,多模態理解的提升將能處理大量手寫文檔和混亂PDF等現有模型難以應付的數據,釋放巨大的信息價值。

PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2年和領導開房410次!從臨時工“睡”成處長,南航女經理升遷之路

2年和領導開房410次!從臨時工“睡”成處長,南航女經理升遷之路

就一點
2026-03-28 17:42:50
年薪849萬,年終獎1000萬,中國“最貴董秘”朱旭,49歲依然單身

年薪849萬,年終獎1000萬,中國“最貴董秘”朱旭,49歲依然單身

牛牛叨史
2025-11-29 03:44:54
事情鬧大了,日本內閣連發公告,中國的態度,告訴了世界一個事實

事情鬧大了,日本內閣連發公告,中國的態度,告訴了世界一個事實

體育小柚
2026-03-26 17:27:03
伊朗媒體:以美襲擊伊朗核設施

伊朗媒體:以美襲擊伊朗核設施

新華社
2026-03-27 23:30:33
剛到中國就“變臉”?黃循財公然挑戰美霸權,并對華發出重大邀請

剛到中國就“變臉”?黃循財公然挑戰美霸權,并對華發出重大邀請

余生嫵媚小妖精
2026-03-28 17:42:40
廣州一“電雞”狂飆撞公交車被判全責

廣州一“電雞”狂飆撞公交車被判全責

新快報新聞
2026-03-28 15:42:07
審問3小時,日本軍官底細被扒出,中方一錘定音,高市早苗看著辦

審問3小時,日本軍官底細被扒出,中方一錘定音,高市早苗看著辦

諦聽骨語本尊
2026-03-26 13:43:30
俄羅斯人蓋棺定論赫魯曉夫:五功五過,把中國從盟友搞成敵人才是致命傷

俄羅斯人蓋棺定論赫魯曉夫:五功五過,把中國從盟友搞成敵人才是致命傷

寄史言志
2026-03-27 18:16:05
52年岳飛后人找毛主席求安排工作,主席聽完沉默片刻,說了句話讓他當場愣住

52年岳飛后人找毛主席求安排工作,主席聽完沉默片刻,說了句話讓他當場愣住

老杉說歷史
2026-03-13 23:00:06
中國腦梗人數全球第一:肉吃得越少,血管就越通,真的嗎?

中國腦梗人數全球第一:肉吃得越少,血管就越通,真的嗎?

蜉蝣說
2026-03-24 10:00:57
形勢已然大變!西方媒體集體改口:中國,已無需再向世界證明什么

形勢已然大變!西方媒體集體改口:中國,已無需再向世界證明什么

阿訊說天下
2026-03-28 12:38:47
以色列收到1.28萬份戰火損失賠償申請

以色列收到1.28萬份戰火損失賠償申請

財聯社
2026-03-26 23:22:07
吳京參加電影《鏢人》線下活動時,被網友拍到面部按壓后出現“小坑”,本人回應:含水量高了些,身體還不錯

吳京參加電影《鏢人》線下活動時,被網友拍到面部按壓后出現“小坑”,本人回應:含水量高了些,身體還不錯

瀟湘晨報
2026-03-27 17:13:10
唯一女兒去世后,八旬母親花光退休金瘋狂網購!快遞箱在家堆積如山,30余人連續干了12小時,清走10余車雜物

唯一女兒去世后,八旬母親花光退休金瘋狂網購!快遞箱在家堆積如山,30余人連續干了12小時,清走10余車雜物

極目新聞
2026-03-27 19:26:54
施瓦辛格28歲私生子參賽健美賽,親媽是保姆,網友:長一樣!

施瓦辛格28歲私生子參賽健美賽,親媽是保姆,網友:長一樣!

徐醇老表哥
2026-03-28 17:53:39
以權謀私!東莞市農業農村局原二級調研員陳福坤被“雙開”

以權謀私!東莞市農業農村局原二級調研員陳福坤被“雙開”

南方都市報
2026-03-28 17:22:17
媒體稱保羅會進入火箭教練組!搭檔烏度卡改造球隊,優勢隱患并存

媒體稱保羅會進入火箭教練組!搭檔烏度卡改造球隊,優勢隱患并存

金風說
2026-03-28 18:16:27
美官員稱中芯國際已向伊朗軍方提供芯片制造工具 外交部回應

美官員稱中芯國際已向伊朗軍方提供芯片制造工具 外交部回應

財聯社
2026-03-27 15:34:12
別不信,78歲想活過98歲,關鍵在兩性關系!這六句長壽密碼要牢記

別不信,78歲想活過98歲,關鍵在兩性關系!這六句長壽密碼要牢記

牛鍋巴小釩
2026-03-26 13:23:25
中國最“尷尬”的5個地級市:它們根本不該在本省,應該“改嫁”

中國最“尷尬”的5個地級市:它們根本不該在本省,應該“改嫁”

好笑娛樂君每一天
2026-03-26 01:22:35
2026-03-28 19:51:00
硅基觀察Pro incentive-icons
硅基觀察Pro
人工智能新時代的商業智庫和價值燈塔
869文章數 65關注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

45歲男子駕車時突發心梗離世 2天前還在外地跑馬拉松

頭條要聞

45歲男子駕車時突發心梗離世 2天前還在外地跑馬拉松

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財經要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

本地
房產
健康
藝術
軍事航空

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

房產要聞

6.8萬方!天河員村再征地,金融城西區開發全面提速

干細胞抗衰4大誤區,90%的人都中招

藝術要聞

中國油畫學會三十年藝術展 | 油畫選刊(一)

軍事要聞

美軍中東基地損失最新披露

無障礙瀏覽 進入關懷版