內(nèi)容來源:2026年2月12日,Peter Steinberger在Lex Fridman播客內(nèi)容分享。
分享嘉賓:Peter Steinberger彼得·斯坦伯格,奧地利程序員,OpenClaw開源項目創(chuàng)始人。
最近,整個科技圈都在熱議一只“龍蝦”。它不是海鮮,而是2026年開年現(xiàn)象級的開源AI項目——OpenClaw(養(yǎng)龍蝦)。
短短幾天,它在GitHub上狂攬18萬星,創(chuàng)下增長紀錄。但它的創(chuàng)始人Peter Steinberger卻輕描淡寫:這只是一個“實驗項目”。
一邊是席卷全球的熱度,一邊是創(chuàng)始人冷靜的定位,這種反差背后,到底藏著怎樣的顛覆性力量?
從一小時做出的原型,到讓扎克伯格、奧特曼親自體驗并爭相招攬,OpenClaw究竟做對了什么?
今天,我們整理了Peter彼得在Lex Fridman(萊克斯·弗里德曼)播客中的三小時深度對話。
你將看到:一個曾賣掉十億級公司的“bunout”(職業(yè)倦怠)程序員,如何重拾熱愛,親手點燃這場AI Agent(智能體)革命;他將分享“自修改軟件”的魔法、與加密貨幣投機者搶注賬號的“血淚史”,以及對“80%的App將消亡”的大膽預(yù)言。
這不僅僅是一個產(chǎn)品的成功故事,更是一場關(guān)于技術(shù)哲學(xué)、創(chuàng)業(yè)心態(tài)與未來人機協(xié)作的深刻思考。
無論你是開發(fā)者、創(chuàng)業(yè)者,還是對未來感到好奇的普通人,都能從中獲得啟發(fā)。
![]()
一、OpenClaw的誕生:從一小時原型到現(xiàn)象級開源項目
1.魔法時刻:一條語音消息觸發(fā)的AI交互革命
我從去年四月份就想要一個AI個人助手。比如,把我所有的WhatsApp(類似微信的即時通訊應(yīng)用)數(shù)據(jù)拉出來,然后進行查詢。
那時候我們有GPT-4.1,它帶有一百萬上下文窗口。我把所有數(shù)據(jù)導(dǎo)進去,然后問它一些問題,比如“”這段友誼的意義是什么?”,得到了一些非常深刻的結(jié)果。我把結(jié)果發(fā)給朋友們,他們都感動得眼眶濕潤了。
那個時候,我就已經(jīng)感受到AI交互的潛力。但后來我想,所有的實驗室都會做這個,所以我就去做別的事了。
比如Viptunnel(某項目名稱),這是一個周末黑客項目。那時候還是Claude Code(由AI驅(qū)動的編程工具)時代,項目處于早期實驗和玩耍階段。
那個時候,我有WhatsApp的實驗,也有Viptunnel的實驗,但兩個都感覺不是正確答案。后來我想到,直接把WhatsApp連接到Claude Code,一步到位。
當CLI(命令行界面)消息進來時,我用“-p”參數(shù)調(diào)用CLI,它施展魔法后返回字符串,再發(fā)回WhatsApp。這個功能我只用一個小時就做出來了。當時感覺已經(jīng)很酷了,就像“哦,我可以跟我的電腦說話了”。
但我還想要圖片支持,因為我經(jīng)常在prompt(提示詞)里使用圖片。我覺得這是給Agent提供更多上下文的一種非常高效的方式,Agent很擅長理解我的意思,即使是一張奇怪的裁剪截圖。所以我大量使用圖片,也想在WhatsApp里實現(xiàn)這個功能。
你知道的,當你走在路上看到一個活動海報,截個圖讓它幫忙看看你是否有時間參加、活動好不好、朋友們是否有興趣,圖片在這種場景下非常重要。因此,我又花了幾個小時才把這個功能搞定。
之后我就開始大量使用它。有趣的是,那正好是我和朋友們?nèi)ヱR拉喀什過生日旅行之前。在那里它甚至更好用,因為網(wǎng)絡(luò)雖然有點不穩(wěn)定,但WhatsApp總能正常發(fā)送消息,它在這方面做得真的很好。
所以我在旅行中用了很多次,讓它幫我翻譯內(nèi)容、解釋問題、查找地點,就像有一個幫你使用Google的助手。雖然基本上還沒有真正構(gòu)建完整功能,但已經(jīng)能做這么多事了。
那種體驗有種難以用語言表達的魔力。用聊天客戶端跟Agent對話,和坐在電腦前用Cursor(代碼編輯器)或者在終端里用Claude Code和CLI是完全不同的體驗。
能靠在椅子上跟它說話,這看似是一個很小的步驟,但在某種意義上,這是AI融入生活方式的一個相變,感受完全不一樣。
![]()
有人說「這里面沒有什么魔法,它就是做了這個、那個、還有那個」。而且感覺這幾乎像個愛好,就像Cursor或Perplexity(一款A(yù)I搜索引擎)的功能模塊一樣。
我想是的,有時候重新排列組合、再加入幾個新想法,就是你所需要的全部魔法了。這類創(chuàng)新往往是之前沒人做到,之后又讓人覺得如此顯而易見。
真正讓我看到未來可能性的,是一次意外的發(fā)現(xiàn)。
在大量使用這個工具之后,有一次我發(fā)了一條消息,只是一個隨機問題:“嘿,這家餐廳怎么樣?”
然后屏幕上出現(xiàn)了“正在輸入”的提示。我心想:等等,我沒做這個功能啊,它原本只支持圖片,到底在干什么?接著它就給出了回復(fù)。
我們當時正在城里四處逛。我用它時完全沒多想,因為有時候趕時間打字很麻煩,所以就發(fā)了語音消息,沒想到它居然直接處理了。我當時就說:“嘿!這家伙是怎么做到的?”
然后它告訴我:
“是的,這個瘋狂的家伙做了以下事情:他給我發(fā)了一條消息,但只是一個沒有文件擴展名的文件。于是我檢查了文件頭,發(fā)現(xiàn)它是Opus(音頻編碼)格式,就用ffmpeg(音視頻處理技術(shù))進行了轉(zhuǎn)換。我本想使用Whisper(音頻處理工具),但發(fā)現(xiàn)沒有安裝,不過找到了OpenAI的API key(密鑰),于是直接用Curl(命令行工具)把文件發(fā)給OpenAI進行轉(zhuǎn)錄,才有了現(xiàn)在的回復(fù)。”
我看著這條消息,不禁感嘆:“哇哦。”要知道,你沒有教它任何這些操作,Agent卻自己弄明白了,完成了所有的轉(zhuǎn)換和翻譯步驟。它自己找到了API,自己決定使用哪個程序,這一切都是自主完成的。
而你只是不經(jīng)意地發(fā)了一條語音消息,它就給出了回復(fù),而且處理方式非常聰明。因為如果走Whisper本地路徑,需要下載模型,速度會很慢。
所以這背后體現(xiàn)了豐富的世界知識和創(chuàng)造性解決問題的能力。當它面對“這是什么沒有擴展名的文件?”這樣的問題時,會主動去弄清楚。那個時刻讓我頓悟了,我被深深打動了。
2.成功密碼:開源創(chuàng)新與“玩”出來的顛覆力
OpenClaw的成功源于將開發(fā)過程變成了一場充滿樂趣的探索,感覺就像是在玩無限版的Factorio(一款工廠建設(shè)游戲),建造屬于自己的小游樂場。
我從來沒有像構(gòu)建這個項目一樣開心過。你看,一級Agent循環(huán),我能做什么?怎么巧妙地排隊消息?怎么讓它更像人?
我有了一個想法,因為循環(huán)里Agent總是會回復(fù)一些東西,但在群聊里你不一定總想讓Agent回復(fù)。所以我給了它一個不回復(fù)的選項。所以它可以選擇閉嘴,這樣感覺更自然。
然后是記憶,你想讓它記住東西。終極Boss可能是持續(xù)強化學(xué)習(xí),但我覺得我現(xiàn)在大概在第二三級,用Markdown文件和向量數(shù)據(jù)庫。然后你還能升級社區(qū)管理、網(wǎng)站和營銷。
![]()
很多人都喜歡問我一個問題:如果看2025年,那么多創(chuàng)業(yè)公司、那么多公司都在做Agent類的東西,或者聲稱在做。然后OpenClaw橫空出世把所有人都干翻了。
為什么是OpenClaw贏了?我認為,因為他們都太把自己當回事了。
事實上,你很難和一個只是來玩的人競爭。我想讓它有趣,我想讓它古怪。如果你看到網(wǎng)上所有那些龍蝦的東西,我覺得我做到了古怪。
很長時間以來,安裝它的唯一方式就是gitclone(克隆)、pnpmbuild(編譯)、pnpmgateway(運行),也就是通過git克隆代碼庫、使用pnpm進行構(gòu)建、以及通過pnpm配置網(wǎng)關(guān)的操作流程。
然后Agent非常有自我意識。它知道自己的源代碼是什么,理解自己是怎么運行的,知道文檔在哪里,知道自己跑的是哪個模型,知道你是否開了語音或推理模式。
我想讓它更像人,所以它理解自己的系統(tǒng),這使得Agent很容易就能你什么都不用做,你用prompt(提示詞)把它召喚出來,然后它就會修改自己的軟件。
所以,這種趣味性、開源特性以及自修改能力,極大地降低了用戶的參與門檻。我想,這正是它能夠在眾多Agent類項目中脫穎而出的關(guān)鍵。
![]()
二、技術(shù)哲學(xué)與未來展望:自修改軟件與App消亡預(yù)言
1.技術(shù)內(nèi)核:自修改能力與開發(fā)范式革新
① 自修改軟件:讓AI自主進化的底層邏輯
自修改軟件,大部分是Codex(OpenAI開發(fā)的AI代碼生成模型和編程助手)構(gòu)建的,但很多時候我在調(diào)試時會大量使用自省。
比如“嘿,你能看到什么工具?你能自己調(diào)用這個工具嗎?”或者“你看到了什么錯誤?讀一下源代碼,搞清楚問題出在哪里。”
我覺得這是一種非常有趣的方式,Agent用來調(diào)試自身,所以它很自然地讓每個人都能這樣做。它帶來了很多從沒寫過代碼的人提交的PR,我最后把它們叫做“prompt Requests”(提示請求)而不是“Pull Requests”(拉取請求)。
但我不想貶低這件事,因為每次有人提交了他們的第一個PR,對我們的社會來說都是一個勝利。不管它有多粗糙,你總得從某個地方開始。
我知道有很多人抱怨開源的PR質(zhì)量,那是另一個層面的問題。但在另一個層面上,我覺得非常有意義的是,我做了一個東西,人們喜歡它到愿意去學(xué)習(xí)開源是怎么運作的。以前進入這個門檻太高了,而有了Agent和合適的軟件,門檻一路降低。
此外,我還組織了另一種聚會,我叫它Cloud Code Anonymous(云代碼匿名會),現(xiàn)在改叫Agents Anonymous(Agent 匿名會),讓你知道靈感來源。
② 開發(fā)工作流:從工具革新到思維轉(zhuǎn)變
首先是在工具層面。
第一,是Claude Code。我的第一個接觸點是Claude Code,四月份,不太好但還行。這種突然在終端里工作的范式轉(zhuǎn)變很清新,但我還是很需要IDE(集成開發(fā)環(huán)境)因為它還不夠好。然后我大量實驗Cursor,不太喜歡很難開多個實例。
最終我回到了Claude Code作為主要工具。到了某個時候我有大概七個訂閱,每天用完一個,因為我已經(jīng)非常習(xí)慣同時開多個窗口并行工作了。
第二,是diff(差異對比工具)查看器。我用IDE非常少,主要用一個diff查看器。我越來越習(xí)慣不讀所有代碼了,不讀無聊的部分,因為大部分軟件就是數(shù)據(jù)進來,從一種形狀變成另一種形狀,存到數(shù)據(jù)庫里,取出來展示給用戶。
第三,是Agentic Engineering。
在我的一篇博客里有個圖叫“Agentic編程曲線”:X軸是時間,Y軸是復(fù)雜度。左邊是“請修復(fù)這個”的簡短prompt(提示詞)。中間是超級復(fù)雜的八個Agent、復(fù)雜編排、多工作區(qū)、Agent鏈、自定義子Agent工作流、18個slash命令、大型全棧功能。
然后精英級別是隨著時間你又回到了禪意的短prompt(提示詞):“嘿,看看這些文件然后做這些修改”。
我其實叫它Agentic陷阱。很多人第一次接觸然后開始Vibe Coding(氛圍編碼方式)。我其實覺得Vibe Coding是個貶義詞。我更喜歡Agentic Engineering(智能體工程),我跟別人說我做 Agentic Engineering。
總之,人們開始嘗試這些工具,有建設(shè)者心態(tài)的人會非常興奮。但你得去玩它,就像你得先玩吉他才能彈出好聽的音樂。不是摸一次就能行云流水。這是一種需要學(xué)習(xí)的技能。
![]()
其次是在思維認知層面。
第一,你得稍微學(xué)習(xí)Agent的語言,理解它們哪里擅長哪里需要幫助。
你得考慮Codex或Claude怎么看你的代碼庫。它們每次開啟新會話的時候?qū)δ愕捻椖恳粺o所知。你的項目可能有十萬行代碼。所以你得幫Agent一點,記住上下文大小是個限制,引導(dǎo)它們看該看的地方。這通常不需要很多工作,但考慮它們的視角是有幫助的。
聽起來很奇怪,它又不是活的。但它們每次都從零開始。我有系統(tǒng)理解,所以用幾個指引我就能馬上告訴它“嘿,要改這里,你需要考慮這個、這個和這個”。
然后它們會去找和看,它們對項目的理解永遠不完整,因為全部塞不進去。所以你得引導(dǎo)它們看哪里以及怎么處理問題。
第二,有些小技巧有時候很有用,比如“不著急,慢慢來”。
聽起來很蠢,但這是一個非直覺的東西。就像我寫代碼進入心流時,如果架構(gòu)不對會感到摩擦。prompt(提示詞)的時候也一樣,如果什么東西花了太長時間,也許是我思路有問題,也許是架構(gòu)上的誤解。你隨時可以按Escape(退出鍵)停下來,看看問題在哪里。
你得像和一個非常能干的工程師討論一樣。但也不要把你的世界觀強加給它。讓Agent做它擅長的事情,它可能有更好的想法。
所以有一定程度的接受是必要的:代碼不會完美,我會做得不一樣,但這是一個可用的方案,將來如果真的太慢或有問題,我們隨時可以重做。
2.模型對比:Opus與Codex的差異化應(yīng)用
目前兩個大的競爭者,Claude Opus4.6(克勞德·奧普斯4.6版本)和通過Codex使用的GPT-5(OpenAI專門給Agent編程優(yōu)化)這兩個模型,我有很多話要說。
首先,在通用模型方面,Opus是最好的。
對于OpenClaw,Opus在角色扮演方面非常出色,真的能進入你給它的角色。它在遵循指令方面從很差變到了很好,取得了很大進步。它通常很快就會嘗試做事,更傾向于試錯。用起來很舒服。總的來說,Opus有點像是太美國了。
你也知道Codex團隊很多人是歐洲人,所以也許這不只是巧合。但Anthropic(人工智能公司)也修了一些。Opus以前會一直說“你說得完全對”,這已經(jīng)成了一個梗。我現(xiàn)在聽到這句話就受不了,不是在開玩笑。
其次,模型之間存在差異。
Opus像那個有點傻但很有趣的同事,你把他留在身邊。而Codex像角落里你不想搭話的怪人,但很靠譜,能把事情做完。
歸根結(jié)底,如果你是一個熟練的駕駛員,你可以用任何最新一代的模型得到好結(jié)果。
我更喜歡Codex,因為它不需要那么多表演。它默認就會讀大量代碼。而Opus你得推它更用力,因為它就像“我能開干了嗎?我能開干了嗎?”然后它就飛速跑出去了,給你一個非常局部的解決方案。
我覺得區(qū)別在后訓(xùn)練,不是原始模型智能差多少。只是它們被給予了不同的目標。沒有哪個模型在所有方面都更好。
最后,代碼質(zhì)量方面,Opus略高一籌。
如果駕馭得好,Opus有時候甚至能給出更優(yōu)雅的解決方案。但需要更多技巧。用Cloud Code并行開很多會話更難,因為它更交互式。而Codex更像是你先討論,然后它消失20分鐘。它可以非常非常持久地工作直到搞定。如果有一個明確的目標,模型會非常努力地達到那里。
最終它們需要差不多的時間,但Claude方面更多是試錯,Codex有時候會想太多。我更喜歡那種干巴巴的、我不需要讀太多的版本。
![]()
3.架構(gòu)選擇:Skills+CLI(命令行界面)優(yōu)于MCP的實踐
半年前所有人都在談?wù)揗CP(模型上下文協(xié)議),而我說“MCP算了吧,每個MCP不如做成一個CLI”。現(xiàn)在這個項目甚至沒有MCP支持(嚴格來說有,但不在核心層),沒人抱怨。
我的方法是,如果你想用更多功能擴展模型,你就做一個CLI(命令行界面),模型可以調(diào)用那個CLI(命令行界面)。它可能第一次搞錯,調(diào)用幫助菜單,然后按需加載到上下文中它需要的東西。它只需要一句話知道這個CLI(命令行界面)存在。
Skills(人工智能技能)其實就很完美:一句話解釋這個Skill,模型加載這個Skill,Skill解釋了CLI(命令行界面),模型使用CLI。
所以,MCP對比Skills,MCP基本上要死了。MCP是更結(jié)構(gòu)化的東西,一種與API、數(shù)據(jù)庫、服務(wù)、文件通信的協(xié)議。Skills更多是「我應(yīng)該怎么工作」,是流程、輔助腳本和prompt(提示詞),通常用半結(jié)構(gòu)化的自然語言寫的。如果模型足夠聰明,Skills技術(shù)上可以替代MCP。
事實上,我覺得主要的美妙之處在于模型非常擅長調(diào)用Unix(操作系統(tǒng))命令。所以你加另一個CLI就只是加了另一個Unix命令。而MCP需要在訓(xùn)練中添加,不是模型天然的東西,需要非常特定的語法,最大的問題是不可組合。
比如我有一個天氣服務(wù)返回溫度、降雨、風(fēng)力等一大堆數(shù)據(jù)。作為模型,我總是得把整個大blob(數(shù)據(jù)塊)拿回來,用它填滿我的上下文,然后挑我要的。沒有辦法讓模型自然地過濾,除非我主動在MCP里加過濾功能。
但如果我做成CLI(命令行界面),模型可以加一個jq(Linux中用于JSON數(shù)據(jù)處理的輕量級命令行工具)命令自己過濾,只拿它需要的。甚至可以組合成腳本做計算,只給我精確的輸出,上下文零污染。
當然你可以用子Agent之類的解決,但那都是變通方案。
MCP推動了很多公司去做API,這是好的,但是MCP默認污染你的上下文,加上大部分MCP做得不好,總體來說不是一個很有用的范式。
4.未來預(yù)言:個人Agent將重塑80%的App生態(tài)
未來,我覺得個人Agent會成為最好的編程伙伴,這是未來的發(fā)展方向,它會越來越像我們的操作系統(tǒng)。
現(xiàn)在,我已經(jīng)為Open Claw添加了子Agent支持和TTY(電傳打字機)支持,所以它可以運行Claude Code或Codex。當前的聊天界面可能還只是早期形態(tài),相當于給Agent復(fù)制了Google的模式:一個輸入框加上一個聊天界面。
這就像電視剛發(fā)明時的樣子,未來一定會有更好的與模型溝通的方式。
當Agent能夠基于全面的上下文提供服務(wù)時,大部分單一功能的App將失去存在的必要。
比如,它已經(jīng)知道我在哪里,就可以根據(jù)我的位置推斷我可能會做出不好的飲食決定;它可以根據(jù)我的睡眠質(zhì)量或者壓力狀況來調(diào)整我的健身計劃;它擁有比任何App都多得多的上下文信息,能夠做出更優(yōu)的決策;它還可以按照我喜歡的方式展示UI。
那我為什么還需要單獨的App呢?為什么還要為這些App支付額外的訂閱費用?為什么還需要Eight Sleep(一家美國智能睡眠科技公司)的App來控制我的床?我的Agent已經(jīng)知道我在哪里,還能幫我關(guān)掉那些我不用的東西。
未來,個人Agent可能會淘汰80%的App,但同時也會催生新的服務(wù),這將帶來巨大的變革性影響。
比如說,我想給我的Agent一筆津貼,比如100塊錢,讓它幫我解決問題。如果我讓它幫我點外賣,它可能會使用某個服務(wù),也可能會使用一個叫“租個人類”的服務(wù)。
我不在乎它具體怎么實現(xiàn),我只在乎問題能否解決。這就為新公司提供了發(fā)展空間。也許不是所有App都會消失,有些可能會轉(zhuǎn)型成API。
而且,不管那些App愿不愿意,它們最終都會變成API。因為我的Agent能夠弄清楚如何操作我的手機,在Android系統(tǒng)上已經(jīng)有人在做這件事了。
![]()
![]()
三、開源堅守與人生啟示:從職業(yè)倦怠到熱愛重燃
1.開源底線:巨頭爭奪下的項目獨立性
最近我的收件箱里收到了大公司的offer,大家都想約我聊15分鐘。其中Meta(元公司)和OpenAI看起來最有趣,現(xiàn)在我還沒完全敲定,我的條件是項目保持開源。也許會像Chrome(谷歌)和Chromium(谷歌開源瀏覽器)的模式。(注:Peter彼得最后選擇加入了OpenAI)
我覺得這個項目太重要了,不能交給一家公司變成他們的一部分。
在個人層面上,我從來沒在大公司工作過,我很好奇。不管我宣布什么,肯定會有人說“他賣了”,但我想告訴大家,項目會繼續(xù)。
不管最后怎樣,如果不行,我就繼續(xù)做自己的事。我跟他們說我不是為了錢才做的。
別人使用你做的東西是最大的贊美,也說明他們真的在乎。
當然錢是一種好的贊美,但我想要的是樂趣和影響力,這最終決定了我的選擇。
我為PSPDFKit(一款PDF軟件開發(fā)工具包)燃燒了太長時間太亮了。讓我倦怠的主要是人的事,比如和聯(lián)合創(chuàng)始人的分歧、沖突,與客戶的高壓狀況,最終磨垮了我。
幸運的是我們收到了一個很好的offer,把公司帶到下一個階段。我已經(jīng)花了兩年讓自己變得可有可無,所以我可以離開了。
然后我坐在屏幕前,感覺就像Austin Powers(電影角色名“奧斯汀·鮑爾斯”,此處用作比喻失去能量的狀態(tài))被吸走了魔力。一切都沒了。我寫不出代碼了,只是盯著屏幕,感覺空虛,然后我就停了。
我訂了一張去馬德里的單程票,花了一些時間在那里。我覺得我需要補上生活。
如果你的想法是“拼命工作然后退休”,我不推薦。因為“從此享受生活”這個想法雖然吸引人,但實際上,我現(xiàn)在比任何時候都更享受生活。
2.對初學(xué)者的啟示:以熱愛驅(qū)動的成長路徑
玩是最好的學(xué)習(xí)方式。如果你心里有個想做的東西,就去做,不需要完美。我做了一大堆自己不用的東西,這不重要,旅程才重要。
我從來沒有像現(xiàn)在這樣享受構(gòu)建東西,因為我可以專注于難的部分了。我一直以為我喜歡編程,但實際上我喜歡的是構(gòu)建。
而且你有一個無限耐心的回答機器。它能在任何復(fù)雜度層面解釋任何東西。以前我得去Stack Overflow問或者在X上問,兩天后也許能得到一個回復(fù)。現(xiàn)在你就直接問。就像有了你自己的老師。
如果你想真的學(xué)會快速構(gòu)建軟件,就參與開源。不需要是我的項目。要謙虛,也許不要馬上發(fā)PR,但有很多方式可以幫忙和學(xué)習(xí)。讀代碼,待在Discord或其他社區(qū)里,理解東西是怎么構(gòu)建的,所有更細節(jié)的東西Agent可以幫忙。
參考資料:《龍蝦OpenClaw創(chuàng)始人萬字訪談》,企業(yè)家雜志。
(免責(zé)聲明:本文為經(jīng)濟學(xué)教授觀天下?lián)_資料做出的客觀分析,不構(gòu)成投資或者購買建議,請勿以此作為投資或者購買依據(jù)。)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.