![]()
前段時間各家龍蝦該上場的基本都亮相了,世超也是順便用了個爽,但最近又琢磨出個新問題:
這些大廠出品的“龍蝦”雖然好上手又穩定,但閉源的總顯得沒那么自由。而原版的 OpenClaw 雖然是開源的,但個人維護,又沒有那么穩定,屬于一個大更新干掉一批插件的那種。
咋就不能像個成年人一樣的全都要呢?
![]()
誒,就在這一堆產品中,給世超瞄見了一個走開源路子但大廠出品的項目:字節的“DeerFlow”,GitHub 上將近 6 萬顆星星,已經迭代到 2.0 版本了。
這回終于不是水里游的蝦了,上手把玩了幾圈兒后,只能說,這只地上跑的鹿味道確實挺獨特的。
咱先來個綜合任務開開胃,看看它的處理邏輯是怎么樣的,能不能像普通龍蝦那樣靈活的使用工具作為手腳。
圖源小紅書作者:想看演唱會
![]()
正好前段時間杭州的櫻花開了,綠化帶里還有很多郁金香,干脆讓它梳理一下杭州綠化的常見花卉種類和花期。
![]()
能看出來,對于這種簡單的任務,它不會過度調度工具,網絡搜索一些信息后,就直接匯總了一份質量尚可的報告。
里面花卉科普,綠化標準,觀賞指南乃至可視化都可圈可點,算是繼承了上一代“深度調研”的優良傳統。
接著稍微升級一下任務,讓它盡可能多的調用工具,試著搭建一個用于展示的網頁,要求主題相關,務必花里胡哨。
![]()
嘿,你別說,不看別的,就這滿屏飄落的花瓣就有內味道了,沒有什么多余的冗余分析,快速的拆分任務后,幾個 Agent 按部就班的就把網頁搓出來了,該有的信息展示也都有。
而且整個任務消耗才 15 萬 token,作為對比,同樣的模型,同樣的提示詞,默認配置下的 OpenClaw 差不多的效果要燒掉整整 30 萬。
這就是大廠調教帶來的優勢了,工程管理這塊兒確實能減輕點 Token 賬單的負擔。
![]()
其實,這次用的 DeerFlow 2.0 相比之前的 1.0 算是一次脫胎換骨的升級,代碼沒有一點共用的,整個都重寫了,如果說以前是專精深度研究的專家,那現在更像是多層架構的任務執行引擎。
說大白話就是一套成品方案,用來調遣組合 Agent 幫你干活兒。
跟隨叫隨到的龍蝦不同,它不太像呆在聊天框里什么都會點兒的管家,更像是一位專事專辦的天選打工人,任務優先。
圖源 X 用戶:Gorden Sun
![]()
所以咱直接對號入座,看看怎么個任務優先法,觀察一下多 Agent 協作的效果如何。
恰巧前些天 NASA 剛發射載人繞月的飛船,給世超羨慕的不行,這星辰大海的誰不想去看看,這回交給 DeerFlow,看它有沒啥辦法送咱登月。
![]()
一開始可能是提示詞不夠明確,它想走捷徑坐商業化的飛船,小幽默了一下,然后拒絕了。那怎么行,咱這回可是認真的。
果然,沒有嘻嘻哈哈后,它就轉變畫風開始調用技能包干活了,搜索分析可視化,十八般武藝都上陣了。
![]()
就結果來看,怎么說呢,太中規中矩了,由于難度有點高,報告基本就是把搜索的資料走馬觀花了一下,而且子 Agent 也就調用了一個,多少有點敷衍。
這里也能看出,雖然模型本身的性能決定了結果的上限,但這些工程化的調用手段才是保證活兒能跑通的底座。
在這方面,OpenClaw 這種個人項目往往激進一些,但大廠的調教會更偏向保守和穩妥,拆解和規劃并不會上來就指派一大群 Agent 去干活兒。
當然咱不能止步于此,還得再壓榨壓榨,看看長線任務他到底能不能跑通。
![]()
一番解釋后,主 Agent 終于意識到了事情的嚴重性,開始將任務拆分為更細的子任務,交給不同的 Agent 去完成,有資本積累,技術路線,商業市場,法律監管以及身體醫學共 5 個部分。
![]()
在跑了半個小時,燒掉 150 萬 Token 后,它終于給出來一份比較細的登月企劃書。
整本計劃二十萬字,內容也不是簡單的拼接,有索引總綱,跨章節也有交叉引用的地方,能看出來任務流程是能跑通的,世超接下來也就安心去準備了,2036 年咱就月球見哈。
![]()
誒等等,其實話說回來,看著能跑通其實不一定內容就真的妥當,當然咱不是說按著計劃不能上天就算它失敗了,而是內容本身其實還有不小的問題。
比如隨便打開一篇文章,就能發現,除了目錄文檔,剩下的章節內容雖然十分詳實,但語言卻是英文的。
![]()
原因也好理解,就是在如此龐大的上下文任務中,光是輸出就有 20 萬字,全都一次性塞進模型是不現實的,會直接把上下文窗口給擠爆,所以依托 DeerFlow 的調教進行內容的管理和壓縮才是更合理的解決方案。
而顯然,這里的默認調教還是英文推理加中文顯示,所以在一些環節就容易出現輸出語言傾向的混亂。
![]()
后面世超又讓它根據企劃書中的航天技術章節生成了一份 PPT,結果消耗的 Token 比整個調研過程都多。
不過雖然從效果來看沒有特別突出,但一些任務執行上的選擇倒是比較成熟。
尤其是在隔離沙箱中執行,一些操作的權限它沒有,但此時進程并不會卡頓停滯,它會根據情況或給出方案,或直接跳過先去干其他活兒,最后再匯報情況。
這種任務規劃的方式雖然容易導致它“摸魚”,但確實更可靠一些,不會陷入死循環擱那兒空燒 Token。
![]()
但說了這么多順利執行的地方,DeerFlow 真就擺脫了 OpenClaw 的偶爾智障么?
那倒也沒有,何況龍蝦還有各個大廠去做降低門檻的產品,DeerFlow 這個本來就是面向開發者的開源項目,用起來反而更麻煩。
![]()
比如龍蝦可以在網頁上配置模型,參數或者接口,但 DeerFlow 里,就得老老實實在滿是代碼的配置文件中自己修改環境變量。
除此之外,一些小 Bug 也挺影響使用體驗的,世超用的時候,就老是丟失前面的對話記錄,遇到權限問題,還得反復回到后臺去更改設置,一趟下來得修修改改的地方還挺多的。
現在的它好比一箱子非常專業的修理工具,各種型號的扳手卡鉗一應俱全,但實際上咱日常里可能就是個擰螺絲的活兒,工具多了反而不好找了。
![]()
總的來說,DeerFlow 可玩性確實很強,各個部分都能單拿出來自己修改,但相應的使用門檻也挺高,所以現在并不推薦個人用戶去費勁鼓搗。
不過就現在這個摸著石頭過河的階段,咱就索性讓這些蝦啊鹿啊在競技場里邊戰斗邊進化吧,總歸會角逐出那個真正能實際干活兒的賽博帕魯。
撰文:風華
編輯:早起 & 江江 & 面線
美編:煥妍
圖片、資料來源:
Github,小紅書,X,DeerFlow,網絡
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.