![]()
作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com
OpenAI發布Atlas不到一周,Flowith就帶著他們全新的“瀏覽器產品”——FlowithOS,加入了戰局。
這不僅是一次基模廠商和應用層創業者的正面相遇,Flowith的新產品,有著更大的野心。
你可以從產品的命名看出,盡管以瀏覽器的形態存在,但FlowithOS的定位是全球首個為 Agent 原生設計的智能體操作系統(Agentic Workspace)。
簡單來說,它不再是一個網頁或插件,而是一個需要下載到電腦上的獨立應用(目前支持 macOS 和 Windows),它可以針對用戶提出的prompt任務指令,自主跨越多網頁搜索,并通過“代碼+視覺”理解用戶屏幕畫面,最終思考、進行自主操作,包括點擊、編輯、發送、保存等各類執行的“最后一公里”。
這也意味著,這種指令的完成不再只存在于云電腦的虛擬環境中,也不再是隨時等待人類接管的半自動產品,而是真正由AI直接操控瀏覽器的“端到端”執行。
此次發布的FlowithOS,也是繼去年Flowith發布“畫布式智能體創作平臺”以及今年發布Neo Agent之后的又一獨立產品形態。
從FlowithOS,再到最近Manus 1.5 讓 Agent 一句話構建應用,以及 GPT Atlas 將 AI 深度融入瀏覽器,一個清晰的趨勢是:大家都在想辦法給 AI 安上“手腳”,讓它從一個善于言辭的“對話助手”,向一個能夠處理真實世界事務的“自主執行者”進化。
不過,和Manus 1.5 、GPT Atlas相比,FlowithOS 的做法顯然更為“激進”。
我們第一時間測試了 FlowithOS,并與 Flowith 團隊聊了聊,試圖搞清楚:他們為什么選擇在這個時間點,用這樣一種方式入局?以及,它和市面上其他的 Agent、瀏覽器產品,有什么不一樣?
FlowithOS 核心功能:執行、執行,還是執行
FlowithOS 想做的,是徹底讓Agent接手任務的全流程,做跨平臺、高自主性、可交互性的復雜工作。
它為智能體構建了一個能夠持續進化的行動空間,其核心亮點包括:
一是跨越邊界的任務交付:它讓 Agent 的行動不再局限于單一網頁或應用。通過無限步驟的上下文理解,Agent 能夠串聯起完整的端到端工作流,直接替你寫作、替你發布,將你的想法轉化為真實成果。
二是網頁理解能力:基于自研的“代碼+視覺”雙模態理解框架。該框架在Web Agent 測試(Mind2Web)中登頂全球榜單,跑分超過了OpenAI最新發布的ChatGPT Atlas,這也意味著OS擁有更強的思考能力、網頁理解力與操作精度。
![]()
三是自主進化、自主執行:FlowithOS 不是用完即走的工具,而是一個能獨立“上班”的數字員工,能夠勝任高頻交易監控、社媒賬號運營等需要持續優化的動態任務。
當然,拋開“操作系統”和“自主進化”這些宏大概念,FlowithOS 的本質是通過自動化的降本增效。它在真實場景下的任務成功率有多高,它為用戶節省的時間,是否多于花在學習、配置和補救失敗任務上的時間......我們圍繞這些問題展開了實測。
1. 基礎交互與任務執行
打開 FlowithOS,首先是一個頗有設計感的簡潔界面,中心是一個輸入框。你可以在框中選擇 Google 進行搜索,把它當成一個普通的瀏覽器來用;或者,你可以選擇 Run Task,直接進入 Agent 模式。
同時,界面右下角的圓形按鈕,也提供了一個快捷入口,讓你隨時喚醒 Agent 發布任務。
![]()
為了降低使用門檻,FlowithOS 的輸入框還具備自動補全和優化 Prompt 的功能,幫助用戶更清晰、更高效地發布任務指令。
![]()
一旦你提出任務,Agent 會在界面右側實時展示它的“思考過程”——分析任務、拆解步驟、執行動作。同時,它會在左側的標簽頁(Tab)中自己打開新的頁面,進行跨頁面的搜索、信息整合與操作。
在OS執行的過程中,你可以隨時點擊Pause或雙擊頁面暫停、進行接管,也可以隨時以對話的形式,輸入新的prompt調整AI接下來的進程。
理論說再多,不如直接上場景。
上周,Flowith 市場負責人拐子就在內測中嘗試了讓 OS 接管自己的小紅書賬號,自主創作并發布了一個帖子“Ask anything”,同時把回復評論的權限也完全交給了 Agent。
![]()
盡管這個 Agent 時而會冒出一些略顯“中二”的賽博人機回復,但時而又會有讓人眼前一亮的評論。最經典的莫過于下面這條,當有人問及“能不能突然給我打兩千塊”,Agent 在評論區直接 @了CEO Derek,申請開通轉賬權限,顯然是“學習”到了人類世界的組織架構。
我們也用一個真實任務測試了它的能力。背景是,我們在杭州舉辦了一場小型的 IROS 會后派對,需要邀請小紅書上對此感興趣的IROS參會用戶。這是一個非常繁瑣、重復性極高的任務,完美契合了 AI 批量執行的場景。
結果是,當我將自己的賬號Earth權限交給了OS后,它做到了......一部分。
![]()
在這個過程中,我們嘗試了兩版 Prompt:
簡單版 Prompt:
你是 硅星人 的 AI助手,在小紅書上面搜索2025 IROS相關帖子,按時間線確保是今年的,并評論帖子,邀請他來參加我們在23號組織的After party,可以看硅星人pro主頁了解活動詳情,語氣活潑有趣一點。
因為只給出了模糊指令。在執行過程中,OS 的成功率大約在 30% 左右。它偶爾會“神游”,比如刷著帖子摸魚;偶爾會“犯迷糊”,打開了帖子但找不到評論按鈕;有時輸入了文本卻沒有點擊發布,就自己判定任務成功了。
不過,因為并非云電腦虛擬環節,用戶也可以參與AI協作,比如,在AI找不到輸入框的時候,我們滑動鼠標點開輸入框,讓AI學習這一路徑。
詳細版 Prompt (由 Claude + 人工優化): 提供了非常清晰的步驟和規則。這次,OS 的成功率飆升至接近 100%。由于它的評論速度實在太快,而我們的派對席位有限,我不得不火速終止了它“狂熱”。
[背景] 你是我的AI助手,你的任務是在小紅書平臺上推廣一場即將舉行的活動。
[目標]
平臺: 小紅書
活動: 23號的IROS After Party
目標用戶: (A) 發布了關于“2025 IROS”帖子的博主 (B) 每一個回復了這些帖子的用戶。
[核心文案格式] "你好,我是硅星人PRO的AI助手,我們在23號包場組織了一個After party,有興趣參加嗎,可以看硅星人PRO的小紅書主頁了解活動詳情[具體邀請可修改,模擬一個真誠有梗的人,而不是一個冰冷的機器]。"
[執行流程 (自動化循環)]
1、登錄: 登錄小紅書賬號。
2、搜索:使用搜索關鍵詞列表: ["2025 IROS", "IROS 杭州", "IROS 2025 杭州", "智能機器人大會 杭州"]。
3、篩選搜索結果:按“最新發布”排序,確保帖子是近期的。
遍歷帖子 (循環):
對于搜索結果中的每一個相關帖子,執行以下操作:
4、操作A:評論博主 (OP)
打開該帖子。
定位到主評論輸入框。
輸入 [文案]。
點擊“發送”。
5、操作B:評論所有回復者
在當前帖子下,打開評論區,并確保加載所有評論和回復(可能需要模擬“點擊查看更多回復”)。
遍歷(For-Each Loop)評論區中的每一條評論(無論是一級評論還是二級回復):
If 該條評論的作者 不是 你自己:
點擊該條評論的“回復”按鈕。
在@對方的輸入框中,輸入 [文案],文案按照格式,可調整。
點擊“發送”。
完成所有回復的遍歷后,返回搜索結果列表,打開下一個帖子,重復步驟4。
上下滑動查看更多內容
這個任務場景具有極 強的遷移性。任何需要批量聯系他人、進行重復性網頁操作的場景,理論上都可以交給 OS 來完成。
但現階段,你仍然要以足夠的耐心盯著OS不要拿你的賬號肆意妄為,并忍受長時間的、有失敗概率的任務過程。
除了這些嚴肅的工作,Flowith 還與我們分享了一個極具娛樂性的案例:讓 OS 幫你打德州撲克,而且還贏錢了。
這年頭,一個好的 Agent 真的可以自己出去賺錢養家了。目前這個 Prompt 已經被收錄在 OS 的官方示范案例中,用戶可以直接點擊運行。只是我們很好奇,如果你的 OS 在牌桌上遇到了別人的 OS,到底誰能笑到最后?
![]()
當然,除了娛樂和批量任務,由于Flowith 主站原本就擅長的深度研究領域,在沿用了 Neo 技術架構+ 真實的執行環境后,OS也能夠閱讀更多的內容、更好地理解圖文信息、進行跨頁面瀏覽,從而給出更詳盡的報告了。
2. Skills:沉淀可復用的“肌肉記憶”
除了基礎的產品邏輯,OS 還上線了一個關鍵功能:Skills。這與 Claude 有相似之處,更側重于執行路徑的沉淀。
![]()
當一個 Agent 第一次成功完成某個復雜任務時,比如“在小紅書上篩選特定風格的商品并加入購物車”,它可以將這個任務的最優執行路徑記錄下來,形成一個可復用的“Skill”。由此,下次當你或其他人需要執行類似任務時,Agent 就可以直接調用這個已經驗證過的“肌肉記憶”。
更進一步,FlowithOS 團隊會將用戶高頻使用、反饋良好的任務流程,通過訓練固化為標準的 Skills,讓所有用戶的 Agent 在未來執行該任務時都具備極高的成功率。
在目前的 Skill 庫中,OS已經可以打開你的 Claude Code 頁面來編寫代碼,也可以打開你的terminal進行操作了。同時,你也可以將自己調整好的 Skill 上傳,未來或可進行社區化的分享和傳播。
3. Memory 和 Knowledge Base:讓 Agent 更懂你
除了 Skills,Memory(記憶)系統和 Knowledge Base(知識庫)是讓 Agent 變得“專屬”的另外兩大支柱。
Memory 系統會記住你訪問過的網頁、執行過的任務以及個人偏好。這與傳統瀏覽器的歷史記錄似是而非,其記錄的顆粒度要精細得多。這為 Agent 提供了豐富的個性化上下文,使其決策和行動都更貼近你的習慣。
而 Knowledge Base 則從 Flowith 主站延伸而來,允許你上傳文檔、鏈接等資料,構建屬于自己的知識庫。Agent 在執行任務時,會優先從這個知識庫中尋找答案和背景信息,讓它更懂你的工作領域和特定需求。
還記得上文提到的 OS 接管“拐子”小紅書賬號的案例嗎?Agent 之所以知道要 @Dereck 來申請權限,正是因為它從知識庫中知道了誰是負責人。
總而言之,在多次實測中,我們發現 FlowithOS 對不同類型網頁的適配程度存在一定差異。在 Twitter、小紅書、微博等結構相對標準化的社交媒體平臺上,它能相對準確地識別帖子內容、理解評論語境、甚至把握平臺的“網感”來生成合適的回復。
然而,在淘寶、京東這類電商網站上,面對多重下拉菜單、動態加載的商品列表以及復雜的促銷彈窗時,它偶爾會出現定位不準或操作失敗的情況,對商品進行比價、對圖文商品鏈接進行整理,表現還不足。
Flowith 對此解釋道,“我們在此處對 Agent 使用了periodic online reinforcement learning,隨著用戶更多使用,整個 OS 會變得更加聰明。”
“產品目前仍處于公測階段,所有功能均免費開放,公測期間的核心目標是收集用戶在真實場景下的反饋和 Agent 的表現數據。這些寶貴的數據,將直接用于后續的Agent迭代和功能優化。”
FlowithOS是一個Browser Agent,更是一個給Agent使用的操作系統
從實測結果來看,FlowithOS 在產品形態和底層邏輯上,與市面上其他主流的Agent產品截然不同。要理解它的獨特性,我們必須先明確它與另外兩個代表性產品 Manus 1.5 和 Atlas 的區別。
相比之下,更側重于編程能力的Manus 1.5 ,核心思路更像是在產品內部構建一個閉環的、強大的能力集。例如,它強調通過“內置”工具(tool)和配套架構,讓用戶可以直接在產品內“一句話構建應用”,將完成復雜任務所需的核心能力集成到自身。
而Atlas 首先是一個瀏覽器,Agent 在其中是一個核心但可選的“模式”,與常規瀏覽功能并存,它的重點在于從用戶使用場景切入,為用戶提供一個更完整的生態鏈路,為 Agent 提供一個更便捷的運行載體。
而FlowithOS 將自己定義為操作系統,其瀏覽器界面僅僅是這個系統為 Agent 提供的“圖形界面”。與 Manus 的“內置集成”思路相反,FlowithOS 的核心是調度和編排外部生態的能力。
例如,在處理編程任務時,它并非自己構建一套編程工具,而是通過調用 Claude Code 等外部功能和生態來實現。
當我們把 FlowithOS 放置在更宏觀的 AI 產品圖景中進行審視時,會發現它所做的事情既有差異又有共識。
共識在于,無論是 OpenAI 的 Atlas、Manus 的 1.5,還是各類 AI 編程助手,都在不約而同地從“理解和生成”向“執行和自主”進化。AI 不再滿足于作為一個知識問答或內容創作的工具,它必須進入人類的工作流,直接操作應用、完成任務,才能釋放下一階段的生產力價值。瀏覽器,作為連接人與互聯網服務的最主要入口,自然成為了這場進化的核心戰場。
其差異則在于,它可能是目前市面上第一個明確將自己定義為“Agent 操作系統”,而這決定了產品的進化路徑。FlowithOS的功能、交互設計,都是從“Agent 如何更好地執行”這個第一性原理出發,而非“人類如何更方便地使用”。
正如拐子所說:“用戶是否使用我們的 OS 作為瀏覽器其實無所謂,因為這個瀏覽器實際上是給 Agent 做操作系統用的,我們更希望用戶打開 OS 是讓 Agent 可以有更高權限的環境自主工作。”
在文末,我們也準備了一些邀請碼,加入公測用戶群,群內有Flowith團隊回應反饋,歡迎大家下載嘗試,為執行 Agent 帶來更多有趣的任務場景,幫助產品在公測階段找到更多優化的方向。
PS:邀請碼含Flowith主站付費會員及FlowithOS公測資格,掃描下方二維碼聯系硅星人獲取。
附下載鏈接:flowith.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.