AI助手也開始分“快慢班”了?深度求索的最新動作,揭開了大模型服務分層的一角。
4月8日,深度求索(DeepSeek)在產品端上線了“專家模式”,與原有的“快速模式”并列。更新后,用戶在網頁輸入框上方能看到兩個圖標:閃電代表“快速模式”,鉆石則對應“專家模式”,兩者定位截然不同。
![]()
快速模式追求即時響應,滿足日常對話。它支持圖片和文件中的文字識別(基于OCR技術),最多可處理50個文件,知識更新至2025年5月,風格直接簡潔,旨在以最低等待成本解決普遍問題。
專家模式則被定位為處理復雜任務的專用通道。它擅長深度思考和復雜求解,可搭配聯網搜索。但為確保算力集中于推理,當前版本暫不支持文件上傳,知識庫截止于2025年5月和快速模式一致,且在高峰時段可能需要排隊。
使用過程中,專家模式響應會出現卡頓或者服務器繁忙的情況。
![]()
實測了一下,讓兩種模式分別寫一篇專家模式的新聞報道,專家模式內容結構更為合理,可讀性更強。
![]()
若是讓它生成一個簡單游戲畫面,兩者出來的框架及畫面效果差異不大,反而專家模式的游戲體驗難度較為不合理。
![]()
![]()
很多網友第一時間也做了測試比較,測試者讓兩種模式分別編寫一個模擬球在旋轉六邊形內彈跳的p5.js程序,要求球體運動受重力和摩擦力影響。結果顯示,專家模式給出的程序運行結果更符合物理直覺,落點精準,彈跳軌跡真實;而快速模式的結果則明顯遜色不少。
![]()
![]()
分析認為,物理仿真對數學推理能力要求極高,弱一點的模型容易出現“看起來像物理但實際上不對”的情況,專家模式在此類場景中的優勢是實打實的能力差異。
這種差異,直接體現了兩種模式背后資源調度的不同優先級。
模式差異的根源,在于底層推理策略與架構優化方向不同。專家模式深度適配 DeepSeek 自研的混合專家模型(MoE)架構,最大化釋放模型的深度推理能力,此次更新也被業內普遍視為下一代旗艦模型 V4 發布前的重要預演。
這種架構通過一個門控網絡,為每個輸入動態選擇一小部分專精于不同任務(如語法分析、代碼生成)的“專家”子網絡進行計算。其精妙之處在于,模型能保持龐大參數總量(如DeepSeek-V3的6710億參數),卻僅激活一小部分(如370億)來處理特定任務,從而在保持強大能力的同時,大幅提升計算效率。快速模式則可能基于更輕量化或經過不同優化的版本,優先保障響應速度與并發能力。
行業分析認為,雙模式設計是平衡高昂算力與多元需求的必然選擇。將計算密集型任務導向專家模式,日常對話交由快速模式處理,是一種精細化的資源分配策略。這既能為專業場景提供強大能力,又能以較低成本維持海量用戶的日常體驗。
下一代旗艦模型V4將在多模態能力上實現突破。不同于當前通過OCR間接處理圖像,V4據稱采用原生多模態架構,能真正同時理解、處理并生成文本、圖像乃至音頻,實現“一次輸入,全模態輸出”。還有V4旨在突破現有模型“對話關閉即遺忘”的限制,通過創新記憶架構,使AI能像人類助手一樣記住歷史交互,自主歸納用戶習慣。通過MoE架構演進、更智能的稀疏注意力機制,以及深度適配國產算力芯片,DeepSeek致力于在提升性能的同時大幅降低訓練與推理成本。未來的模型將更擅長自主規劃、調用工具并完成復雜工作流。
因此有行業認為,專家模式對深度思考的側重,正是在為此鋪路。另外,多次被提及的V4的多模態能力,在此次更新中一個重要的“Vision Mode”并未上線。
值得一提,豆包專家模式 2 月 14 日上線,全能深度智能體,偏綜合辦公 / 多模態 / 工具鏈,強在圖文、文檔、圖表、中文創作、工具內化。雖然都叫“專家模式”,但兩者定位、技術路線、能力長板、使用體驗差異非常大。
同樣的實測,用豆包編寫的模擬球在旋轉六邊形內彈跳的p5.js程序,效果及界面內容較為簡單。
![]()
當AI開始為你“思考”得更深,我們準備好與之長期協作了嗎?
來源:星河商業觀察
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.