國產大模型DeepSeek再次迎來重要更新。
![]()
4月8日,澎湃新聞記者查詢發現,在最新版本中,DeepSeek輸入框上方新增“快速模式”與“專家模式”,網頁顯示,快速模式適合日常對話,即時響應,支持圖片和文件中的文字識別;專家模式擅長復雜問題,這也是DeepSeek在官網頁面首次引入分層模式。
這也讓DeepSeek更新V4的懸念再度成為大家討論的熱點,綜合外媒報道和社交媒體、多方渠道信息,DeepSeek大概率在今年4月正式上線V4版本。
此前不少消息也透露出端倪:3月29日至31日,DeepSeek官方網站連續三天出現不同程度異常,涉及網頁對話、App及API等,故障分別持續約1小時48分、10小時13分和1小時3分。其中,3月29日晚上22點開始,一直到30日早上7點,服務出現長達8小時的大規模訪問異常,大量用戶遭遇頁面卡頓、反復提示“服務器繁忙”甚至功能完全中斷。
外界猜測,DeepSeek出現大規模宕機的核心原因,是V4更新所導致,對此,DeepSeek內部人士沒有回應消息的真實性,而是向澎湃新聞記者表示:非常期待。
今年1月12日,DeepSeek曾發布一篇新論文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可擴展查找的條件記憶:大語言模型稀疏性的新維度),梁文鋒位列作者名單中,這篇論文為北京大學和DeepSeek共同完成。據分析,這篇論文的核心直指當前大語言模型存在的記憶力“短板”,提出了“條件記憶”這一概念。
2月13日,澎湃新聞記者曾獨家獲悉,DeepSeek網頁/ APP正在測試新的長文本模型結構,支持1M上下文。其API服務不變,仍為V3.2,僅支持128K上下文。大家當時也猜測,DeepSeek或將在今年春節再次“炸場”發布新模型,復刻去年春節現象級轟動。
不過,春節AI大戰雖然熱鬧,但DeepSeek卻始終靜悄悄,也讓相關期待一度落空。
據券商研報顯示,DeepSeek最新的V4模型亮點將聚焦國產化。野村證券分析,作為去年推出DS-V3/R1并攪動全球AI產業鏈的玩家,DeepSeek的全新技術布局不僅將推動中國AI產業鏈創新周期加速,更將通過技術創新,在算法與工程層面縮小中國與全球大模型產業的差距。
業內人士普遍認為,此次V4發布,對于DeepSeek來說難度頗大,要復刻去年春節期間炸場的轟動性頗有技術挑戰,因為國產大模型已經卷入深水戰場,競爭極度激烈。
4月8日,智譜正式發布GLM-5.1,記者發現,在年內漲價超八成后,智譜GLM再度提價10%。調價后,GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet4.6水平。
據悉,這是國產大模型首次在核心場景實現與海外頭部廠商的價格對齊。一年前,國產大模型廠商還在以降價90%以上爭奪市場份額。這一轉折表明國產大模型不再單純依靠大幅降價爭奪市場,而是以性能溢價錨定國際基準。
數據顯示,GLM-5.1在編程能力上繼續保持領先,在SWE-bench Pro、Terminal-Bench、NL2Repo三大代碼評測基準的綜合平均分中,取得全球第三、國產第一、開源第一;此外,有別于當前以分鐘級交互為主的模型,GLM-5.1能夠在單次任務中持續、自主地工作長達8小時。
3月18日,MiniMax(上海稀宇極智科技有限公司)發布新一代Agent旗艦大模型M2.7,首次展示“模型自我進化”路徑。該模型通過構建Agent Harness體系,深度參與自身訓練與優化流程,在部分研發場景中可承擔30%—50%的工作量,并在內部評測集上實現約30%的效果提升。
據介紹,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成績,接近國際一線水平;同時在VIBE-Pro、Terminal Bench2等真實工程測試中表現突出,支持端到端項目交付與復雜系統理解。辦公場景方面,其在GDPval-AA的ELO得分是1495,為開源模型中最高,并顯著提升Office文檔處理與多輪編輯能力。
截至8日港股午盤,智譜(02513.HK)漲14.06%,報888.5港元,市值3961億港元。MiniMax(0100.HK)漲6.9%,報1015港元,市值3183億港元。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.