337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

2025,國產推理大模型的“五軍之戰(zhàn)”?

0
分享至

如果AI停留在模型層,那它只是一個工具,只有在AI真正落地,在不同場景的行業(yè)生根發(fā)芽,具備特定行業(yè)特定問題的解決方案,且國產自主可控,整個中國的AI行業(yè)才有繼續(xù)向前的動力。



自年初DeepSeek橫空出世,無論是國外的OpenAI,國內的新銳“六小虎”到老牌大廠,都在加速布局推理大模型的研發(fā)與應用。

無論是今年“新上牌桌”的DeepSeek,后來居上的字節(jié)豆包,還是國產路線自主可控的科大訊飛,專利數量一騎絕塵的阿里通義,加上擁有國內最大潛在用戶群體,摸著DeepSeek過河的騰訊混元,一個季度過去,各家紛紛迭代了最新的推理大模型。起碼在國產推理大模型領域,已經形成了“五軍之戰(zhàn)”的競爭態(tài)勢。

相較傳統的基礎大模型,推理大模型通過海量多模態(tài)數據的強化訓練,不僅顯著提升了跨領域知識遷移能力,更在復雜場景下的邏輯推理和問題解決層面取得突破。

其技術升級方向,已從單純的語言處理轉向STEM領域的深度滲透——在科研數據處理、工程設計優(yōu)化、數學建模等專業(yè)場景中,推理模型正在不斷替代傳統分析工具,甚至在醫(yī)療診斷、金融風控等垂直領域中,不斷展現令人驚艷的潛力。

依托各自的優(yōu)勢領域,各家也正在重構屬于自己的AI技術生態(tài):以DeepSeek為代表的創(chuàng)業(yè)公司聚焦STEM領域的垂直突破,通過打造科研輔助平臺積累技術勢能;老牌巨頭如阿里云、騰訊云則依托云計算基礎設施,推動推理模型向產業(yè)端的規(guī)模化落地,科大訊飛則在不斷提升模型性能,比肩國際一線水平的同時,尋求底層算力的國產化替代,以求在不斷激烈的國內外競爭中,保持產品和技術的自主可控。

對各路大模型廠商而言,推理大模型,無疑是一把通往AI時代的鑰匙和機遇。無論是專業(yè)工具型應用,還是面向C端消費者的App,科技廠商之間的生態(tài)位爭奪日趨白熱化——他們心中都很明白,誰能跑出AI時代第一個超級應用,誰就能成為AI時代的“超級大廠”。

01 國產推理大模型的“涌現時刻”

在DeepSeek橫空出世之前,OpenAI等一眾歐美廠商,試圖用高成本、高算力、高參數的“三高策略”,成為AI時代的壟斷者,進而收割全世界。大大小小的國產廠商,不管技術實力高低,背靠資源多少,只要入局AI大模型,無一例外都要走上這條“力大磚飛”的技術路徑。

春節(jié)前后推出的DeepSeek,則用更低的效能標準,比肩頭部的模型性能告訴行業(yè),訓練一個推理大模型“并沒有那么貴”。

從整體參數上看,DeepSeek的參數規(guī)模,相較主流大模型降低90%,訓練成本降低80%,但整體性能,并不比國外一線大模型差;加之開源API免費調用,為推理大模型的發(fā)展,提供了一條截然不同的新路徑——僅需激活37億參數,即可部署滿血版R1推理模型,推理效率較傳統架構提升3倍以上。

有驗證過的技術路徑在前,國內一線大模型廠商隨之迎頭追趕,大有后來居上的趨勢:

阿里旗下的Qwen團隊,于3月推出了開源大語言模型(LLM)QwQ-32B,對標OpenAI的o1-preview。QwQ-32B采用了多階段強化學習訓練方法,在數學問題、編碼能力和通用問題解決能力上得到增強。

相比DeepSeek-R1,QwQ-32B的顯存需求更小——通常在GPU上需要24GB vRAM,滿血版DeepSeek-R1則需要超過1500GB vRAM。

騰訊押注推理大模型的時間相對較晚,但自混元接入DeepSeek之后,追趕速度相較以往快了不少——35天“更新”30次后,混元大模型團隊于3月21日推出了自研深度思考模型混元T1正式版。它摒棄了以往的純Transformer架構,轉而將混合Mamba架構應用于推理大模型。

相對于DeepSeek,T1正式版的吐字速度達到了60~80token/s,實際生成速度快于DeepSeek-R1。在體現推理模型基礎能力的常見基準測試上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得87.2分,超越了DeepSeek-R1,落后于o1。

字節(jié)方面,于4月發(fā)布的最新推理模型Seed-Thinking-v1.5,同樣采用DeepSeek-R1的MoE架構,但參數量降低至200B總參數和20B激活參數。相比前者671B總參數和37B激活參數,輕量化的趨勢更為明顯。

在多項性能自動評估中,Seed-Thinking-v1.5在AIME 2024基準測試中取得86.7,與OpenAI的o3-mini-high模型的性能相當。執(zhí)行GPQA任務時,Seed-Thinking-v1.5達到77.3%的準確率,接近o3-mini-high的性能。在Codeforces等代碼生成場景中,Seed-Thinking-v1.5的性能與Gemini 2.5 Pro 的性能相當,但仍落后于o3-mini-high。

科大訊飛方面,則是在4月21日官宣了旗下深度推理大模型——星火X1的升級。相較其他國內廠商,升級版星火X1首創(chuàng)了“直覺快思考”與“深度慢思考”雙模式融合架構。

具體而言,快思考模式支持實時翻譯、百科問答等低延遲任務;慢思考模式則通過多步驟邏輯鏈拆解復雜問題(如數學證明、法律條文解析),模擬人類專家的推理過程。

針對更復雜場景的數據稀缺問題,升級版X1則提出了基于問題難度的分階段訓練框架。通過動態(tài)調整強化學習更新速度,顯著提升長思維鏈(如50步推理)的穩(wěn)定性和準確性,在數學競賽題(如AIME、MATH 500)上的準確率較前代提升12%。

從參數規(guī)模而言,星火X1的模型參數規(guī)模較業(yè)界同類模型有所縮減,但在整體性能上,已經能夠與OpenAI的o1模型及DeepSeek的R1模型相抗衡。

02 全國產算力,為什么是趨勢

整體來看,DeepSeek的輕量化技術路徑,很大程度上改寫了推理大模型的進化規(guī)則。各家廠商技術路徑雖有些許差異,參數規(guī)模的“輕量化”和企業(yè)級應用的提速確是實實在在。

但對各家廠商而言,推理大模型的推出只是產業(yè)端應用的第一步。隨著推理大模型領域愈發(fā)激烈的全球化競爭,各家廠商勢必要依據自身的行業(yè)生態(tài),進行相關的產業(yè)化布局。

譬如,騰訊依托自身的C端用戶優(yōu)勢,率先在C端發(fā)力。AppGrowing數據顯示,截至2月27日,騰訊元寶在27天里投放共花了2.81億元。對應的C端用戶數量則不斷上升——到3月3日為止,元寶在蘋果應用商店的下載量甚至超過DeepSeek,到達榜首。

在“見真章”的B端,騰訊經過C端用戶的迭代反饋,推出了混合專家模型MoE架構,并通過騰訊混元+開源模型的多模型解決方案,開始在政務、零售、金融、工業(yè)等30多個行業(yè)落地。這對于底層架構和算力支持,無疑提出了更高的要求。

更兼愈發(fā)激烈的中美科技博弈,使得基于先進算力的推理大模型,面臨迫在眉睫的制裁風險。4月16日,美國政府突然宣布,對英偉達H20芯片實施“無限期出口許可限制”。

這意味著,從算力層面開始的國產替代,將不再是一種戰(zhàn)略選擇,而成為一種生存剛需。

在此背景下,科大訊飛的模型訓練和模型推理,選擇使用全國產算力平臺,無疑具有行業(yè)示范效應。

早在兩年前,科大訊飛即與華為合作,建設了首個萬卡國產算力平臺“飛星一號”,最高能支持萬億參數大模型訓練。科大訊飛董事長劉慶峰在今年年初透露,“飛星二號”將在2025年交付使用首批算力。



今年3月,訊飛與華為昇騰團隊,實現在國產算力集群上,MoE模型的大規(guī)模跨節(jié)點專家并行集群推理,這也是業(yè)界首個基于國產算力的全新解決方案。一個月后,MoE模型的集群推理性能實現翻番。同時,華為昇騰910B的推理效率,相對A100,也從原先的從55%提升到85%。

就產品意義而言,基于全國產算力升級后的星火X1,在知識問答、數學能力等通用任務上效果顯著提升,不僅是70B參數大模型中最好的深度推理模型,而且在參數量小于業(yè)界同類模型的情況下,獲得了比肩國際頂尖模型水平的效果。



全國產的行業(yè)意義遠不止于此。訊飛星火X1根植于完全自主可控的大模型底座,在模型迭代時,可以實現更加靈活的參數規(guī)模調整,和更深的訓練優(yōu)化。行業(yè)大模型的效果相比通用款,提升約在10%左右;疊加具體場景調優(yōu),效果可進一步提升10%到20%。

成本方面,星火X1通過“快思考、慢思考統一模型”,也顯著降低了硬件資源需求。以國產昇騰910B為參考系,星火X1做行業(yè)落地定制(SFT和強化學習)需要16張卡,滿血版 DeepSeek需要256張卡,硬件投入約為后者的 1/16。

推理方面,星火X1模型僅需4張華為910B算力卡即可完成私有化部署,對比DeepSeek滿血版R1模型,在性能類似的情況下硬件投入只需要 1/8。

更少的算力需求,不輸友商的模型效果,這無疑從戰(zhàn)略層面,論證了基于國產算力訓練的全棧自主可控的大模型,具備登頂業(yè)界最高水平的可行性和創(chuàng)新的可持續(xù)性。

03 走入中國AI的下一個十年

一如科大訊飛董事長劉慶峰所言,“今天是一個通用模型和專用模型相結合——‘通專結合’,端測模型和云端模型相結合,軟件和硬件相結合的、全新的大模型落地時代?!?/p>

如果AI停留在模型層,那它只是一個工具,只有在AI真正落地,在不同場景的行業(yè)生根發(fā)芽,具備特定行業(yè)特定問題的解決方案,且國產自主可控,整個中國的AI行業(yè)才有繼續(xù)向前的動力。

若將視角投向產業(yè)應用端,我們大可發(fā)現,推理大模型的國內外競爭,本質上仍然是中國AI產業(yè)從技術跟跑到生態(tài)領跑的戰(zhàn)略轉型。

站在2025年回望,這場始于模型性能追逐的“五軍之戰(zhàn)”,到產業(yè)端落地的不斷深入,終將成為產業(yè)生態(tài)的全面融合。誰先將推理能力轉化為行業(yè)生產力,誰就能在AI產業(yè)競賽中穿越周期,引領變革。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中遠海運集運:恢復至阿聯酋、沙特、巴林、卡塔爾、科威特、伊拉克的新訂艙業(yè)務

中遠海運集運:恢復至阿聯酋、沙特、巴林、卡塔爾、科威特、伊拉克的新訂艙業(yè)務

第一財經資訊
2026-03-25 15:57:17
射程4000公里,伊朗砸穿美軍大本營,特朗普的反華夢徹底碎了!

射程4000公里,伊朗砸穿美軍大本營,特朗普的反華夢徹底碎了!

甜檸聊史
2026-03-26 02:24:10
海灣國家出臺新舉措 美以伊局勢有升級風險?

海灣國家出臺新舉措 美以伊局勢有升級風險?

看看新聞Knews
2026-03-25 20:37:04
山姆緊急下架,“已立案調查”

山姆緊急下架,“已立案調查”

天津族
2026-03-26 00:25:01
為什么閑魚很多賣家只支持自提?網友:等你碰上到手刀的就老實了

為什么閑魚很多賣家只支持自提?網友:等你碰上到手刀的就老實了

另子維愛讀史
2026-03-22 22:34:48
太陰間?海底撈相框設計被吐槽:“好像享福去了”

太陰間?海底撈相框設計被吐槽:“好像享福去了”

品牌新
2026-03-25 15:21:52
沒護照沒簽證,這只叫LV的貓?zhí)焯炜鐕咚嚼鲜?,兩國海關都拿它沒轍!

沒護照沒簽證,這只叫LV的貓?zhí)焯炜鐕咚嚼鲜?,兩國海關都拿它沒轍!

英國那些事兒
2026-03-24 23:16:58
“上海實體交通卡,為啥退不了?”73歲老伯來滬遭遇引發(fā)質疑,記者調查:確實難

“上海實體交通卡,為啥退不了?”73歲老伯來滬遭遇引發(fā)質疑,記者調查:確實難

新民晚報
2026-03-25 18:45:33
這些“垃圾花”也該被315曝光,別再坑害花友了,白送都不能要

這些“垃圾花”也該被315曝光,別再坑害花友了,白送都不能要

三農老歷
2026-03-20 00:32:02
隔天吃一次,排出黑臭便!它是腸道“推糞機”,中老年人要常吃!

隔天吃一次,排出黑臭便!它是腸道“推糞機”,中老年人要常吃!

江江食研社
2026-03-23 18:30:10
A股:剛剛,大消息傳來,釋放兩信號,周四將迎來更大級別的變盤

A股:剛剛,大消息傳來,釋放兩信號,周四將迎來更大級別的變盤

云鵬敘事
2026-03-26 00:00:06
漢密爾頓與金-卡戴珊現身東京街頭,二人挽手逛街

漢密爾頓與金-卡戴珊現身東京街頭,二人挽手逛街

懂球帝
2026-03-23 12:32:44
洛克希德·馬丁:將精確打擊導彈產量提升四倍

洛克希德·馬丁:將精確打擊導彈產量提升四倍

財聯社
2026-03-25 19:18:36
中日破裂,這是53年來對日最強硬的外交表態(tài)!

中日破裂,這是53年來對日最強硬的外交表態(tài)!

見聞致
2025-11-15 21:21:56
國產頂級神劇,只可惜,央視播完就禁了

國產頂級神劇,只可惜,央視播完就禁了

獨立魚
2026-03-23 21:22:17
特朗普:臺灣屬于中國,武統是中方的自由,但一動手美國會不高興

特朗普:臺灣屬于中國,武統是中方的自由,但一動手美國會不高興

共工之錨
2026-03-22 00:48:09
俄烏戰(zhàn)爭要變成莫斯科保衛(wèi)戰(zhàn)了嗎?

俄烏戰(zhàn)爭要變成莫斯科保衛(wèi)戰(zhàn)了嗎?

廖保平
2026-03-24 15:01:33
我國癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

我國癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

大象新聞
2026-03-24 13:53:11
印度偷師不成鬧笑話?10億購入我國8臺盾構機,拆解后裝不上了

印度偷師不成鬧笑話?10億購入我國8臺盾構機,拆解后裝不上了

有范又有料
2026-03-25 16:38:02
韓媒曝光:尹錫悅在獄中經常索要食物、咖啡,被獄警嫌棄,“他食量很大,大家都說他胃口特別好”

韓媒曝光:尹錫悅在獄中經常索要食物、咖啡,被獄警嫌棄,“他食量很大,大家都說他胃口特別好”

每日經濟新聞
2026-03-24 17:25:09
2026-03-26 03:15:00
競合人工智能 incentive-icons
競合人工智能
專注于探討人工智能領域最新動態(tài)、技術突破和行業(yè)應用。
122文章數 20關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗:正在搜捕逃亡美軍

頭條要聞

伊朗:正在搜捕逃亡美軍

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產分割復雜!是否立遺囑成關鍵

財經要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

旅游
親子
房產
游戲
公開課

旅游要聞

“女王駕到” 上海溫室花園高山杜鵑展開幕,中外游客打卡點贊,Beautiful!Amazing!Fantastic!

親子要聞

智利幼兒教育覆蓋率僅43%,專家吁提升投資與優(yōu)先地位

房產要聞

41億!259畝!建學?!齺嗊@個大城更,最新方案曝光!

PS6升級動力遭質疑!玩家或當“PS5釘子戶”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版