網易首頁 > 網易號 > 正文申請入駐

在所有人都追著 GPT 的時候，科大訊飛給出了另一種答案

2025-11-07 18:39:17　來源: 科技不許冷

北京舉報

分享至

如果只看全球大模型榜單，2024—2025 的行業幾乎呈現出一種“趨同結構”。參數集體躍升、跑分全面對齊，產品節奏越來越像硅谷發布會：你更新，我跟進。你標榜通用智能，我也把重點落在“更像 GPT”上。越往后看，這場技術競賽似乎正在走向一條單行線。

但 11 月 6 日科大訊飛的發布會，讓這條單行線出現了裂縫。它展示的不是某項單點能力，而是一整條從聲學、設備、行業，到算力和生態的體系化路線圖——而這套體系的形成，并不是為了追逐 GPT，而是被中國的真實場景一步步逼出來的。

而要理解這場發布會的重要性，我們必須先看清一個更底層的問題：中國大模型的起點，與硅谷從來不是同一條路。

大模型在中國最先被需求的，是效率，而不是靈感

在硅谷，大模型最先俘獲的是程序員、學生、創作者這類對工具天然敏感的群體。他們希望寫得更順、學得更快、代碼產出更高效，很多需求帶著探索意味，也帶著濃厚的“體驗性”。

但在中國，大模型一開始面對的不是“想玩玩看的人”，而是“不得不用的人”。教育系統希望解決批閱與備課的沉重負擔；醫院希望減少病歷書寫的海量重復勞動；政務大廳被咨詢壓力持續吞噬；能源、建筑、制造業的流程管理高度依賴人工；車企在嘈雜的駕駛環境中必須保持語音識別精準；跨境企業則每天消耗在多語溝通的不確定性上。

這些需求并非附加功能，而是中國職業體系的主流工作負載。大模型在這里的價值，不在生成形式，而在流程效率：能否減少步驟、縮短時間、提升穩定性。這才是決定其產業位置的關鍵。

也正因為此，中國大模型的第一性原理必須從“可靠”而非“驚艷”開始，這注定會把它帶往與 GPT 完全不同的發展軌跡。

語音與多模態不是“附屬能力”，而是中國 AI 的入口

而這種對“減負”的剛性需求，首先體現在日常交互方式上。在美國，人與 AI 的對話往往發生在安靜的鍵盤敲擊之間；而在中國，一句語音指令可能來自車內的風噪、教室的喧鬧、會場的多方口音，甚至是跨境企業里中文、英文混雜的表達方式。

在這樣的環境下，如果 AI 不能穩穩地“聽懂”，后續所有能力都無從談起。因此中國廠商不得不比硅谷更早、更深地推進聲學系統：遠場拾音、麥克風陣列融合、口音識別、多語種切換、噪聲環境下的語義過濾……這些看似技術細節的工程，卻是中國大模型能否進入真實場景的第一道門檻。

也正因此，多模態在中國從來都不是“展示用效果”，而是“接入現實世界的必然路徑”。中國式 AI 的成長，從一開始就不是從文本世界起步，而是從復雜、混亂、嘈雜、非結構化的真實場景當中起步。

硅谷模型習慣在清潔數據里長大，而中國模型則是必須在“噪聲世界”里生存。這是第二個結構性分叉。

大模型要在中國落地，必須從“云上強”變成“端上穩”

要讓 AI 在如此復雜的環境中跑得穩定，僅靠云端算力遠遠不夠——它必須深入設備本身，與硬件深度結合。因為中國的大模型真正需要落地的場景，從來都不在網頁上，而在海量終端設備里：教育平板、數字黑板、翻譯機、辦公本、車機、會議系統、政務終端……每一種設備都意味著截然不同的芯片架構、功耗上限、麥克風布局、光學條件與成本要求。

這迫使中國大模型必須具備“端側適配能力”。模型要能自動裁剪規模、在低算力條件下保持體驗一致、在弱網環境中保持穩定、在離線場景中不崩潰、在多端之間保持一致性。讓軟硬一體不再是一句口號，而是模型能否進入中國產業現場的前提條件。

硅谷可以允許大模型“云上昂貴”，因為商業模式與用戶結構容許這么做；中國的規模化落地，則要求大模型必須變得“設備可承載”。這是第三條分叉：硅谷的大模型長在云端，中國的大模型長在設備里。

算力約束，塑造了中國大模型的演化路徑

上述差異看似分散——從用戶需求到交互方式，從落地形態到產品邏輯——但深入追溯，其背后共同的約束條件，幾乎都指向同一個現實：算力資源的結構性差異。

美國憑借其在 GPU 架構設計與 CUDA 軟件生態的絕對主導地位、全球最大且高度集成的云基礎設施，以及資本市場對長期高風險投入的容忍度，得以持續采用“靠規模破局”的路徑：通過不斷堆疊參數、數據與算力，在通用能力上構筑護城河。

而在中國，大模型的發展從一開始就面臨不同的算力現實。沒有無限彈性的云端資源，也沒有可隨意調用的頂級芯片，團隊必須在有限的國產算力平臺上完成同等復雜的任務——這意味著訓練鏈路要更短，推理效率要更高，單位成本下的性能輸出必須更強。

正是在這種約束下，MoE（稀疏專家架構）在美國或許是一種技術選項，在中國卻迅速成為工程落地的主流路徑。它允許模型以更少的激活參數維持高性能，但代價是極高的工程復雜度：專家路由必須均衡，通信開銷必須壓縮，調度與并行必須精準協同，否則系統極易失衡。

過去一年，中國大模型真正的突破，并非來自某項驚艷的“智能涌現”，而是來自這些沉默的底層攻堅。以科大訊飛為例，其在昇騰等全國產算力平臺上，不僅攻克了 MoE 模型的全鏈路訓練效率難題，更將深度推理訓練效率從 30% 提升至 84% 以上。同時，星火 X1.5 在語言理解、數學、代碼等六大核心能力上，整體性能已達到國際主流大模型的 95% 以上水平。

這些數字背后，是一條被現實逼出來的“工程優先”路線。算力限制沒有成為終點，反而成了轉型的起點——它迫使中國 AI 放棄對“單點峰值”的執念，轉而追求在嘈雜教室、基層醫院、車載環境和千萬級終端中都能穩定運行的系統性可靠。也正是這種由約束催生的務實路徑，讓中國大模型開始長出與 GPT 不同的技術形態。

最后

如果把職業結構、交互方式、設備生態、成本壓力與算力現實放在同一張地圖上，就會看到一條越來越明確的技術路徑：中國的大模型不是 GPT 的復刻品，而是在自己獨特的產業土壤中，被真實世界一點點塑造出來的技術體系。它要在噪聲中聽懂人話，要在低功耗設備上穩定運行，要在多語言環境中保持一致性，要把流程從人工里解放出來，要在國產算力上實現高效訓練——這些要求共同決定，中國 AI 最終一定會長出自己的主干。

科大訊飛正是這條路線最早顯形的企業之一。星火 X1.5 之所以值得關注，不在于某一項跑分，而在于它把中國式 AI 的全部底層邏輯，用一套完整的工程體系與產業路徑真實跑了出來：293B 的 MoE、100% 推理效率提升、130+ 語種覆蓋、14 個重點語言領先、在國產算力平臺上的訓練效率突破……這些不是“追趕式動作”，而是中國式 AI 在自己的道路上邁出的關鍵一步。

中國的 AI 不會永遠停留在 GPT 的影子里，而會在自己的產業土壤中長出新的主干。未來幾年，這條主干將決定中國大模型真正的競爭力。而現在，它的輪廓已經清晰可見。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.