![]()
算力神話正在松動
在科技圈,硅谷一直有一種“造物主”般的傲慢。從大模型誕生那天起,OpenAI的 CEO奧特曼就給全世界洗腦了一套暴力美學:智能等于算力,算力等于顯卡,顯卡等于成功。
但這套邏輯,正在被一群中國“算法瘋子”拆解。
近日, Google的一項研究發現,DeepSeek的R1和阿里云的qwq-32B模型,竟然能夠模仿人類的集體智能。
簡單說,在處理難題時,不再是一個人在戰斗,而是在內部演化出了一個“思想社會”。其中不同人格特征和領域專業知識的相互作用產生了更強大的能力。
大模型行業從不缺“堆料者”,但能讓 Google 彎下腰來研究底層邏輯的,寥寥無幾。這不僅是技術的勝利,更是中國企業在算力圍堵下,硬生生走出的一條“暴力效率主義”血路。
Deepseek更懂“省錢”
長期以來,硅谷的大模型發展路徑高度趨同甚至單一:堆最貴的卡,組最多的集群,投入最激進的資本。
從 GPT-3 到 GPT-4,再到 GPT-4o,這條路線被一次次驗證有效。Meta 為了 Llama 3 囤積了數十萬張 GPU,微軟與 OpenAI 推進的“星際門”項目,投資規模動輒以千億美元計,覆蓋算力、數據中心、電力基礎設施等全鏈條。這種打法并不復雜,本質上是通過資源冗余換取確定性領先。
換句話說,當算力足夠便宜、資本足夠充裕時,工程效率往往并非首要約束,真正重要的是“規模先到位”。
但 Google 這份研究揭開了另一個真相:DeepSeek 們之所以強,不是因為它們比 OpenAI 更能燒錢,而是它們更懂“省錢”。
研究指出,DeepSeek 等中國模型的能力躍遷,并非來自算力規模的指數級擴張,而是來自推理階段內部結構的重構。
這些模型在面對復雜指令時,并不是沿著單一生成路徑一路向前,而是會在內部并行展開多種解題策略,并通過持續的內部比較、博弈與修正,逐步收斂到更穩定的答案。
這種近似“多代理協商”的模式,并不追求單次推理速度的極限,卻顯著降低了單位算力下的錯誤率與返工成本。在算力受限的環境中,這種“少走彎路”的能力,往往比“跑得更快”更重要。
正是在這一背景下,MoE與 GRPO等技術路徑開始在國內模型中被高度重視。MoE 通過將模型能力拆分給不同“專家模塊”,避免了每一次推理都全模型啟動;GRPO 則通過分組對比和相對優化,提升模型在推理階段的穩定性和可控性。
這類技術選擇的共同目標只有一個:把有限算力的“智能產出”榨到極致。
這并不是一次偶然的技術選擇,而是一種被現實約束反復塑造出的工程哲學。
如果說硅谷仍在押注“重裝推進”的工業化路線,那么中國模型更像是在修煉一套輕量而高效的技術體系。通過結構、策略和調度上的精細設計,對沖算力劣勢。
這種“算法效率主義”并非理想主義,而是一種典型的生存型進化。當資源不再無限供給,效率本身就會從加分項,轉變為最核心、也最難復制的競爭壁壘。
大廠護城河的坍塌
在 Google 的研究案例中,被反復引用的中國模型,并不是聲量最大、發布會最密集的玩家,而是 DeepSeek和阿里通義千問。這并非簡單的“技術偶然”,而是中國 AI 競爭的“分水嶺”已經出現了。
過去兩年,國內大廠們沉迷于參數對標、榜單排名和在發布會上“吊打 GPT-4”,忙著在朋友圈曬各種看不懂的榜單,這些能在短期內贏得更多注意力。
但從基礎研究和工程演化的角度看,這種競爭方式的邊際價值正在快速下降。真正進入全球研究視野的,反而是那些持續在模型架構、推理效率和成本結構上做“臟活累活”的團隊。
DeepSeek 背靠幻方量化,其技術團隊長期浸泡在金融工程語境中,對算力成本、延遲控制和穩定性有著近乎苛刻的要求。在量化交易領域,算力從來不是無限變量,“如何用更少計算得到更可靠結論”本身就是核心能力。
因此,DeepSeek 從一開始就沒有將重心放在應用層敘事上,而是持續死磕推理成本與模型結構。即便沒有萬卡集群,只要架構足夠聰明,依然可以逼近前沿能力。
![]()
而阿里通義千問所選擇的路徑,則更具平臺型特征。
通過持續開源模型底座,阿里將模型訓練、評測和場景驗證的一部分成本,轉化為全球開發者的協同實驗。這種做法短期內看似削弱了“獨占優勢”,但從長期看,卻顯著加快了模型在真實復雜場景中的演化速度。
在這種開放體系中,模型更容易暴露問題,也更快完成修正,從而在模擬“集體智慧”與復雜決策方面走得更遠。
反觀某些還沉溺于做“套殼應用”或只顧著買流量的大廠,護城河正在變得搖搖欲墜。應用層的繁榮,建立在底層能力外包的基礎之上,一旦底層模型的差距被拉開,應用層的優勢往往難以長期維持。
互聯網行業從不缺跨界者,但真正成功的寥寥無幾。因為底層邏輯一旦錯位,再多的產品包裝也只是階段性繁榮。
在 AI 領域,如果不能在算法或架構層貢獻新的認知與方法論,那么競爭最終只會被壓縮到應用層的價格戰與內卷之中,而這,恰恰是最容易被后來者顛覆的地帶。
智能的“社會化”
Google 的這項研究,最細思極恐的地方在于:如果 AI 內部已經能模擬“集體智慧”,那么人類精英的價值還剩下多少?
研究提到,DeepSeek R1 等模型展現出的“內部辯論”能力,本質上,這意味著人類組織中大量依賴流程協作的崗位,將不可避免地被重新定義。
過去,一個大型企業的重大決策,往往需要多個部門參與:市場調研、戰略分析、風險評估、財務測算……
而現在,一個具備強推理能力的 AI Agent,已經可以在內部完成成百上千次模擬。
這并不是“自動化”,而是決策機制的內化。
對于字節跳動、美團、百度這類高度依賴數據與算法的公司而言,這意味著從“人機協作”向“機機協作”的過渡。
對于制造業巨頭,如小米、比亞迪而言,這意味著供應鏈與生產系統將第一次擁有“自反能力”。
它們不只是執行命令,而是能夠對命令本身提出質疑。
這也是為什么,越來越多企業開始將強推理模型引入非前端場景。不是為了聊天,而是為了判斷。
回到最初的問題:算力不夠,智慧真的能來湊嗎?
DeepSeek 與 千問給出的答案是:當資源不再無限,智慧才會被迫進化。
歷史反復證明,真正改變世界的技術路徑,往往誕生于約束之中,而不是溫室里。
今天,中國 AI 正在用一種并不張揚、卻高度有效的方式,重寫大模型的競爭邏輯。
它未必最快,但可能更穩;未必最貴,但更可持續。
而這,或許正是下一階段智能競爭的關鍵分水嶺。
馬斯克曾多次強調:“未來所有的工作都將由 AI 完成,除非你想為了興趣而工作。”當中國 AI 提前摸到了“集體智慧”的門檻,這種預測正加速從科幻變為現實。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.