網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

一顆新星閃耀！中國(guó)AI用 “極致省錢”，打贏了這場(chǎng)翻身仗

2025-12-18 10:08:17　來(lái)源: 筆尖視界

河南舉報(bào)

分享至

前言

中國(guó)科技的舞臺(tái)上，又一顆新星閃耀。

梁文鋒，這位40歲的AI創(chuàng)業(yè)者，靠DeepSeek-R1模型，在國(guó)際上連續(xù)刷屏。

美國(guó)硅谷巨頭震驚，中國(guó)AI產(chǎn)業(yè)也為之沸騰。曾經(jīng)認(rèn)為中國(guó)只是“追趕者”的觀念，正在被徹底打破。

這不僅是一家公司的勝利，更是一場(chǎng)全球科技秩序的潛在重構(gòu)……

DeepSeek 強(qiáng)勢(shì)封神

這一現(xiàn)象級(jí)的震動(dòng)，甚至讓《自然》期刊打破常規(guī)，將年度十大科學(xué)人物的一席之地，留給了這股風(fēng)暴的始作俑者——梁文鋒。

作為AI領(lǐng)域的“科技顛覆者”，這個(gè)名字對(duì)于大多數(shù)美國(guó)科技大佬來(lái)說(shuō)稍顯陌生，但其展現(xiàn)出的殺傷力卻讓他們無(wú)法忽視。

就在那個(gè)動(dòng)蕩的交易日之前幾天，1月20日上線的DeepSeek-R1推理模型，以一種令人難以置信的姿態(tài)登頂了美國(guó)蘋果AppStore的免費(fèi)榜，將那個(gè)長(zhǎng)期霸榜、曾經(jīng)不可一世的ChatGPT狠狠甩在了身后。這一切不僅是對(duì)中國(guó)創(chuàng)新速度的證明，更像是一次對(duì)硅谷“算力霸權(quán)”的公然嘲諷。

外界震驚的不僅僅是性能，當(dāng)DeepSeek-R1在各項(xiàng)任務(wù)中展現(xiàn)出與OpenAI王牌模型o1難分伯仲的能力時(shí)，更深層的恐懼源于其摧毀性的成本控制邏輯。

這是一個(gè)關(guān)于“用十分之一的錢，辦同樣事”的故事。據(jù)悉，這套讓全球資本市場(chǎng)膽寒的模型，其設(shè)計(jì)費(fèi)用竟然不到600萬(wàn)美元。在每一次API調(diào)用的成本上，它比OpenAI的o1便宜了整整93%。

在那些習(xí)慣了“大力出奇跡”、瘋狂堆砌顯卡的硅谷巨頭眼中，這不僅是技術(shù)的追趕，更是對(duì)現(xiàn)有商業(yè)模式地基的抽離。這種極致的性價(jià)比意味著，建立在昂貴算力壟斷上的護(hù)城河，可能并沒(méi)有想象中那么牢不可破。

要理解這種近乎偏執(zhí)的效率追求，我們得把目光投向這一切的起點(diǎn)，卻不是去翻閱某本計(jì)算機(jī)科學(xué)的教材，而是要去探究一個(gè)數(shù)學(xué)天才的交易直覺(jué)。

現(xiàn)年40歲的梁文鋒，在躋身《2025年財(cái)富雜志500創(chuàng)富榜》前十名、坐擁1800億元身家之前，最顯著的標(biāo)簽并非“企業(yè)家”，而是一個(gè)在數(shù)字迷宮中尋找最優(yōu)解的探路者。17歲那年，他以全校第一的成績(jī)考入浙江大學(xué)攻讀電子信息工程，后來(lái)深造主攻機(jī)器視覺(jué)。

早在2008年那場(chǎng)席卷全球的金融危機(jī)中，尚未畢業(yè)的他沒(méi)有像同齡人那樣對(duì)未來(lái)感到恐慌，反而敏銳地察覺(jué)到了自動(dòng)化算法在動(dòng)蕩中的商業(yè)潛能。

這種在危機(jī)中尋找縫隙的本能，深刻地烙印在了DeepSeek的基因里。不同于硅谷推崇的“資源飽和式攻擊”，梁文鋒走的是一條典型的“理工男”路線：死磕算法，壓榨硬件極限。

他在租來(lái)的小房子里埋頭鉆研算法的日子，最終化作了幻方量化千億級(jí)的管理規(guī)模。2016年建立的基于GPU的高頻交易系統(tǒng)，實(shí)際上是一次昂貴的“預(yù)演”。那是用真金白銀在毫秒級(jí)博弈中磨練出來(lái)的算力敏感度，這種經(jīng)驗(yàn)被他原封不動(dòng)地移植到了大模型的訓(xùn)練中。

當(dāng)DeepSeek在2023年正式用金融賺來(lái)的錢反哺科技?jí)粝霑r(shí)，他們的目標(biāo)從一開(kāi)始就透著一股精明的瘋狂——用最低的算力，換取最高的智能。

全面開(kāi)源

這一策略的成效是驚人的，甚至可以說(shuō)是“反常識(shí)”的。以DeepSeekV3為例，它僅用2000張GPU就干出了原本需要1.6萬(wàn)張GPU才能完成的活。

這不僅僅是數(shù)字的游戲，這是對(duì)摩爾定律的一次“降維打擊”。對(duì)于那些還在瘋狂囤積算力卡的美國(guó)科技公司來(lái)說(shuō)，這簡(jiǎn)直是個(gè)噩夢(mèng)。因?yàn)檫@意味著大模型對(duì)高端硬件的絕對(duì)依賴被削弱了。

這種沖擊在2024年5月就已經(jīng)顯露端倪，當(dāng)時(shí)發(fā)布的V2開(kāi)源模型，將推理成本降至每百萬(wàn)token僅需1塊錢，是當(dāng)時(shí)GPT-4Turbo成本的七十分之一。國(guó)內(nèi)的字節(jié)、騰訊、百度等大廠被迫卷入這場(chǎng)“價(jià)格戰(zhàn)”，紛紛降價(jià)，行業(yè)的游戲規(guī)則在毫厘之間被徹底改寫。

更讓競(jìng)爭(zhēng)對(duì)手感到棘手的是，梁文鋒并沒(méi)有試圖將這項(xiàng)技術(shù)鎖在保險(xiǎn)柜里待價(jià)而沽。相反，他選擇了一種更具野心的打法——全面開(kāi)源。2025年2月底，那場(chǎng)轟動(dòng)業(yè)界的“開(kāi)源周”，梁文鋒將訓(xùn)練技術(shù)的細(xì)節(jié)如同散發(fā)傳單一樣公之于眾。

紐約大學(xué)的圖靈獎(jiǎng)得主楊立昆（YannLeCun）對(duì)此贊不絕口，他一針見(jiàn)血地指出，DeepSeek的成功關(guān)鍵在于堅(jiān)持開(kāi)源，這證明了AI技術(shù)并不存在絕對(duì)的、不可逾越的壁壘。加州大學(xué)的研究員們更是不得不承認(rèn)，中國(guó)龐大的科技人才庫(kù)在如何高效利用有限計(jì)算資源方面，似乎找到了一條更為高明的路徑。

這種“廣撒網(wǎng)”的策略，直接帶動(dòng)了公司估值的飆升。憑著1.05萬(wàn)億元的估值，DeepSeek一躍成為僅次于字節(jié)跳動(dòng)的中國(guó)第二大公司，也是全球第六大初創(chuàng)獨(dú)角獸。

但這并不是一條鋪滿鮮花的坦途，在這個(gè)極度內(nèi)卷的賽道上，技術(shù)的迭代速度快得驚人，任何瞬間的懈怠都可能導(dǎo)致被反超。

數(shù)據(jù)的波動(dòng)最能說(shuō)明問(wèn)題：DeepSeekApp的月活數(shù)據(jù)一度在3月份攀升至1.94億的巔峰，將騰訊元寶、豆包等甩在身后，但在隨后幾個(gè)月的新鮮感消退期，月活下滑至1.45億，一度被豆包反超。

這場(chǎng)戰(zhàn)爭(zhēng)還遠(yuǎn)未結(jié)束，甚至可以說(shuō)剛剛進(jìn)入白熱化階段。真正的巨頭們已經(jīng)從最初的震驚中回過(guò)神來(lái)，開(kāi)始揮舞著支票簿進(jìn)行反撲。

在大模型領(lǐng)域一度“掉隊(duì)”的字節(jié)跳動(dòng)，2024年一年就砸下了近800億元研發(fā)費(fèi)用，甚至有證券預(yù)測(cè)其今年的AI總投入將翻倍至1600億元，其中絕大部分用于購(gòu)買那些DeepSeek試圖“弱化”的算力卡。大洋彼岸的微軟、谷歌和Meta也不甘示弱，僅一個(gè)財(cái)季的資本支出合計(jì)就達(dá)到了780億美元，這是一場(chǎng)金錢與智慧的終極較量。

面對(duì)這股反撲的浪潮，梁文鋒似乎早有準(zhǔn)備，并沒(méi)有選擇坐以待斃，而是拿出了硬實(shí)力進(jìn)行回?fù)簟＞驮诟?jìng)爭(zhēng)對(duì)手試圖用資本淹沒(méi)市場(chǎng)的時(shí)候，12月1日，兩款新模型DeepSeek-V3.2和DeepSeek-V3.2Speciale正式登場(chǎng)。

前者在性能上直逼GPT-5水平，僅略遜于Gemini-3.0-Pro，而且大幅降低了輸出長(zhǎng)度，進(jìn)一步壓縮了用戶等待時(shí)間和計(jì)算開(kāi)銷。后者更是橫掃了IMO、CMO、ICPC等四大頂級(jí)數(shù)學(xué)與編程賽事。

如果說(shuō)，之前的成功還帶有一絲“突襲”的意味，那么這一輪的技術(shù)發(fā)布，則是正面戰(zhàn)場(chǎng)的陣地戰(zhàn)。那個(gè)曾經(jīng)被視為“追趕者”的角色，正在用一種近乎殘酷的“全開(kāi)源、低成本”策略，逼迫整個(gè)行業(yè)重新思考未來(lái)的方向。

結(jié)語(yǔ)

正如他在采訪中所透露的那樣，這一切不僅僅是為了商業(yè)上的盈利，而是為了走到科技的最前沿，去推動(dòng)整個(gè)生態(tài)的發(fā)展。在這場(chǎng)從“時(shí)運(yùn)”到“實(shí)力”的辯證中，梁文鋒和他的團(tuán)隊(duì)正在用實(shí)際行動(dòng)證明，改變世界的或許不是擁有最多的資源，而是擁有最極致的效率。

那些關(guān)于“中國(guó)團(tuán)隊(duì)只會(huì)追趕”的舊有觀念，在2000張GPU的高效運(yùn)轉(zhuǎn)聲中，正在土崩瓦解。

信息源: 投資家：《浙大天才，震驚全球》觀察者網(wǎng)：《DeepSeek-R1開(kāi)創(chuàng)歷史，梁文鋒論文登上《自然》封面》

#優(yōu)質(zhì)圖文扶持計(jì)劃#

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.