前言
中國(guó)科技的舞臺(tái)上,又一顆新星閃耀。
梁文鋒,這位40歲的AI創(chuàng)業(yè)者,靠DeepSeek-R1模型,在國(guó)際上連續(xù)刷屏。
![]()
美國(guó)硅谷巨頭震驚,中國(guó)AI產(chǎn)業(yè)也為之沸騰。曾經(jīng)認(rèn)為中國(guó)只是“追趕者”的觀念,正在被徹底打破。
這不僅是一家公司的勝利,更是一場(chǎng)全球科技秩序的潛在重構(gòu)……
DeepSeek 強(qiáng)勢(shì)封神
這一現(xiàn)象級(jí)的震動(dòng),甚至讓《自然》期刊打破常規(guī),將年度十大科學(xué)人物的一席之地,留給了這股風(fēng)暴的始作俑者——梁文鋒。
![]()
作為AI領(lǐng)域的“科技顛覆者”,這個(gè)名字對(duì)于大多數(shù)美國(guó)科技大佬來(lái)說(shuō)稍顯陌生,但其展現(xiàn)出的殺傷力卻讓他們無(wú)法忽視。
就在那個(gè)動(dòng)蕩的交易日之前幾天,1月20日上線的DeepSeek-R1推理模型,以一種令人難以置信的姿態(tài)登頂了美國(guó)蘋果AppStore的免費(fèi)榜,將那個(gè)長(zhǎng)期霸榜、曾經(jīng)不可一世的ChatGPT狠狠甩在了身后。這一切不僅是對(duì)中國(guó)創(chuàng)新速度的證明,更像是一次對(duì)硅谷“算力霸權(quán)”的公然嘲諷。
![]()
外界震驚的不僅僅是性能,當(dāng)DeepSeek-R1在各項(xiàng)任務(wù)中展現(xiàn)出與OpenAI王牌模型o1難分伯仲的能力時(shí),更深層的恐懼源于其摧毀性的成本控制邏輯。
這是一個(gè)關(guān)于“用十分之一的錢,辦同樣事”的故事。據(jù)悉,這套讓全球資本市場(chǎng)膽寒的模型,其設(shè)計(jì)費(fèi)用竟然不到600萬(wàn)美元。在每一次API調(diào)用的成本上,它比OpenAI的o1便宜了整整93%。
![]()
在那些習(xí)慣了“大力出奇跡”、瘋狂堆砌顯卡的硅谷巨頭眼中,這不僅是技術(shù)的追趕,更是對(duì)現(xiàn)有商業(yè)模式地基的抽離。這種極致的性價(jià)比意味著,建立在昂貴算力壟斷上的護(hù)城河,可能并沒(méi)有想象中那么牢不可破。
要理解這種近乎偏執(zhí)的效率追求,我們得把目光投向這一切的起點(diǎn),卻不是去翻閱某本計(jì)算機(jī)科學(xué)的教材,而是要去探究一個(gè)數(shù)學(xué)天才的交易直覺(jué)。
現(xiàn)年40歲的梁文鋒,在躋身《2025年財(cái)富雜志500創(chuàng)富榜》前十名、坐擁1800億元身家之前,最顯著的標(biāo)簽并非“企業(yè)家”,而是一個(gè)在數(shù)字迷宮中尋找最優(yōu)解的探路者。17歲那年,他以全校第一的成績(jī)考入浙江大學(xué)攻讀電子信息工程,后來(lái)深造主攻機(jī)器視覺(jué)。
![]()
早在2008年那場(chǎng)席卷全球的金融危機(jī)中,尚未畢業(yè)的他沒(méi)有像同齡人那樣對(duì)未來(lái)感到恐慌,反而敏銳地察覺(jué)到了自動(dòng)化算法在動(dòng)蕩中的商業(yè)潛能。
這種在危機(jī)中尋找縫隙的本能,深刻地烙印在了DeepSeek的基因里。不同于硅谷推崇的“資源飽和式攻擊”,梁文鋒走的是一條典型的“理工男”路線:死磕算法,壓榨硬件極限。
![]()
他在租來(lái)的小房子里埋頭鉆研算法的日子,最終化作了幻方量化千億級(jí)的管理規(guī)模。2016年建立的基于GPU的高頻交易系統(tǒng),實(shí)際上是一次昂貴的“預(yù)演”。那是用真金白銀在毫秒級(jí)博弈中磨練出來(lái)的算力敏感度,這種經(jīng)驗(yàn)被他原封不動(dòng)地移植到了大模型的訓(xùn)練中。
當(dāng)DeepSeek在2023年正式用金融賺來(lái)的錢反哺科技?jí)粝霑r(shí),他們的目標(biāo)從一開(kāi)始就透著一股精明的瘋狂——用最低的算力,換取最高的智能。
全面開(kāi)源
這一策略的成效是驚人的,甚至可以說(shuō)是“反常識(shí)”的。以DeepSeekV3為例,它僅用2000張GPU就干出了原本需要1.6萬(wàn)張GPU才能完成的活。
![]()
這不僅僅是數(shù)字的游戲,這是對(duì)摩爾定律的一次“降維打擊”。對(duì)于那些還在瘋狂囤積算力卡的美國(guó)科技公司來(lái)說(shuō),這簡(jiǎn)直是個(gè)噩夢(mèng)。因?yàn)檫@意味著大模型對(duì)高端硬件的絕對(duì)依賴被削弱了。
這種沖擊在2024年5月就已經(jīng)顯露端倪,當(dāng)時(shí)發(fā)布的V2開(kāi)源模型,將推理成本降至每百萬(wàn)token僅需1塊錢,是當(dāng)時(shí)GPT-4Turbo成本的七十分之一。國(guó)內(nèi)的字節(jié)、騰訊、百度等大廠被迫卷入這場(chǎng)“價(jià)格戰(zhàn)”,紛紛降價(jià),行業(yè)的游戲規(guī)則在毫厘之間被徹底改寫。
![]()
更讓競(jìng)爭(zhēng)對(duì)手感到棘手的是,梁文鋒并沒(méi)有試圖將這項(xiàng)技術(shù)鎖在保險(xiǎn)柜里待價(jià)而沽。相反,他選擇了一種更具野心的打法——全面開(kāi)源。2025年2月底,那場(chǎng)轟動(dòng)業(yè)界的“開(kāi)源周”,梁文鋒將訓(xùn)練技術(shù)的細(xì)節(jié)如同散發(fā)傳單一樣公之于眾。
紐約大學(xué)的圖靈獎(jiǎng)得主楊立昆(YannLeCun)對(duì)此贊不絕口,他一針見(jiàn)血地指出,DeepSeek的成功關(guān)鍵在于堅(jiān)持開(kāi)源,這證明了AI技術(shù)并不存在絕對(duì)的、不可逾越的壁壘。加州大學(xué)的研究員們更是不得不承認(rèn),中國(guó)龐大的科技人才庫(kù)在如何高效利用有限計(jì)算資源方面,似乎找到了一條更為高明的路徑。
![]()
這種“廣撒網(wǎng)”的策略,直接帶動(dòng)了公司估值的飆升。憑著1.05萬(wàn)億元的估值,DeepSeek一躍成為僅次于字節(jié)跳動(dòng)的中國(guó)第二大公司,也是全球第六大初創(chuàng)獨(dú)角獸。
但這并不是一條鋪滿鮮花的坦途,在這個(gè)極度內(nèi)卷的賽道上,技術(shù)的迭代速度快得驚人,任何瞬間的懈怠都可能導(dǎo)致被反超。
數(shù)據(jù)的波動(dòng)最能說(shuō)明問(wèn)題:DeepSeekApp的月活數(shù)據(jù)一度在3月份攀升至1.94億的巔峰,將騰訊元寶、豆包等甩在身后,但在隨后幾個(gè)月的新鮮感消退期,月活下滑至1.45億,一度被豆包反超。
![]()
這場(chǎng)戰(zhàn)爭(zhēng)還遠(yuǎn)未結(jié)束,甚至可以說(shuō)剛剛進(jìn)入白熱化階段。真正的巨頭們已經(jīng)從最初的震驚中回過(guò)神來(lái),開(kāi)始揮舞著支票簿進(jìn)行反撲。
在大模型領(lǐng)域一度“掉隊(duì)”的字節(jié)跳動(dòng),2024年一年就砸下了近800億元研發(fā)費(fèi)用,甚至有證券預(yù)測(cè)其今年的AI總投入將翻倍至1600億元,其中絕大部分用于購(gòu)買那些DeepSeek試圖“弱化”的算力卡。大洋彼岸的微軟、谷歌和Meta也不甘示弱,僅一個(gè)財(cái)季的資本支出合計(jì)就達(dá)到了780億美元,這是一場(chǎng)金錢與智慧的終極較量。
面對(duì)這股反撲的浪潮,梁文鋒似乎早有準(zhǔn)備,并沒(méi)有選擇坐以待斃,而是拿出了硬實(shí)力進(jìn)行回?fù)簟>驮诟?jìng)爭(zhēng)對(duì)手試圖用資本淹沒(méi)市場(chǎng)的時(shí)候,12月1日,兩款新模型DeepSeek-V3.2和DeepSeek-V3.2Speciale正式登場(chǎng)。
![]()
前者在性能上直逼GPT-5水平,僅略遜于Gemini-3.0-Pro,而且大幅降低了輸出長(zhǎng)度,進(jìn)一步壓縮了用戶等待時(shí)間和計(jì)算開(kāi)銷。后者更是橫掃了IMO、CMO、ICPC等四大頂級(jí)數(shù)學(xué)與編程賽事。
如果說(shuō),之前的成功還帶有一絲“突襲”的意味,那么這一輪的技術(shù)發(fā)布,則是正面戰(zhàn)場(chǎng)的陣地戰(zhàn)。那個(gè)曾經(jīng)被視為“追趕者”的角色,正在用一種近乎殘酷的“全開(kāi)源、低成本”策略,逼迫整個(gè)行業(yè)重新思考未來(lái)的方向。
結(jié)語(yǔ)
正如他在采訪中所透露的那樣,這一切不僅僅是為了商業(yè)上的盈利,而是為了走到科技的最前沿,去推動(dòng)整個(gè)生態(tài)的發(fā)展。在這場(chǎng)從“時(shí)運(yùn)”到“實(shí)力”的辯證中,梁文鋒和他的團(tuán)隊(duì)正在用實(shí)際行動(dòng)證明,改變世界的或許不是擁有最多的資源,而是擁有最極致的效率。
![]()
那些關(guān)于“中國(guó)團(tuán)隊(duì)只會(huì)追趕”的舊有觀念,在2000張GPU的高效運(yùn)轉(zhuǎn)聲中,正在土崩瓦解。
信息源: 投資家:《浙大天才,震驚全球》 觀察者網(wǎng):《DeepSeek-R1開(kāi)創(chuàng)歷史,梁文鋒論文登上《自然》封面》
#優(yōu)質(zhì)圖文扶持計(jì)劃#
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.