文 | ICT解讀者—老解
2025年1月,DeepSeek-R1橫空出世,560萬美元的訓練成本、545%的成本利潤率,一串數據炸穿了中美AI圈對大模型研發的常識。美國風投家馬克·安德森稱之為AI領域的"斯普特尼克時刻"。梁文鋒登上《時代》周刊全球100影響力人物榜單,《自然》年度十大科學人物榜單上赫然在列。
但一年后的2026年4月,故事急轉直下。
據晚點LatePost報道,2025年下半年至今,DeepSeek至少5名核心研發成員確認離職——第一代大語言模型核心作者王炳宣去了騰訊,V3核心貢獻者羅福莉被雷軍千萬年薪挖至小米,R1核心研究員郭達雅以傳聞近億元總包入職字節跳動Seed團隊,OCR系列核心作者魏浩然和多模態成果核心貢獻者阮翀也先后離開。5個人,覆蓋了基座模型、推理、OCR、多模態四條核心技術主線。
與此同時,DeepSeek被曝正與投資人洽談首次外部融資,尋求以超100億美元估值籌集至少3億美元——這個曾經拒絕過多家頂級VC和科技巨頭投資邀約、堅持"純搞AGI創新"的技術理想主義者,終究開始向資本低頭。V4模型從原定2026年2月中旬一推再推,至今仍未正式發布。
這不是一個人的理想妥協,這是整個國產AI硬科技初創公司在巨頭碾壓下的一面鏡子。
200人的團隊,走了幾個就能動搖根基
DeepSeek總共不到200人,核心研究團隊約100多人,基模架構團隊僅小幾十人。更關鍵的是,這支團隊的構成極為年輕:本科和碩士占比超七成,30歲以下超七成,幾乎不社招,以應屆生和實習生留任為主。
在這樣一支規模不到大廠十分之一、人均工作時長不到大廠一半的精銳團隊中,每一個核心研究員的權重都被放大到了極致。王炳宣參與過歷代模型訓練,是DeepSeek從0到1的基座搭建者;郭達雅是V2、V3、R1系列模型的核心作者,一個人橫跨推理、代碼兩大方向;羅福莉是V3模型的關鍵開發者,被雷軍親自下場招募。
對大廠而言,流失一個核心研究員是局部損失;對DeepSeek而言,流失一個核心研究員意味著整條技術線出現斷層。這不是夸大其詞,而是小團隊的先天脆弱性——人少意味著每個人都是單點依賴,沒有人可以被"替代"。
薪資的數學題:情懷打不過2到3倍
人才為什么走?先算一筆賬。
據多方信源,DeepSeek的絕對薪資并不低,但競爭對手開出的條件"翻2到3倍問題不大",部分甚至給出8位數總包(含股票/期權)。羅福莉的案例最具代表性——雷軍以千萬年薪加碼招募,親自盯這件事。郭達雅雖被字節官方否認"億元年薪",但多路信源指向其總包遠超DeepSeek的薪酬體系。
再對比AI行業的整體薪酬水平:大模型算法工程師月薪中位數已達24760元,頂尖人才年薪逼近200萬元。北京海淀區官方發布的緊缺崗位目錄顯示,人工智能領域整體平均年薪為48.14萬元,而芯片算法與設計優化工程師年薪已突破百萬元。
DeepSeek的另一重劣勢在于長期激勵的缺失。2023年后,DeepSeek未再進行外部融資,員工期權協議沒有明確的公司估值支撐,流動性幾近于零。梁文鋒曾以類似OpenAI與微軟的"回報上限"協議嘗試接觸投資人,沒有機構接受。沒有估值、沒有上市預期、沒有期權變現通道——這紙期權在賬面上可能是天文數字,在現實中是一張無法兌現的期票。
大廠則恰恰相反。字節跳動雖未上市,但期權有明確的流通渠道;騰訊的股票激勵體系成熟;小米在港股上市,薪酬+期權的組合包可以做到精準定價。當一個95后研究員面臨"DeepSeek的無限可能"和"字節的8位數確定性"二選一時,理性的選擇并不難做。
不只是錢的事:算力、生態和"被替代"的恐懼
如果把DeepSeek的人才困境歸結為"給不起錢",就低估了問題的復雜性。薪資只是表面,背后是三層結構性矛盾的疊加。
第一層:算力鴻溝。 大模型訓練的本質是算力競賽。DeepSeek V3的訓練成本是560萬美元,但那是基于英偉達架構的極致效率優化。V4轉向國產算力適配后,梁文鋒自己承認了一個殘酷事實:國內最好的水平和海外最好相比,模型結構和訓練動力學上可能有一倍差距,數據效率上也有一倍差距,"合起來就要多消耗4倍算力"。而大廠——字節跳動Seed團隊規模上千人,阿里達摩院、騰訊AI Lab同樣擁有萬卡級算力集群——在算力儲備上,初創公司和大廠之間是一道量級級的鴻溝。
第二層:生態落差。 大模型的價值不在于模型本身,而在于模型嵌入產業生態后的變現能力。字節有抖音、飛書等數億級用戶場景可以即時驗證和落地;阿里有電商、云計算的完整AI商業化鏈路;騰訊有社交、游戲的龐大流量池。DeepSeek的技術再強,在商業化落地層面依然停留在API調用和開源模型輸出,技術成果轉化為商業價值的路徑遠長于大廠。對技術人員而言,研究成果能被數億人使用,和研究成果停留在論文和排行榜上,職業成就感完全不同。
第三層:信心動搖。V4從2026年2月中旬一推再推,至今未正式發布。在AI行業,模型的發布節奏就是技術生命線。當OpenAI連續推出GPT系列迭代、Claude快速升級、字節豆包市場份額持續攀升時,DeepSeek在V3.2之后的"靜默期",對內部信心的侵蝕遠超外部想象。一個沒有明確績效考核、沒有DDL、每天下午6點下班的研究團隊,當外部競爭壓力加大、內部看不到新一代模型落地的節點時,人才出走只是時間問題。
雙向流動的真相:巨頭也在流血
值得注意的是,人才爭奪戰并非單向收割。過去一年,字節跳動Seed團隊同樣流失了近70名技術人才——近30人加入騰訊AI Infra團隊,部分流向阿里、OpenAI、Google、Meta等。字節系前員工創辦了30余家AI創業公司,覆蓋Agent、多模態創作、具身智能等賽道。
而DeepSeek也在吸納人才:從字節搜索團隊挖來李宇琨(DeepSeek首位員工,負責預訓練數據),從字節Seed Edge引入徐名宇(從事模型結構研發)。人才的流向從來不是單向的,但格局很清晰——大廠和初創公司之間的人才交換,大廠憑借規模和確定性,始終處于凈流入端。
這意味著,DeepSeek面對的不是一個偶發的人才流失事件,而是一個系統性的競爭劣勢:在人才市場的"匯率"中,大廠的薪酬包、算力儲備和生態場景構成了"硬通貨",初創公司能打出的牌,只有技術理想和組織自由度——這兩張牌,在現實面前越來越不好用。
梁文鋒的妥協與代價
2025年下半年起,梁文鋒開始發生轉變:從技術理想主義者向商業化實踐者靠攏。
具體動作包括:2025年秋天起頻繁提及產品化和商業化方向,首次招聘"模型策略產品經理"等非研究崗,開始想辦法給公司做估值、給團隊更確定的預期。2026年4月17日,The Information報道DeepSeek正在以超100億美元估值尋求至少3億美元首輪融資。
這是一個標志性事件。2023年,梁文鋒拒絕了所有外部投資,堅持獨立發展。三年后,核心人才出走、V4遲遲難產、國產算力適配工程量遠超預期——純粹的技術理想,終究要為算力賬單和人才賬單買單。
但問題在于,接受融資只是第一步。融資到位后,DeepSeek將面臨一個更棘手的平衡題:如何在引入資本后保持技術團隊的專注力和自由度?如何在提升薪酬競爭力的同時避免大廠化的層級膨脹?在V4發布后,技術領先性能否轉化為商業壁壘?
這些問題,沒有一個是靠錢能解決的。
結語
DeepSeek的人才困局,給整個AI行業提了一個醒:當核心人才可以用8位數總包精準定價時,技術理想就成了最廉價的留人工具。
這不是對DeepSeek的否定。在不到200人的團隊規模下,用遠低于大廠的算力和人力,做出V3/R1這樣震動行業的產品,本身就是中國AI硬科技實力的證明。但這也恰恰說明了一個殘酷的現實——在技術密集型賽道上,個體的技術突破可以被復制,而系統的資源優勢不可逾越。
對整個行業而言,需要思考的不是"DeepSeek能不能留住人",而是"如何在巨頭的資源碾壓下,為技術理想主義留出生存空間"。這個問題,比任何一個模型的訓練成本都更值得算清楚。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.