網易首頁 > 網易號 > 正文申請入駐

當核心人才可以被精準定價：DeepSeek遭遇人才困局

2026-04-18 20:28:55　來源: 鈦媒體APP

北京舉報

分享至

文 | ICT解讀者—老解

2025年1月，DeepSeek-R1橫空出世，560萬美元的訓練成本、545%的成本利潤率，一串數據炸穿了中美AI圈對大模型研發的常識。美國風投家馬克·安德森稱之為AI領域的"斯普特尼克時刻"。梁文鋒登上《時代》周刊全球100影響力人物榜單，《自然》年度十大科學人物榜單上赫然在列。

但一年后的2026年4月，故事急轉直下。

據晚點LatePost報道，2025年下半年至今，DeepSeek至少5名核心研發成員確認離職——第一代大語言模型核心作者王炳宣去了騰訊，V3核心貢獻者羅福莉被雷軍千萬年薪挖至小米，R1核心研究員郭達雅以傳聞近億元總包入職字節跳動Seed團隊，OCR系列核心作者魏浩然和多模態成果核心貢獻者阮翀也先后離開。5個人，覆蓋了基座模型、推理、OCR、多模態四條核心技術主線。

與此同時，DeepSeek被曝正與投資人洽談首次外部融資，尋求以超100億美元估值籌集至少3億美元——這個曾經拒絕過多家頂級VC和科技巨頭投資邀約、堅持"純搞AGI創新"的技術理想主義者，終究開始向資本低頭。V4模型從原定2026年2月中旬一推再推，至今仍未正式發布。

這不是一個人的理想妥協，這是整個國產AI硬科技初創公司在巨頭碾壓下的一面鏡子。

200人的團隊，走了幾個就能動搖根基

DeepSeek總共不到200人，核心研究團隊約100多人，基模架構團隊僅小幾十人。更關鍵的是，這支團隊的構成極為年輕：本科和碩士占比超七成，30歲以下超七成，幾乎不社招，以應屆生和實習生留任為主。

在這樣一支規模不到大廠十分之一、人均工作時長不到大廠一半的精銳團隊中，每一個核心研究員的權重都被放大到了極致。王炳宣參與過歷代模型訓練，是DeepSeek從0到1的基座搭建者；郭達雅是V2、V3、R1系列模型的核心作者，一個人橫跨推理、代碼兩大方向；羅福莉是V3模型的關鍵開發者，被雷軍親自下場招募。

對大廠而言，流失一個核心研究員是局部損失；對DeepSeek而言，流失一個核心研究員意味著整條技術線出現斷層。這不是夸大其詞，而是小團隊的先天脆弱性——人少意味著每個人都是單點依賴，沒有人可以被"替代"。

薪資的數學題：情懷打不過2到3倍

人才為什么走？先算一筆賬。

據多方信源，DeepSeek的絕對薪資并不低，但競爭對手開出的條件"翻2到3倍問題不大"，部分甚至給出8位數總包（含股票/期權）。羅福莉的案例最具代表性——雷軍以千萬年薪加碼招募，親自盯這件事。郭達雅雖被字節官方否認"億元年薪"，但多路信源指向其總包遠超DeepSeek的薪酬體系。

再對比AI行業的整體薪酬水平：大模型算法工程師月薪中位數已達24760元，頂尖人才年薪逼近200萬元。北京海淀區官方發布的緊缺崗位目錄顯示，人工智能領域整體平均年薪為48.14萬元，而芯片算法與設計優化工程師年薪已突破百萬元。

DeepSeek的另一重劣勢在于長期激勵的缺失。2023年后，DeepSeek未再進行外部融資，員工期權協議沒有明確的公司估值支撐，流動性幾近于零。梁文鋒曾以類似OpenAI與微軟的"回報上限"協議嘗試接觸投資人，沒有機構接受。沒有估值、沒有上市預期、沒有期權變現通道——這紙期權在賬面上可能是天文數字，在現實中是一張無法兌現的期票。

大廠則恰恰相反。字節跳動雖未上市，但期權有明確的流通渠道；騰訊的股票激勵體系成熟；小米在港股上市，薪酬+期權的組合包可以做到精準定價。當一個95后研究員面臨"DeepSeek的無限可能"和"字節的8位數確定性"二選一時，理性的選擇并不難做。

不只是錢的事：算力、生態和"被替代"的恐懼

如果把DeepSeek的人才困境歸結為"給不起錢"，就低估了問題的復雜性。薪資只是表面，背后是三層結構性矛盾的疊加。

第一層：算力鴻溝。大模型訓練的本質是算力競賽。DeepSeek V3的訓練成本是560萬美元，但那是基于英偉達架構的極致效率優化。V4轉向國產算力適配后，梁文鋒自己承認了一個殘酷事實：國內最好的水平和海外最好相比，模型結構和訓練動力學上可能有一倍差距，數據效率上也有一倍差距，"合起來就要多消耗4倍算力"。而大廠——字節跳動Seed團隊規模上千人，阿里達摩院、騰訊AI Lab同樣擁有萬卡級算力集群——在算力儲備上，初創公司和大廠之間是一道量級級的鴻溝。

第二層：生態落差。大模型的價值不在于模型本身，而在于模型嵌入產業生態后的變現能力。字節有抖音、飛書等數億級用戶場景可以即時驗證和落地；阿里有電商、云計算的完整AI商業化鏈路；騰訊有社交、游戲的龐大流量池。DeepSeek的技術再強，在商業化落地層面依然停留在API調用和開源模型輸出，技術成果轉化為商業價值的路徑遠長于大廠。對技術人員而言，研究成果能被數億人使用，和研究成果停留在論文和排行榜上，職業成就感完全不同。

第三層：信心動搖。V4從2026年2月中旬一推再推，至今未正式發布。在AI行業，模型的發布節奏就是技術生命線。當OpenAI連續推出GPT系列迭代、Claude快速升級、字節豆包市場份額持續攀升時，DeepSeek在V3.2之后的"靜默期"，對內部信心的侵蝕遠超外部想象。一個沒有明確績效考核、沒有DDL、每天下午6點下班的研究團隊，當外部競爭壓力加大、內部看不到新一代模型落地的節點時，人才出走只是時間問題。

雙向流動的真相：巨頭也在流血

值得注意的是，人才爭奪戰并非單向收割。過去一年，字節跳動Seed團隊同樣流失了近70名技術人才——近30人加入騰訊AI Infra團隊，部分流向阿里、OpenAI、Google、Meta等。字節系前員工創辦了30余家AI創業公司，覆蓋Agent、多模態創作、具身智能等賽道。

而DeepSeek也在吸納人才：從字節搜索團隊挖來李宇琨（DeepSeek首位員工，負責預訓練數據），從字節Seed Edge引入徐名宇（從事模型結構研發）。人才的流向從來不是單向的，但格局很清晰——大廠和初創公司之間的人才交換，大廠憑借規模和確定性，始終處于凈流入端。

這意味著，DeepSeek面對的不是一個偶發的人才流失事件，而是一個系統性的競爭劣勢：在人才市場的"匯率"中，大廠的薪酬包、算力儲備和生態場景構成了"硬通貨"，初創公司能打出的牌，只有技術理想和組織自由度——這兩張牌，在現實面前越來越不好用。

梁文鋒的妥協與代價

2025年下半年起，梁文鋒開始發生轉變：從技術理想主義者向商業化實踐者靠攏。

具體動作包括：2025年秋天起頻繁提及產品化和商業化方向，首次招聘"模型策略產品經理"等非研究崗，開始想辦法給公司做估值、給團隊更確定的預期。2026年4月17日，The Information報道DeepSeek正在以超100億美元估值尋求至少3億美元首輪融資。

這是一個標志性事件。2023年，梁文鋒拒絕了所有外部投資，堅持獨立發展。三年后，核心人才出走、V4遲遲難產、國產算力適配工程量遠超預期——純粹的技術理想，終究要為算力賬單和人才賬單買單。

但問題在于，接受融資只是第一步。融資到位后，DeepSeek將面臨一個更棘手的平衡題：如何在引入資本后保持技術團隊的專注力和自由度？如何在提升薪酬競爭力的同時避免大廠化的層級膨脹？在V4發布后，技術領先性能否轉化為商業壁壘？

這些問題，沒有一個是靠錢能解決的。

結語

DeepSeek的人才困局，給整個AI行業提了一個醒：當核心人才可以用8位數總包精準定價時，技術理想就成了最廉價的留人工具。

這不是對DeepSeek的否定。在不到200人的團隊規模下，用遠低于大廠的算力和人力，做出V3/R1這樣震動行業的產品，本身就是中國AI硬科技實力的證明。但這也恰恰說明了一個殘酷的現實——在技術密集型賽道上，個體的技術突破可以被復制，而系統的資源優勢不可逾越。

對整個行業而言，需要思考的不是"DeepSeek能不能留住人"，而是"如何在巨頭的資源碾壓下，為技術理想主義留出生存空間"。這個問題，比任何一個模型的訓練成本都更值得算清楚。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.