網易首頁 > 網易號 > 正文申請入駐

梁文鋒想通了

2026-04-19 11:28:26　來源: 字母榜

北京舉報

分享至

DeepSeek終于傳出了融資消息。

據外媒報道，DeepSeek正在尋求至少3億美元的首輪外部融資，估值至少100億美元。

字母榜向深度求索求證，但對方未予回應。

2025年初DeepSeek爆火之后，投資人們曾密集尋找見梁文鋒的機會，但DeepSeek長期沒有開放融資窗口。

過去一年，DeepSeek最特殊的地方，恰恰在于它不像一家典型AI公司。

它背后有幻方量化供血，梁文鋒不急著融資，也不急著把公司推上估值、商業化和資本退出的流水線。

DeepSeek對自己的定位，與其說是一家商業公司，不如說更像是一個完全獨立于資本市場而運作的開源研究機構。

融資傳聞出現后，市場馬上聞風而動。投資人

估計已經把梁文鋒電話打爆了，

甚至有人已經準備訂機票，只為這一次能夠

見到梁文鋒，獲得投資DeepSeek的機會。

然而，時間畢竟已經過去了一年，DeepSeek自身和市場都出現了難以忽視和影響深遠的變化。

過去一年，DeepSeek當然不能說技術上已經落后。但如果和同行相比，很多同行已經做了很多DeepSeek沒有做、或者沒有做成體系的事情。

字節有豆包、有即夢、有Seedance視頻生成模型；阿里和騰訊開始把世界模型推到臺前；騰訊元寶、阿里千問都在往各自生態里嵌；智譜、MiniMax已經登陸港股，并在二級市場上完成了新的估值重估。

資本市場的參照系也變了。

如果只看DeepSeek至少100億美元的估值，它當然還是一家很貴的AI公司。

可放在今天的中國AI坐標系里，這個數字已經不再驚人。智譜、MiniMax在港股高點的市值都曾突破3000億港元，按部分市場口徑折算，DeepSeek的百億美元估值只是它們的一小部分，而月之暗面這樣的“小龍”，最新估值已經達到了180億美元。

如果這次融資三億美元的傳聞屬實，那對DeepSeek來說，至少有兩道關已經邁過去了。

第一，DeepSeek不再視融資為畏途。

服務器、數據、算力、商業化、人才、期權，每一項都不是純研究機構可以長期繞開的東西。

尤其是人才成本，已經比一年前高了太多。

DeepSeek過去可以靠技術理想、開源聲望和梁文鋒的個人號召力凝聚一批人，但當郭達雅在字節獲得近億的年包時，作為DeepSeek員工，能不能用期權分到公司的發展紅利，這件事就顯得格外重要。

某種程度來說，期權也給梁文鋒減少了壓力，讓員工拿走員工應得的那部分，梁文鋒自己也就無需過多操心了。

第二，DeepSeek正在回歸一家商業公司的正常發展路徑。

公司的歸公司。研究理想可以繼續存在，但公司終究需要治理結構、估值體系、薪酬激勵、商業化收入和長期預算。

過去DeepSeek被要求每一次發布都震撼世界。現在它需要做的，反而是成為一家正常公司。

DeepSeek的底層模型能力仍然很強。

它在模型算法、工程效率、開源路線和降低推理成本上的貢獻，仍然是中國AI過去一年最重要的技術事件之一。R1證明了一個小團隊也可以用更少資源、更開放路線，做出世界級模型。

然而事實上，今天的AI競爭已經不是單點模型能力的競爭。

DeepSeek最強的是模型本身，同行則在模型之外做了更多事情。

最明顯的是產品入口。

DeepSeek曾經是國內AI App增長最快的名字，但到了2025年下半年，豆包已經在月活規模上反超DeepSeek。QuestMobile的報告顯示，2025年8月，豆包以約1.57億月活登上中國原生AI App月活榜首，DeepSeek退居第二。

字節透露，截止至目前，豆包在2026年3月的全渠道月活躍用戶已突破3.31億，是第2至第5名產品的月活總和。

這說明一件事，模型爆紅可以帶來巨大的第一波流量，長期用戶規模要靠產品、場景、運營和生態入口留住。

字節的優勢就在這里。豆包背后有抖音、剪映、火山引擎和內容生態，即夢承接創作需求，Seedance 2.0又把視頻生成能力推到市場焦點。

DeepSeek雖說在模型社區里有聲望，而在大眾產品層面，它并沒有形成豆包那種持續分發和高頻使用能力。

多模態也是類似問題。

DeepSeek做過Janus-Pro，也做過DeepSeek-OCR，但它還沒有形成一個足夠穩定、完整、強勢的多模態產品體系。今天的AI競爭越來越強調文本、圖像、語音、視頻、工具和Agent的統一體驗。OpenAI、Google、Anthropic在往這個方向走，國內的字節、阿里、騰訊也在往這個方向走。

阿里和騰訊開始押注世界模型，就是一個很典型的信號。

阿里發布Happy Oyster，強調可互動、可演繹、可探索的AI數字世界；騰訊發布并開源混元3D世界模型2.0，面向文字、圖片、視頻輸入生成和模擬3D世界。

這些未必立刻變成成熟商業收入，但它們代表了大廠正在把AI能力從聊天框、代碼框，往更復雜的空間、視頻、游戲和內容生產場景里推。

字節則是在視頻生成上持續加碼。

Seedance 2.0發布后，市場關注點已經不只是“能不能生成一段視頻”，而是多鏡頭、音畫同步、敘事節奏、人物動作和生產流程。這些能力一旦和剪映、抖音、電商廣告、影視制作連接起來，就會形成DeepSeek目前很難復制的產品閉環。

Agent和AI編程也是DeepSeek的短板。

DeepSeek不是沒有工具調用和agent能力，但它還沒有在開發者心智里形成類似Claude、GPT、Kimi、MiniMax、騰訊、阿里那樣明確的生產力入口。

AI編程正在成為大模型商業化最清晰的場景，開發者會選擇效果好、穩定性強的。以OpenClaw為例，幾乎沒有人會用DeepSeek來養龍蝦，因為效果實在是不盡人意。

這就是DeepSeek眼下面臨的真實處境。

它不是不強，而是強得不夠完整。

它在模型效率上仍然有優勢，但在App入口、多模態、視頻生成、世界模型、Agent、AI編程、企業服務和生態分發上，都被同行拉開了距離。對一家過去以“技術奇跡”被記住的公司來說，這種落差尤其刺眼。

梁文鋒這次融資，不能只理解成缺錢。

更準確地說，是梁文鋒意識到，單靠基礎模型上已經不足以支撐下一階段競爭。

DeepSeek需要更多，比如人才、服務器、以及一個更完整的商業生態。

DeepSeek現在最緊迫的問題，是人才。

從2025年下半年開始，外界陸續看到幾位核心成員離開。

參與早期大模型訓練的王炳宣去了騰訊，DeepSeek-OCR核心作者魏浩然離開，DeepSeek-R1核心作者郭達雅去了字節。從幻方時期加入、參與Janus-Pro等多模態工作的阮翀，也在2026年1月官宣加入元戎啟行。羅福莉也已加入小米，負責相關AI業務。

這是DeepSeek爆紅之后必然要面對的市場結果。他們的核心研究員就會成為所有大廠和AI創業公司爭奪的對象。

過去，DeepSeek是一個理想主義團隊。

它的人才吸引力來自技術挑戰、開源聲望、研究自由和梁文鋒本人。但今天AI行業的人才定價已經完全不同了，頂尖的行業研究員拿到近億年包已經成為常態。可DeepSeek沒辦法開出這樣的價碼。

所以對梁文鋒來說，期權變得越來越重要。

DeepSeek過去不融資，不對外定價，保持獨立運作，短期看可以減少外部干擾。

但長期看，員工手里的期權很難被清晰定價。

別的公司有融資輪次、有上市預期、有二級市場價格，員工至少知道自己手里的東西大概值多少錢。

DeepSeek如果沒有外部估值，沒有清晰激勵體系，就很難讓核心人才相信自己一定能分享到公司成長紅利。

恒業資本創始合伙人江一表示，公司需要估值定價，因為大廠給人才開的不是單純現金，而是現金加高估值期權。沒有明確估值，DeepSeek很難讓員工準確判斷自己手里的期權到底對應什么未來。

這也是3億美元融資真正重要的地方。

它未必是為了立刻大規模燒錢。按照江一的看法，100億美元以下的估值對梁文鋒來說是偏低。

正如文章開頭提到的，如果估值過高，梁文鋒自己也要背上更大的增長壓力。因此，這一輪融資很可能不只是拿錢，更是給公司定價，給團隊定價，也給未來的激勵體系定價。

DeepSeek早期的魅力，正來自它沒有被資本市場推著走。江一提到，梁文鋒本人的性格就是如此，他比較反感投資人干預公司決策。

對一個技術理想很強的創始人來說，融資意味著新的股東、新的約束、新的溝通成本，也意味著公司不可能再完全按照研究團隊的節奏運轉。

但這也是正常公司必須面對的代價。

公司的歸公司，員工的歸員工。

如果DeepSeek希望繼續留住最頂尖的人，它就必須讓團隊成員看到可兌現的未來。不能只要求他們相信模型會越來越強，也要讓他們相信，公司越來越值錢的時候，自己也能分到那部分發展紅利。

DeepSeek要回歸正常公司，人才只是第一關。

第二關是服務穩定性。

2026年3月底，DeepSeek經歷了長達11小時的宕機，這次宕機甚至登上熱搜。模型能力再強，只要它面向海量用戶和開發者提供服務，就必須接受商業化檢驗。服務器不穩，最簡單、最直接的方法就是花錢買更多服務器，購買更多算力和冗余資源，建設更強的云服務與運維體系。

當然，工程優化、調度策略、模型壓縮、緩存機制都重要。

但在高峰流量面前，很多問題最后仍然會落回資金投入。用戶不會因為一家公司的訓練故事足夠漂亮，就能長期忍受不可用、排隊過久或API波動。開發者也不會因為一個模型曾經震撼世界，就把核心業務壓在不穩定的接口上。

好模型只是起點，穩定服務才是日常。

第三關是數據和訓練成本。

江一提到，早期DeepSeek訓練成本相對低，是因為團隊在模型結構、工程效率和蒸餾等方法上做得足夠極致。

但到了V4階段，單輪訓練成本可能已經大于5億美元。

與此同時，Anthropic等企業對蒸餾路徑進行封鎖之后，DeepSeek下半年如果繼續沖擊第一梯隊，就需要采購更多高質量數據集，訓練成本會明顯抬升。

DeepSeek過去最被外界津津樂道的“低成本奇跡”，不會自然延續到以后的模型里。

低成本訓練證明了團隊能力，但下一代基礎模型仍然要面對很樸素的產業規律，即Scaling Law。

更強模型通常需要更多高質量數據、更大規模算力、更復雜的后訓練系統、更高強度的評測和安全對齊。基礎模型很花錢，也很吃算力。越接近第一梯隊，邊際成本越高。

這還沒有算上國產算力適配和合規成本。

江一提到，幻方量化去年收入不錯，今年也保持較好水平，但國內圍繞量化交易出現了不少監管和合規要求，相關調整本身就需要投入。

另一方面，DeepSeek如果要適配國產算力，也需要工程團隊、測試體系和長期磨合。這份投入不是一次性開支，而是持續消耗。

第四關是商業化。

過去DeepSeek的邏輯很清晰：開源模型制造影響力，API收費承接開發者需求，優秀模型能力帶來傳播和調用。

但這套邏輯對今天的DeepSeek來說已經不夠用了。

江一表示，梁文鋒現在想給DeepSeek找到一個完整的商業體系，比如訂閱制，以及不同檔位的API收費。

生態不是把模型開源出去就自然長出來的，它需要穩定API、開發者工具、企業服務、文檔體系、計費體系、安全合規、客戶成功和渠道合作。

DeepSeek如果要從0到1撐起商業生態，就必須承擔基礎設施建設的成本。

單純依賴開源聲量和基礎API收入，很難支撐一家具備全球影響力的基礎模型公司繼續向前。商業化不是背叛技術路線，而是技術路線進入長期競爭后必須補上的底座。

所以，DeepSeek融資不是一個孤立事件。

它是服務器、數據、算力、人才、期權、商業化生態疊加在一起之后的必然結果。對于像DeepSeek這樣，以模型能力立身的公司來說，這些事物反而比估值數字本身更關鍵。

也因此，DeepSeek回到融資、估值、商業化這條“正常公司”的路徑，并不是退步。

DeepSeek回歸正常，對DeepSeek是好事，對梁文鋒也是好事。

融資不一定就代表梁文鋒被資本裹挾，也可以意味著一家公司終于有能力承擔更長期的競爭。

對用戶和行業來說，也該告別“DeepSeek時刻”了。

真正健康的局面，應該是DeepSeek繼續做DeepSeek，其他模型也被看見、被比較、被承認。中國AI不應該永遠等待一個名字再次震撼世界，而應該讓很多公司在不同方向上一起往前走。

放過DeepSeek，也放過人們自己的執念。

一家公司的成熟，常常不是從掌聲最響的那一天開始，而是從掌聲落下之后，它仍然愿意去修服務器、買數據、招人、談客戶、發賬單、處理宕機、重寫文檔、把產品一點點變穩定開始。

如果DeepSeek真的走到這一步，它并不是失去特殊性。

它只是終于從一個被仰望的故事，回到了一家公司應該站立的地面。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.