![]()
DeepSeek終于傳出了融資消息。
據外媒報道,DeepSeek正在尋求至少3億美元的首輪外部融資,估值至少100億美元。
![]()
字母榜向深度求索求證,但對方未予回應。
2025年初DeepSeek爆火之后,投資人們曾密集尋找見梁文鋒的機會,但DeepSeek長期沒有開放融資窗口。
過去一年,DeepSeek最特殊的地方,恰恰在于它不像一家典型AI公司。
它背后有幻方量化供血,梁文鋒不急著融資,也不急著把公司推上估值、商業化和資本退出的流水線。
DeepSeek對自己的定位,與其說是一家商業公司,不如說更像是一個完全獨立于資本市場而運作的開源研究機構。
融資傳聞出現后,市場馬上聞風而動。投資人
估計已經把梁文鋒電話打爆了,
甚至有人已經準備訂機票,只為這一次能夠
見到梁文鋒,獲得投資DeepSeek的機會。
然而,時間畢竟已經過去了一年,DeepSeek自身和市場都出現了難以忽視和影響深遠的變化。
過去一年,DeepSeek當然不能說技術上已經落后。但如果和同行相比,很多同行已經做了很多DeepSeek沒有做、或者沒有做成體系的事情。
字節有豆包、有即夢、有Seedance視頻生成模型;阿里和騰訊開始把世界模型推到臺前;騰訊元寶、阿里千問都在往各自生態里嵌;智譜、MiniMax已經登陸港股,并在二級市場上完成了新的估值重估。
資本市場的參照系也變了。
如果只看DeepSeek至少100億美元的估值,它當然還是一家很貴的AI公司。
可放在今天的中國AI坐標系里,這個數字已經不再驚人。智譜、MiniMax在港股高點的市值都曾突破3000億港元,按部分市場口徑折算,DeepSeek的百億美元估值只是它們的一小部分,而月之暗面這樣的“小龍”,最新估值已經達到了180億美元。
如果這次融資三億美元的傳聞屬實,那對DeepSeek來說,至少有兩道關已經邁過去了。
第一,DeepSeek不再視融資為畏途。
服務器、數據、算力、商業化、人才、期權,每一項都不是純研究機構可以長期繞開的東西。
尤其是人才成本,已經比一年前高了太多。
DeepSeek過去可以靠技術理想、開源聲望和梁文鋒的個人號召力凝聚一批人,但當郭達雅在字節獲得近億的年包時,作為DeepSeek員工,能不能用期權分到公司的發展紅利,這件事就顯得格外重要。
某種程度來說,期權也給梁文鋒減少了壓力,讓員工拿走員工應得的那部分,梁文鋒自己也就無需過多操心了。
第二,DeepSeek正在回歸一家商業公司的正常發展路徑。
公司的歸公司。研究理想可以繼續存在,但公司終究需要治理結構、估值體系、薪酬激勵、商業化收入和長期預算。
過去DeepSeek被要求每一次發布都震撼世界。現在它需要做的,反而是成為一家正常公司。
A
DeepSeek的底層模型能力仍然很強。
它在模型算法、工程效率、開源路線和降低推理成本上的貢獻,仍然是中國AI過去一年最重要的技術事件之一。R1證明了一個小團隊也可以用更少資源、更開放路線,做出世界級模型。
然而事實上,今天的AI競爭已經不是單點模型能力的競爭。
DeepSeek最強的是模型本身,同行則在模型之外做了更多事情。
最明顯的是產品入口。
DeepSeek曾經是國內AI App增長最快的名字,但到了2025年下半年,豆包已經在月活規模上反超DeepSeek。QuestMobile的報告顯示,2025年8月,豆包以約1.57億月活登上中國原生AI App月活榜首,DeepSeek退居第二。
字節透露,截止至目前,豆包在2026年3月的全渠道月活躍用戶已突破3.31億,是第2至第5名產品的月活總和。
這說明一件事,模型爆紅可以帶來巨大的第一波流量,長期用戶規模要靠產品、場景、運營和生態入口留住。
字節的優勢就在這里。豆包背后有抖音、剪映、火山引擎和內容生態,即夢承接創作需求,Seedance 2.0又把視頻生成能力推到市場焦點。
DeepSeek雖說在模型社區里有聲望,而在大眾產品層面,它并沒有形成豆包那種持續分發和高頻使用能力。
多模態也是類似問題。
DeepSeek做過Janus-Pro,也做過DeepSeek-OCR,但它還沒有形成一個足夠穩定、完整、強勢的多模態產品體系。今天的AI競爭越來越強調文本、圖像、語音、視頻、工具和Agent的統一體驗。OpenAI、Google、Anthropic在往這個方向走,國內的字節、阿里、騰訊也在往這個方向走。
阿里和騰訊開始押注世界模型,就是一個很典型的信號。
阿里發布Happy Oyster,強調可互動、可演繹、可探索的AI數字世界;騰訊發布并開源混元3D世界模型2.0,面向文字、圖片、視頻輸入生成和模擬3D世界。
這些未必立刻變成成熟商業收入,但它們代表了大廠正在把AI能力從聊天框、代碼框,往更復雜的空間、視頻、游戲和內容生產場景里推。
字節則是在視頻生成上持續加碼。
Seedance 2.0發布后,市場關注點已經不只是“能不能生成一段視頻”,而是多鏡頭、音畫同步、敘事節奏、人物動作和生產流程。這些能力一旦和剪映、抖音、電商廣告、影視制作連接起來,就會形成DeepSeek目前很難復制的產品閉環。
Agent和AI編程也是DeepSeek的短板。
DeepSeek不是沒有工具調用和agent能力,但它還沒有在開發者心智里形成類似Claude、GPT、Kimi、MiniMax、騰訊、阿里那樣明確的生產力入口。
![]()
AI編程正在成為大模型商業化最清晰的場景,開發者會選擇效果好、穩定性強的。以OpenClaw為例,幾乎沒有人會用DeepSeek來養龍蝦,因為效果實在是不盡人意。
這就是DeepSeek眼下面臨的真實處境。
它不是不強,而是強得不夠完整。
它在模型效率上仍然有優勢,但在App入口、多模態、視頻生成、世界模型、Agent、AI編程、企業服務和生態分發上,都被同行拉開了距離。對一家過去以“技術奇跡”被記住的公司來說,這種落差尤其刺眼。
梁文鋒這次融資,不能只理解成缺錢。
更準確地說,是梁文鋒意識到,單靠基礎模型上已經不足以支撐下一階段競爭。
DeepSeek需要更多,比如人才、服務器、以及一個更完整的商業生態。
B
DeepSeek現在最緊迫的問題,是人才。
從2025年下半年開始,外界陸續看到幾位核心成員離開。
參與早期大模型訓練的王炳宣去了騰訊,DeepSeek-OCR核心作者魏浩然離開,DeepSeek-R1核心作者郭達雅去了字節。從幻方時期加入、參與Janus-Pro等多模態工作的阮翀,也在2026年1月官宣加入元戎啟行。羅福莉也已加入小米,負責相關AI業務。
![]()
這是DeepSeek爆紅之后必然要面對的市場結果。他們的核心研究員就會成為所有大廠和AI創業公司爭奪的對象。
過去,DeepSeek是一個理想主義團隊。
它的人才吸引力來自技術挑戰、開源聲望、研究自由和梁文鋒本人。但今天AI行業的人才定價已經完全不同了,頂尖的行業研究員拿到近億年包已經成為常態。可DeepSeek沒辦法開出這樣的價碼。
所以對梁文鋒來說,期權變得越來越重要。
DeepSeek過去不融資,不對外定價,保持獨立運作,短期看可以減少外部干擾。
但長期看,員工手里的期權很難被清晰定價。
別的公司有融資輪次、有上市預期、有二級市場價格,員工至少知道自己手里的東西大概值多少錢。
DeepSeek如果沒有外部估值,沒有清晰激勵體系,就很難讓核心人才相信自己一定能分享到公司成長紅利。
恒業資本創始合伙人江一表示,公司需要估值定價,因為大廠給人才開的不是單純現金,而是現金加高估值期權。沒有明確估值,DeepSeek很難讓員工準確判斷自己手里的期權到底對應什么未來。
這也是3億美元融資真正重要的地方。
它未必是為了立刻大規模燒錢。按照江一的看法,100億美元以下的估值對梁文鋒來說是偏低。
正如文章開頭提到的,如果估值過高,梁文鋒自己也要背上更大的增長壓力。因此,這一輪融資很可能不只是拿錢,更是給公司定價,給團隊定價,也給未來的激勵體系定價。
DeepSeek早期的魅力,正來自它沒有被資本市場推著走。江一提到,梁文鋒本人的性格就是如此,他比較反感投資人干預公司決策。
對一個技術理想很強的創始人來說,融資意味著新的股東、新的約束、新的溝通成本,也意味著公司不可能再完全按照研究團隊的節奏運轉。
但這也是正常公司必須面對的代價。
公司的歸公司,員工的歸員工。
如果DeepSeek希望繼續留住最頂尖的人,它就必須讓團隊成員看到可兌現的未來。不能只要求他們相信模型會越來越強,也要讓他們相信,公司越來越值錢的時候,自己也能分到那部分發展紅利。
C
DeepSeek要回歸正常公司,人才只是第一關。
第二關是服務穩定性。
2026年3月底,DeepSeek經歷了長達11小時的宕機,這次宕機甚至登上熱搜。模型能力再強,只要它面向海量用戶和開發者提供服務,就必須接受商業化檢驗。服務器不穩,最簡單、最直接的方法就是花錢買更多服務器,購買更多算力和冗余資源,建設更強的云服務與運維體系。
當然,工程優化、調度策略、模型壓縮、緩存機制都重要。
但在高峰流量面前,很多問題最后仍然會落回資金投入。用戶不會因為一家公司的訓練故事足夠漂亮,就能長期忍受不可用、排隊過久或API波動。開發者也不會因為一個模型曾經震撼世界,就把核心業務壓在不穩定的接口上。
好模型只是起點,穩定服務才是日常。
第三關是數據和訓練成本。
江一提到,早期DeepSeek訓練成本相對低,是因為團隊在模型結構、工程效率和蒸餾等方法上做得足夠極致。
但到了V4階段,單輪訓練成本可能已經大于5億美元。
與此同時,Anthropic等企業對蒸餾路徑進行封鎖之后,DeepSeek下半年如果繼續沖擊第一梯隊,就需要采購更多高質量數據集,訓練成本會明顯抬升。
DeepSeek過去最被外界津津樂道的“低成本奇跡”,不會自然延續到以后的模型里。
低成本訓練證明了團隊能力,但下一代基礎模型仍然要面對很樸素的產業規律,即Scaling Law。
更強模型通常需要更多高質量數據、更大規模算力、更復雜的后訓練系統、更高強度的評測和安全對齊。基礎模型很花錢,也很吃算力。越接近第一梯隊,邊際成本越高。
這還沒有算上國產算力適配和合規成本。
江一提到,幻方量化去年收入不錯,今年也保持較好水平,但國內圍繞量化交易出現了不少監管和合規要求,相關調整本身就需要投入。
另一方面,DeepSeek如果要適配國產算力,也需要工程團隊、測試體系和長期磨合。這份投入不是一次性開支,而是持續消耗。
第四關是商業化。
過去DeepSeek的邏輯很清晰:開源模型制造影響力,API收費承接開發者需求,優秀模型能力帶來傳播和調用。
但這套邏輯對今天的DeepSeek來說已經不夠用了。
江一表示,梁文鋒現在想給DeepSeek找到一個完整的商業體系,比如訂閱制,以及不同檔位的API收費。
生態不是把模型開源出去就自然長出來的,它需要穩定API、開發者工具、企業服務、文檔體系、計費體系、安全合規、客戶成功和渠道合作。
DeepSeek如果要從0到1撐起商業生態,就必須承擔基礎設施建設的成本。
單純依賴開源聲量和基礎API收入,很難支撐一家具備全球影響力的基礎模型公司繼續向前。商業化不是背叛技術路線,而是技術路線進入長期競爭后必須補上的底座。
所以,DeepSeek融資不是一個孤立事件。
![]()
它是服務器、數據、算力、人才、期權、商業化生態疊加在一起之后的必然結果。對于像DeepSeek這樣,以模型能力立身的公司來說,這些事物反而比估值數字本身更關鍵。
也因此,DeepSeek回到融資、估值、商業化這條“正常公司”的路徑,并不是退步。
DeepSeek回歸正常,對DeepSeek是好事,對梁文鋒也是好事。
融資不一定就代表梁文鋒被資本裹挾,也可以意味著一家公司終于有能力承擔更長期的競爭。
對用戶和行業來說,也該告別“DeepSeek時刻”了。
真正健康的局面,應該是DeepSeek繼續做DeepSeek,其他模型也被看見、被比較、被承認。中國AI不應該永遠等待一個名字再次震撼世界,而應該讓很多公司在不同方向上一起往前走。
放過DeepSeek,也放過人們自己的執念。
一家公司的成熟,常常不是從掌聲最響的那一天開始,而是從掌聲落下之后,它仍然愿意去修服務器、買數據、招人、談客戶、發賬單、處理宕機、重寫文檔、把產品一點點變穩定開始。
如果DeepSeek真的走到這一步,它并不是失去特殊性。
它只是終于從一個被仰望的故事,回到了一家公司應該站立的地面。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.