![]()
據《The Information》援引知情人士報道,長期以“不融資”聞名的AI明星公司DeepSeek,正在與投資者洽談,計劃以至少100億美元的估值籌集不少于3億美元資金。這是這家由中國量化巨頭幻方量化孵化的公司成立以來首次啟動對外融資,標志著其長達數年的“自我供血”模式將畫上句號,也標志著DeepSeek從技術“理想主義”走向“現實主義”。
回顧DeepSeek的發展軌跡,這種轉變顯得尤為意味深長。在過去兩年中,當整個中國AI行業都在瘋狂融資、擴張、講生態故事時,DeepSeek反而在做一種刻意的收縮——不對外發聲,不頻繁發產品,不參與大廠敘事,甚至對資本保持距離。創始人梁文鋒從公司成立第一天就劃了一條清晰的紅線:不接受外部融資,不稀釋股權,不被任何人的商業化時間表綁架。他想打造的更像一個純粹的研究機構,追逐AGI(通用人工智能)、堅持開源、讓技術本身說話。
理想主義者的現實主義轉身
要理解DeepSeek為何在此時融資,首先得回顧它為何長期拒絕融資。
DeepSeek由量化對沖基金幻方量化的創始人梁文鋒于2023年創立。在此之前,幻方用多年的量化交易利潤為DeepSeek提供了持續的資金“輸血”。公司股權結構極為集中,梁文鋒直接和間接持有84.29%的股份,并擁有幾乎100%的表決權。
這種“不差錢”的底氣,讓梁文鋒得以堅守一種近乎理想主義的發展哲學:拒絕資本的短視干擾,專注打磨基礎模型,追求實現AGI的技術上限。
聯想創投高級合伙人宋春雨曾透露,自己早在2024年2月就與梁文鋒深入交流,但對方明確表示不融資。“梁文鋒對商業化不感興趣,他專注打磨基礎模型,確保每一代模型都保持領先。”另有報道稱,梁文鋒曾拒絕來自騰訊和阿里巴巴等科技巨頭的合作機會,擔心外部投資者會干預公司決策。
這一定位讓DeepSeek在早期創業公司中顯得格外另類。當其他大模型創業公司在2023-2024年瘋狂融資、高調亮相時,DeepSeek像一個隱士般潛心研發,直至V3和R1的橫空出世才讓世界注意到它的存在。
然而,這種“不缺錢”的自信在2026年初出現了明顯裂縫。最直接的信號來自人才流失。2025年底至2026年初,DeepSeek多名核心研發骨干相繼出走:V3架構關鍵開發者羅福莉轉投小米接手MiMo大模型團隊;第一代大語言模型核心作者王炳宣去了騰訊;多模態方向核心研究員阮翀加入元戎啟行;OCR系列核心作者魏浩然也在今年春節前后離開。
更致命的是期權問題。DeepSeek從未融資,沒有市場化的估值錨點。公司給核心成員的股權承諾,拿到手里無法換算成真金白銀。大廠的期權有行權價、有內部回購機制、有IPO預期。外界只知道DeepSeek很值錢,但到底值多少,沒有人能說清,員工更不知道。
而這些原因似乎也預示著DeepSeek的融資只是遲早的事。
多重壓力下的必然選擇
DeepSeek的融資轉折并非單一因素驅動,而是多重壓力交織下的必然結果。這些壓力來自技術迭代、算力需求、市場競爭和戰略節奏等多個維度,共同構成了梁文鋒不得不面對的現實困境。
技術迭代的沉重包袱是首要壓力。下一代旗艦模型V4的發布一再推遲,原本定在春節前后發布,推到2月,再推到3月,目前的口徑是4月下旬。從公開信息來看,延期背后至少有三層原因交織:技術路線本身發生質變、身份包袱壓力、國產芯片深度適配的挑戰。V4要做的已經不再是一個刷benchmark的基礎模型,而是萬億參數MoE架構、原生多模態、百萬token上下文、全新的Engram條件記憶機制的系統級工程,訓練驗證復雜度陡然上了一個臺階。
更深層的壓力來自身份包袱。DeepSeek立身靠的是“十分之一成本做到頂級”這個故事。V4如果只是性能微增卻推高了推理成本,支撐估值和聲譽的故事就會出現裂痕。某種程度上,一個不夠驚艷的V4,反而不如不發。
此外,國產芯片的深度適配成為獨立巨型工程。多方信源在4月初披露,V4將全面運行在華為昇騰950PR芯片上,有望成為首個完全跑在國產算力上的旗艦大模型。戰略價值極高,但這本身直接吃掉了大量研發帶寬。
到2026年4月,DeepSeek已有15個月沒有大版本更新。而這期間,OpenAI迭代四五輪,Anthropic連推Claude 4.5/4.6/4.7,國內同行如智譜、月之暗面、字節也在應用層狂飆突進。所有人都在加速,只有DeepSeek靜悄悄。
梁文鋒本人也曾坦言國產AI模型訓練效率的差距:“我們估計,國內最好的水平和國外最好的相比,模型結構和訓練動力學上可能有一倍的差距,光這一點我們要消耗兩倍的算力才能達到同樣效果。另外數據效率上可能也有一倍差距,也就是我們要消耗兩倍的訓練數據和算力,才能達到同樣的效果。合起來就要多消耗4倍算力。”這種客觀存在的技術差距,使得DeepSeek在追求技術領先的同時,必須面對更高的算力成本。
值得注意的是,在R1爆紅后,DeepSeek的用戶量和并發請求量呈指數級增長,對算力基礎設施的需求急劇攀升。2026年初,DeepSeek甚至經歷了一場大規模服務中斷,網頁端與App全面卡頓,“DeepSeek崩了”相關話題迅速沖上多個平臺熱搜。
與此同時,巨頭們正在以“千億級”規模加碼算力基建。阿里巴巴宣布未來三年投入3800億元建設云和AI硬件基礎設施;字節跳動2025年資本開支計劃高達1500億元,同比大增88%。相比之下,靠母公司幻方量化的資金支撐已明顯力不從心。
此外,前文提到的核心團隊頻頻被大廠高薪挖走,也造成了DeepSeek不得不獲取更多的錢,來留住現有的團隊,保持技術競爭力,畢竟在這個AI人才稀缺的當下,大廠對AI人才的需求與現有的人才供應差距很大。如果沒有足夠有吸引力的“未來”(包括薪資、股權等),是留不住人才的,這點從過去兩年AI人才市場的流動趨勢已經可以看出。
融資后的DeepSeek“路在何方”?
若DeepSeek成功獲得外部融資,這筆資金將為其在技術研發、市場拓展和商業變現等多個關鍵領域注入強大動力,進而對整個AI行業格局產生深遠影響。然而,融資只是開始,DeepSeek面臨的挑戰依然嚴峻。
技術研發的深度與廣度拓展將是融資后的首要方向。DeepSeek有望利用融資資金進一步加大對人工智能技術的研發投入。一方面,公司可能會持續優化現有模型,不斷提升其性能和智能化水平。另一方面,DeepSeek可能會加大對前沿技術的研究探索,如具身智能、AI Agent生態等領域。
這個過程中,其V4模型發布后,業界的反響將成為關鍵考驗。據報道,DeepSeek V4大模型將徹底重構技術架構,核心引入mHC(多路殘差混合連接)與Engram(AI記憶模塊)兩項黑科技,聚焦代碼生成、推理效率與邊緣部署三大能力,技術路徑從“堆參數”轉向“雙軸稀疏+記憶-計算分離”。市場預計,DeepSeek新模型訓練成本再降50%,若實現完全開源或將推動行業API價格減少60%。這將是DeepSeek證明自己依然保持技術領先優勢的重要機會。
市場拓展的全球化布局是第二戰略重點。憑借充足的資金,DeepSeek將有能力在全球范圍內積極拓展市場,提升品牌知名度和市場份額。在國內市場,DeepSeek可能會進一步加強與各行業企業的合作,深入挖掘行業需求,為金融、醫療、教育、制造業等領域提供更加定制化的人工智能解決方案。實際上,DeepSeek已經在多個行業展現出應用潛力:廣汽集團將自主研發的ADiGO SENSE端云一體大模型與DeepSeek-R1完成深度融合;重慶農商行企業微信上線基于DeepSeek模型的智能助手進行風險評估和欺詐監測;智云健康將DeepSeek-R1模型接入自研醫療人工智能系統“智云大腦”;網易有道借助DeepSeek-R1優化個性化答疑功能;中控技術實現了工業APP的智能構建。
在國際市場,DeepSeek可能會借鑒國際科技巨頭的市場拓展經驗,采取本地化策略,根據不同國家和地區的市場特點和用戶需求,推出針對性的產品和服務。當然,這個過程中還需要面對地緣政治的考驗。
此外,融資后,公司將有更多資源用于探索多元化的商業變現模式,實現技術價值的最大化。除了現有的API調用收費、私有化部署等商業模式外,DeepSeek可能會加強技術授權業務,將其先進的人工智能技術授權給其他企業使用。
然而,商業化轉型并非易事。梁文鋒曾明確表示擔憂外部干預可能讓DeepSeek變成“另一個商業機器”,而非技術革新的先鋒。高估值融資后,投資人可能要求快速增長或上市,迫使DeepSeek犧牲開源模式或長期研發計劃。如何在保持技術理想與滿足商業回報之間找到平衡,將是DeepSeek管理層需要解決的核心矛盾。
DeepSeek的轉折,從來不是梁文鋒一個人的“理想妥協”,而是整個國產AI行業的縮影。在AI這場殘酷的長期競賽中,技術理想主義需要商業現實的支撐,獨立自主需要開放合作的補充,前沿探索需要生態建設的協同。DeepSeek的融資之路,正是這種復雜平衡的開始。
(文|Leo張ToB雜談,作者|張申宇,編輯丨蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.