當頂級風投警告AI公司"趕緊把算力合同落實在紙上"時,一家西班牙創業公司給出了完全不同的解法:干脆別用云了。
Multiverse Computing——這家名字聽起來像科幻小說的公司——正在把壓縮后的AI模型直接塞進你的手機。不是演示,是正經上線了一個能離線跑的聊天應用,外加一個開發者能直接調用的API門戶。
![]()
為什么現在必須關注"小模型"
Lux Capital最近給被投企業發了份備忘錄:私募公司違約率已經飆到9.2%,是多年高點。AI供應鏈的金融風險正在蔓延,"握手協議"不夠用了。
這背后是個被低估的系統性風險。訓練大模型需要搶英偉達GPU,推理需要租云服務,整個鏈條綁定了太多外部依賴。一旦上游資金鏈斷裂,或者地緣政治導致芯片禁運,你的AI產品可能直接停擺。
Multiverse的賭注是:與其加固這條脆弱的鏈條,不如切斷它。
他們的核心武器叫CompactifAI——一種"量子啟發"的模型壓縮技術。別被"量子"嚇到,這里沒用真正的量子計算機,而是借用了量子力學里的數學技巧來精簡神經網絡。
成果是什么?他們把OpenAI、Meta、DeepSeek、Mistral的主流模型都壓縮了一遍,然后塞進了一個叫Gilda的微型模型里。按公司說法,Gilda小到能在手機本地離線運行。
實測:這個App到底能不能用
CompactifAI應用已經上線iOS和Android。界面看起來跟ChatGPT或Mistral的Le Chat差不多——輸入問題,模型回答。
但底層邏輯完全不同。數據不離開設備,不需要網絡連接,理論上連Multiverse自己都看不到你在問什么。
這里有個 Tolkien 迷會會心一笑的設計:本地和云端的路由系統叫"Ash Nazg"——《魔戒》里至尊魔戒的銘文。當你的手機RAM或存儲不夠時(很多老款iPhone會觸發),系統自動切到云端API。這時候隱私優勢就沒了。
Sensor Tower的數據顯示,這個應用過去一個月下載量不到5000次。顯然不是沖C端爆款去的。
真正的目標在今天揭曉:自助式API門戶。開發者和企業可以直接調用壓縮模型,不需要經過AWS Marketplace,不需要跟云廠商簽長約。
壓縮技術的商業算盤
Multiverse不是唯一玩模型壓縮的。蘋果有Core ML,谷歌有Gemini Nano,微軟也在推Phi系列小模型。但Multiverse的路徑更激進:他們專門做"第三方壓縮",幫別人把已經訓練好的大模型瘦身。
這對企業客戶意味著什么?
第一,成本結構重構。云推理按token計費,用量大了就是無底洞。本地跑模型,一次性硬件成本,邊際成本趨近于零。
第二,合規門檻降低。GDPR、數據駐留法規越來越嚴,"數據不出境"從加分項變成必選項。本地處理天然合規。
第三,供應商風險對沖。不用綁死某一家云廠商,甚至可以在斷網環境下運行關鍵業務。
代價也很明顯。壓縮后的模型能力必然受損,Gilda跟GPT-4o沒法比。但Multiverse的 bet 是:對很多場景來說,"夠用且便宜"比"最強但貴"更有商業價值。
時間線復盤:從量子到邊緣
Multiverse成立于2019年,最初定位是"量子軟件公司"——幫企業用量子算法解決金融優化問題。這是當時歐洲量子創業潮的典型路徑。
![]()
2021-2022年,他們拿到幾輪政府資助和VC錢,但量子硬件成熟速度遠低于預期。客戶要的是現在能用的解決方案,不是五年后的承諾。
轉折點在2023年。團隊意識到,為量子計算機開發的數學工具——特別是張量網絡(tensor network)——可以用來壓縮經典神經網絡。這是"量子啟發"算法的真正落地場景。
2024年,他們開始對外展示壓縮成果:Llama 2、Mistral、后來的DeepSeek,都被他們瘦身過。客戶名單逐漸從金融機構擴展到需要邊緣AI的制造業、醫療、國防領域。
2025年3月,兩條產品線同時發布:C端展示用的CompactifAI應用,和B端變現用的API門戶。這標志著從"技術供應商"到"平臺公司"的轉型嘗試。
誰在為"離線AI"買單
Multiverse的現有客戶透露了幾個典型場景。
一家歐洲銀行在分行部署了壓縮后的客服模型。柜員可以在平板上離線查詢產品信息,不需要擔心客戶數據經過第三方服務器。合規部門 loves it。
一家工業傳感器廠商把模型塞進邊緣設備,用于實時質量檢測。工廠網絡不穩定,云端推理延遲不可接受,本地小模型是唯一能用的方案。
國防和情報客戶更激進。某些場景下,聯網本身就是安全風險。能在完全隔離的環境中運行的AI,有不可替代的價值。
這些案例的共同點:不是"用大模型做創新",而是"用足夠小的模型解決現有痛點"。
競爭格局:大象與螞蟻
Multiverse的壓縮技術有護城河嗎?
短期看,他們的know-how在于張量網絡的具體實現——怎么選擇壓縮維度、怎么保持特定任務的表現、怎么處理不同架構的模型。這需要數學功底和工程經驗的結合。
但大廠也在快速跟進。蘋果的MLX框架、谷歌的Gemini Nano、高通的AI Stack,都在降低端側模型的部署門檻。如果蘋果明天宣布"一鍵壓縮任意模型到iPhone",Multiverse的獨立價值會大幅縮水。
更長期的威脅來自硬件。如果端側NPU算力繼續指數增長,"壓縮"的需求本身會下降——直接跑原模型就行了。Multiverse的窗口期可能是3-5年。
他們的應對策略是垂直深入:不只做通用壓縮,而是針對金融、醫療、制造等場景做優化,把行業know-how變成新的壁壘。
為什么這件事值得興奮
AI行業過去兩年的敘事被"規模定律"主導:模型越大越好,算力越多越好,資本越密集越好。Multiverse代表了一條被忽視的支線:效率革命。
這不是反技術,而是技術民主化。當GPT-4級別的能力可以被壓縮到消費級硬件上運行時,AI的準入門檻會根本性降低。不需要10億美元融資,不需要英偉達GPU集群,一個小團隊也能做出有用的AI產品。
更重要的是韌性。一個依賴少數云廠商、少數芯片供應商的全球AI基礎設施,是單點故障的集合體。分布式、本地化的AI能力,是系統性風險的天然對沖。
Lux Capital的警告和Multiverse的產品,其實是同一枚硬幣的兩面:前者看到風險,后者提供出路。9.2%的違約率不會立刻摧毀AI行業,但它提醒我們,建立在沙灘上的城堡需要備選方案。
Multiverse的API門戶上線首周數據尚未公開,但Sensor Tower顯示其企業級SDK在過去六個月的集成請求增長了340%。這個數字本身說明:當算力焦慮蔓延時,"擺脫算力"成了最性感的賣點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.