網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

速度提升百倍！XR空間計(jì)算正迎來“UGC大基建”時(shí)代

2026-03-13 18:06:26　來源: VR陀螺

廣東舉報(bào)

分享至

文/VR陀螺冉啟行

2026 年，AI 眼鏡正在快速迭代，VR/MR 頭顯的形態(tài)也在持續(xù)向更輕、更薄演進(jìn)。

隨著硬件門檻的逐步降低，開發(fā)者和內(nèi)容創(chuàng)作者對(duì)高質(zhì)量 3D 資產(chǎn)的需求正在同步提速——無論是 VR/MR 游戲場(chǎng)景、AR 應(yīng)用還是工業(yè)數(shù)字孿生，3D 內(nèi)容的生產(chǎn)效率與質(zhì)量正在被重新抬上核心議程。然而，傳統(tǒng)三維建模的周期長(zhǎng)、門檻高、成本難以攤薄，即便是專業(yè)團(tuán)隊(duì)，也很難用人力跟上內(nèi)容需求增長(zhǎng)的節(jié)奏。

visionOS（圖源：網(wǎng)絡(luò)）

在 GDC 2026 前夕，通用人工智能公司 VAST 正式發(fā)布了 Tripo P1.0（Smart Mesh），與旗艦?zāi)Ｐ?Tripo H3.1 相比，它在內(nèi)容生成上交出了一份完全不同范式的答案。Tripo P1.0 實(shí)現(xiàn)了第一次在原生三維空間里做概率生成，不再依賴序列化「拼接」幾何，而是在高維噪聲場(chǎng)中直接演化出結(jié)構(gòu)完備、拓?fù)湟?guī)整的三維網(wǎng)格，最快約 2 秒即可產(chǎn)出可直接進(jìn) Unity、UE 等引擎的專業(yè)級(jí) 3D 資產(chǎn)。

Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水嶺，它讓速度、質(zhì)量與工程可用性不再是互相犧牲的三難選擇，開始同時(shí)成立。對(duì) XR 等重 3D 資產(chǎn)的行業(yè)來說，這意味著 AI 3D 進(jìn)一步邁入了商用級(jí)規(guī)模化的新階段。

圖源：網(wǎng)絡(luò)

從維度詛咒到原生三維，Smart Mesh做的是底層算法重構(gòu)

傳統(tǒng) AI 3D 生成模型，在真正碰到可落地這件事時(shí)，往往會(huì)被維度詛咒卡住。三維空間數(shù)據(jù)過于龐大、結(jié)構(gòu)過于復(fù)雜，模型不得不通過體素網(wǎng)格、體渲染場(chǎng)或點(diǎn)云序列等形式先降維、再線性化處理，再通過一連串后處理把結(jié)果勉強(qiáng)還原成可用網(wǎng)格。這類路徑在學(xué)術(shù)論文和 Demo 中看上去可行，但一旦落到游戲、工業(yè)或 XR 生產(chǎn)線，問題就會(huì)集中爆發(fā)——生成速度慢、拓?fù)渑K亂、細(xì)節(jié)不穩(wěn)定、引擎兼容性差。

VAST 首席科學(xué)家曹炎培對(duì)此表示：“過去大家習(xí)慣了在 2D 矩陣或 1D 序列上做理解和生成，將處理文字、圖像、視頻的方法遷移到 3D上，本質(zhì)上還是在用不適合三維的表示去逼近三維，所以模型在表征層面會(huì)非常吃力。因?yàn)槿S空間本身有它自己的結(jié)構(gòu)特征，比如各向同性、連續(xù)性和拓?fù)浼s束。嚴(yán)格來說，問題并不在于維度高本身，而在于沒有找到三維數(shù)據(jù)真正合適的底層表征。經(jīng)典機(jī)器學(xué)習(xí)里也一樣，所謂‘維度詛咒’很多時(shí)候并不是維度本身不可解，而是你還沒有找到它背后的低維流形和本征結(jié)構(gòu)。一旦表征對(duì)了，很多原來看起來像詛咒的問題，其實(shí)都會(huì)被重新改寫。比如像我們現(xiàn)在做Tripo P1.0模型這樣找到正確的底層表征，這就不再是大問題。”

圖生3D模型演示（圖源：VR陀螺）

Tripo P1.0（Smart Mesh）的技術(shù)路徑是繞開了原來的一整套補(bǔ)丁式工程。官方將其定義為一套原生三維生成框架，不是在 2D 投影或隱式體上間接優(yōu)化，而是讓概率生成引擎首次在純?nèi)S坐標(biāo)空間中直接運(yùn)行，從一片高維噪聲場(chǎng)出發(fā)，在空間中逐層「生長(zhǎng)」出幾何結(jié)構(gòu)。模型不再是按序號(hào)逐點(diǎn)預(yù)測(cè)頂點(diǎn)，而是在統(tǒng)一的三維特征場(chǎng)上，先確定宏觀結(jié)構(gòu)，再向局部細(xì)節(jié)收斂，讓復(fù)雜空間坐標(biāo)同步收束成型。

在這個(gè)過程中，Smart Mesh 把原本顯式編碼在規(guī)則里的大量幾何先驗(yàn)，全部收進(jìn)了高維潛在空間。每一個(gè)頂點(diǎn)不僅僅是一個(gè)坐標(biāo)，而是帶著豐富上下文關(guān)系的潛在向量，彼此之間的連接關(guān)系通過潛在拓?fù)溆成浔怀掷m(xù)更新與收斂。當(dāng)概率空間收斂完成，模型直接涌現(xiàn)出一個(gè)幾何穩(wěn)定、拓?fù)鋰?yán)謹(jǐn)、可編輯性良好的網(wǎng)格。

3D模型演示

這種重構(gòu)帶來的直接結(jié)果，是模型不再被迫走“慢而精”或“快而糙”的老路，而是在統(tǒng)一的原生三維概率框架下，同時(shí)兼顧宏觀結(jié)構(gòu)、局部拓?fù)渑c細(xì)節(jié)紋理，為后續(xù)所有下游工程環(huán)節(jié)（減面、骨骼、動(dòng)畫、渲染）預(yù)留出最大空間。

百倍推理效率提升，秒級(jí)3D模型生成技術(shù)

底層重構(gòu)到底能給前端帶來多大改變？我們?cè)?Tripo Studio 中直接上手跑了跑。

輸入文本或參考圖后，幾乎不需要漫長(zhǎng)的等待。根據(jù)官方披露的數(shù)據(jù)，Smart Mesh 可以在約 2 秒內(nèi)生成面數(shù)從數(shù)百到兩萬不等、拓?fù)湟?guī)整的網(wǎng)格模型。受面數(shù)、當(dāng)前網(wǎng)絡(luò)環(huán)境及云端服務(wù)器擁擠程度影響，實(shí)際測(cè)試體感用時(shí)在 10 秒左右。但相比于行業(yè)普遍水平，這已經(jīng)實(shí)現(xiàn)了量級(jí)的跨越。

曹炎培表示：“我們用比較優(yōu)雅的數(shù)學(xué)推導(dǎo)繞過了之前離散組合的暴力算力消耗，這也是為什么之前的方法可能要三五百秒，而我們五六秒就能生成一個(gè)網(wǎng)格。背后所需算力被大大減少，不是強(qiáng)行壓縮計(jì)算量，而是免除了之前方法中因強(qiáng)加因果和排序所帶來的不必要計(jì)算。”

文生3D模型演示（圖源：VR陀螺）

最讓我們?cè)谝獾钠鋵?shí)不是速度，而是網(wǎng)格的質(zhì)量。以往 AI 生成的模型往往伴隨著破面和雜亂的邊線，但 Smart Mesh 跑出來的低多邊形網(wǎng)格，邊線清爽、結(jié)構(gòu)合理。

曹炎培對(duì)此表示：“我們相當(dāng)于把擁有多年經(jīng)驗(yàn)的藝術(shù)家才能做出的拓?fù)洳季€邏輯，變成了算法上的直覺。普通人通過一張圖或一個(gè)想法就能瞬間獲得一個(gè)外觀正確、結(jié)構(gòu)符合工業(yè)標(biāo)準(zhǔn)的資產(chǎn)，不管是創(chuàng)意設(shè)計(jì)還是生產(chǎn)力用戶，都能回歸到意圖本身。”

文生3D模型演示，局部重繪調(diào)整（圖源：VR陀螺）

這種“工業(yè)級(jí)直覺”早已在實(shí)際業(yè)務(wù)中顯現(xiàn)價(jià)值。其原有的 H 系列模型在技術(shù)與商業(yè)化上已穩(wěn)居行業(yè)頭部，并深度服務(wù)于網(wǎng)易《燕云十六聲》、拓竹科技等標(biāo)桿客戶，實(shí)現(xiàn)了 3D 打印與游戲 UGC 的大規(guī)模產(chǎn)業(yè)落地。在原有路線已領(lǐng)跑行業(yè)、商業(yè)價(jià)值全面兌現(xiàn)的背景下，團(tuán)隊(duì)依然堅(jiān)持從底層算法范式進(jìn)行顛覆式創(chuàng)新。 Smart Mesh 的出現(xiàn)，從某種程度上看，也代表著 VAST 的這家公司底色——極客精神。

從視覺擬真向功能性演進(jìn)，AI 3D開啟UGC互動(dòng)內(nèi)容新時(shí)代

今年 3 月，VAST 剛宣布完成 5000 萬美元的 A 輪融資。據(jù)介紹，這筆資金將主要用于 VAST 繼續(xù)迭代核心算法、積累數(shù)據(jù)，以及建設(shè) UGC 互動(dòng)內(nèi)容平臺(tái)。

如果說 AI 3D 的 1.0 時(shí)代是在追求“看起來真”，那么以 P1.0 為代表的 2.0 時(shí)代則是在追求“功能性”。曹炎培表示：“未來很快，大家就會(huì)模糊‘3D 建模’的概念。用戶會(huì)回歸到創(chuàng)造 3D 模型的原始意圖，而不是糾結(jié)于怎么用工具得到它。在當(dāng)今 AI 時(shí)代，VAST 提供的 AI 3D 生成能力是像輸入法、攝像頭一樣的基礎(chǔ)能力。”

AR應(yīng)用演示（圖源：AI生成）

在 VAST 的技術(shù)版圖中，高質(zhì)量的 3D 資產(chǎn)構(gòu)成了交互世界中持久性的“狀態(tài)”，而“世界模型”則負(fù)責(zé)建模狀態(tài)之間的“轉(zhuǎn)換”——比如角色怎么和環(huán)境交互、交互過程應(yīng)該怎樣自然地呈現(xiàn)和生成。

當(dāng)下的 XR 產(chǎn)業(yè)，高質(zhì)量?jī)?nèi)容生產(chǎn)的瓶頸日益凸顯。未來的空間計(jì)算設(shè)備，用戶需要的絕不僅僅是幾個(gè)預(yù)先做好的 Demo，而是海量的、個(gè)性化的、甚至實(shí)時(shí)生成的 3D 世界。

曹炎培指出：“當(dāng)生成一個(gè)標(biāo)準(zhǔn)的 3D 交互資產(chǎn)只需要幾秒，想象力就會(huì)被無限放大，用戶不會(huì)覺得利用三維資產(chǎn)做想做的事情還有任何障礙。這種 2.0 時(shí)代的技術(shù)，把之前 1.0 時(shí)代速度、質(zhì)量和可用性的‘不可能三角’變?yōu)榭赡懿⑼瑫r(shí)成立。”

通過降低門檻，讓不具備專業(yè)技能的普通人也能通過自然語言構(gòu)建交互式內(nèi)容，VAST 正在嘗試定義下一代 UGC 互動(dòng)平臺(tái)的基石。在這一輪內(nèi)容生產(chǎn)邏輯的重構(gòu)中，行業(yè)亟需一個(gè)既快、又穩(wěn)、還能直接接入工業(yè)管線的 AI 3D 底座，而 VAST 正試圖通過 Smart Mesh 證明，他們就是那個(gè) XR 時(shí)代“大基建”的提供方。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.