文/VR陀螺 冉啟行
2026 年,AI 眼鏡正在快速迭代,VR/MR 頭顯的形態(tài)也在持續(xù)向更輕、更薄演進(jìn)。
隨著硬件門檻的逐步降低,開發(fā)者和內(nèi)容創(chuàng)作者對(duì)高質(zhì)量 3D 資產(chǎn)的需求正在同步提速——無論是 VR/MR 游戲場(chǎng)景、AR 應(yīng)用還是工業(yè)數(shù)字孿生,3D 內(nèi)容的生產(chǎn)效率與質(zhì)量正在被重新抬上核心議程。然而,傳統(tǒng)三維建模的周期長(zhǎng)、門檻高、成本難以攤薄,即便是專業(yè)團(tuán)隊(duì),也很難用人力跟上內(nèi)容需求增長(zhǎng)的節(jié)奏。
![]()
visionOS(圖源:網(wǎng)絡(luò))
在 GDC 2026 前夕,通用人工智能公司 VAST 正式發(fā)布了 Tripo P1.0(Smart Mesh),與旗艦?zāi)P?Tripo H3.1 相比,它在內(nèi)容生成上交出了一份完全不同范式的答案。Tripo P1.0 實(shí)現(xiàn)了第一次在原生三維空間里做概率生成,不再依賴序列化「拼接」幾何,而是在高維噪聲場(chǎng)中直接演化出結(jié)構(gòu)完備、拓?fù)湟?guī)整的三維網(wǎng)格,最快約 2 秒即可產(chǎn)出可直接進(jìn) Unity、UE 等引擎的專業(yè)級(jí) 3D 資產(chǎn)。
Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水嶺,它讓速度、質(zhì)量與工程可用性不再是互相犧牲的三難選擇,開始同時(shí)成立。對(duì) XR 等重 3D 資產(chǎn)的行業(yè)來說,這意味著 AI 3D 進(jìn)一步邁入了商用級(jí)規(guī)模化的新階段。
![]()
圖源:網(wǎng)絡(luò)
從維度詛咒到原生三維,Smart Mesh做的是底層算法重構(gòu)
傳統(tǒng) AI 3D 生成模型,在真正碰到可落地這件事時(shí),往往會(huì)被維度詛咒卡住。三維空間數(shù)據(jù)過于龐大、結(jié)構(gòu)過于復(fù)雜,模型不得不通過體素網(wǎng)格、體渲染場(chǎng)或點(diǎn)云序列等形式先降維、再線性化處理,再通過一連串后處理把結(jié)果勉強(qiáng)還原成可用網(wǎng)格。這類路徑在學(xué)術(shù)論文和 Demo 中看上去可行,但一旦落到游戲、工業(yè)或 XR 生產(chǎn)線,問題就會(huì)集中爆發(fā)——生成速度慢、拓?fù)渑K亂、細(xì)節(jié)不穩(wěn)定、引擎兼容性差。
VAST 首席科學(xué)家曹炎培對(duì)此表示:“過去大家習(xí)慣了在 2D 矩陣或 1D 序列上做理解和生成,將處理文字、圖像、視頻的方法遷移到 3D上,本質(zhì)上還是在用不適合三維的表示去逼近三維,所以模型在表征層面會(huì)非常吃力。因?yàn)槿S空間本身有它自己的結(jié)構(gòu)特征,比如各向同性、連續(xù)性和拓?fù)浼s束。嚴(yán)格來說,問題并不在于維度高本身,而在于沒有找到三維數(shù)據(jù)真正合適的底層表征。經(jīng)典機(jī)器學(xué)習(xí)里也一樣,所謂‘維度詛咒’很多時(shí)候并不是維度本身不可解,而是你還沒有找到它背后的低維流形和本征結(jié)構(gòu)。一旦表征對(duì)了,很多原來看起來像詛咒的問題,其實(shí)都會(huì)被重新改寫。比如像我們現(xiàn)在做Tripo P1.0模型這樣找到正確的底層表征,這就不再是大問題。”
![]()
圖生3D模型演示(圖源:VR陀螺)
Tripo P1.0(Smart Mesh)的技術(shù)路徑是繞開了原來的一整套補(bǔ)丁式工程。官方將其定義為一套原生三維生成框架,不是在 2D 投影或隱式體上間接優(yōu)化,而是讓概率生成引擎首次在純?nèi)S坐標(biāo)空間中直接運(yùn)行,從一片高維噪聲場(chǎng)出發(fā),在空間中逐層「生長(zhǎng)」出幾何結(jié)構(gòu)。模型不再是按序號(hào)逐點(diǎn)預(yù)測(cè)頂點(diǎn),而是在統(tǒng)一的三維特征場(chǎng)上,先確定宏觀結(jié)構(gòu),再向局部細(xì)節(jié)收斂,讓復(fù)雜空間坐標(biāo)同步收束成型。
在這個(gè)過程中,Smart Mesh 把原本顯式編碼在規(guī)則里的大量幾何先驗(yàn),全部收進(jìn)了高維潛在空間。每一個(gè)頂點(diǎn)不僅僅是一個(gè)坐標(biāo),而是帶著豐富上下文關(guān)系的潛在向量,彼此之間的連接關(guān)系通過潛在拓?fù)溆成浔怀掷m(xù)更新與收斂。當(dāng)概率空間收斂完成,模型直接涌現(xiàn)出一個(gè)幾何穩(wěn)定、拓?fù)鋰?yán)謹(jǐn)、可編輯性良好的網(wǎng)格。
![]()
3D模型演示
這種重構(gòu)帶來的直接結(jié)果,是模型不再被迫走“慢而精”或“快而糙”的老路,而是在統(tǒng)一的原生三維概率框架下,同時(shí)兼顧宏觀結(jié)構(gòu)、局部拓?fù)渑c細(xì)節(jié)紋理,為后續(xù)所有下游工程環(huán)節(jié)(減面、骨骼、動(dòng)畫、渲染)預(yù)留出最大空間。
百倍推理效率提升,秒級(jí)3D模型生成技術(shù)
底層重構(gòu)到底能給前端帶來多大改變?我們?cè)?Tripo Studio 中直接上手跑了跑。
輸入文本或參考圖后,幾乎不需要漫長(zhǎng)的等待。根據(jù)官方披露的數(shù)據(jù),Smart Mesh 可以在約 2 秒內(nèi)生成面數(shù)從數(shù)百到兩萬不等、拓?fù)湟?guī)整的網(wǎng)格模型。受面數(shù)、當(dāng)前網(wǎng)絡(luò)環(huán)境及云端服務(wù)器擁擠程度影響,實(shí)際測(cè)試體感用時(shí)在 10 秒左右。但相比于行業(yè)普遍水平,這已經(jīng)實(shí)現(xiàn)了量級(jí)的跨越。
曹炎培表示:“我們用比較優(yōu)雅的數(shù)學(xué)推導(dǎo)繞過了之前離散組合的暴力算力消耗,這也是為什么之前的方法可能要三五百秒,而我們五六秒就能生成一個(gè)網(wǎng)格。背后所需算力被大大減少,不是強(qiáng)行壓縮計(jì)算量,而是免除了之前方法中因強(qiáng)加因果和排序所帶來的不必要計(jì)算。”
![]()
文生3D模型演示(圖源:VR陀螺)
最讓我們?cè)谝獾钠鋵?shí)不是速度,而是網(wǎng)格的質(zhì)量。以往 AI 生成的模型往往伴隨著破面和雜亂的邊線,但 Smart Mesh 跑出來的低多邊形網(wǎng)格,邊線清爽、結(jié)構(gòu)合理。
曹炎培對(duì)此表示:“我們相當(dāng)于把擁有多年經(jīng)驗(yàn)的藝術(shù)家才能做出的拓?fù)洳季€邏輯,變成了算法上的直覺。普通人通過一張圖或一個(gè)想法就能瞬間獲得一個(gè)外觀正確、結(jié)構(gòu)符合工業(yè)標(biāo)準(zhǔn)的資產(chǎn),不管是創(chuàng)意設(shè)計(jì)還是生產(chǎn)力用戶,都能回歸到意圖本身。”
![]()
文生3D模型演示,局部重繪調(diào)整(圖源:VR陀螺)
這種“工業(yè)級(jí)直覺”早已在實(shí)際業(yè)務(wù)中顯現(xiàn)價(jià)值。其原有的 H 系列模型在技術(shù)與商業(yè)化上已穩(wěn)居行業(yè)頭部,并深度服務(wù)于網(wǎng)易《燕云十六聲》、拓竹科技等標(biāo)桿客戶,實(shí)現(xiàn)了 3D 打印與游戲 UGC 的大規(guī)模產(chǎn)業(yè)落地。在原有路線已領(lǐng)跑行業(yè)、商業(yè)價(jià)值全面兌現(xiàn)的背景下,團(tuán)隊(duì)依然堅(jiān)持從底層算法范式進(jìn)行顛覆式創(chuàng)新。 Smart Mesh 的出現(xiàn),從某種程度上看,也代表著 VAST 的這家公司底色——極客精神。
從視覺擬真向功能性演進(jìn),AI 3D開啟UGC互動(dòng)內(nèi)容新時(shí)代
今年 3 月,VAST 剛宣布完成 5000 萬美元的 A 輪融資。據(jù)介紹,這筆資金將主要用于 VAST 繼續(xù)迭代核心算法、積累數(shù)據(jù),以及建設(shè) UGC 互動(dòng)內(nèi)容平臺(tái)。
如果說 AI 3D 的 1.0 時(shí)代是在追求“看起來真”,那么以 P1.0 為代表的 2.0 時(shí)代則是在追求“功能性”。曹炎培表示:“未來很快,大家就會(huì)模糊‘3D 建模’的概念。用戶會(huì)回歸到創(chuàng)造 3D 模型的原始意圖,而不是糾結(jié)于怎么用工具得到它。在當(dāng)今 AI 時(shí)代,VAST 提供的 AI 3D 生成能力是像輸入法、攝像頭一樣的基礎(chǔ)能力。”
![]()
AR應(yīng)用演示(圖源:AI生成)
在 VAST 的技術(shù)版圖中,高質(zhì)量的 3D 資產(chǎn)構(gòu)成了交互世界中持久性的“狀態(tài)”,而“世界模型”則負(fù)責(zé)建模狀態(tài)之間的“轉(zhuǎn)換”——比如角色怎么和環(huán)境交互、交互過程應(yīng)該怎樣自然地呈現(xiàn)和生成。
當(dāng)下的 XR 產(chǎn)業(yè),高質(zhì)量?jī)?nèi)容生產(chǎn)的瓶頸日益凸顯。未來的空間計(jì)算設(shè)備,用戶需要的絕不僅僅是幾個(gè)預(yù)先做好的 Demo,而是海量的、個(gè)性化的、甚至實(shí)時(shí)生成的 3D 世界。
曹炎培指出:“當(dāng)生成一個(gè)標(biāo)準(zhǔn)的 3D 交互資產(chǎn)只需要幾秒,想象力就會(huì)被無限放大,用戶不會(huì)覺得利用三維資產(chǎn)做想做的事情還有任何障礙。這種 2.0 時(shí)代的技術(shù),把之前 1.0 時(shí)代速度、質(zhì)量和可用性的‘不可能三角’變?yōu)榭赡懿⑼瑫r(shí)成立。”
通過降低門檻,讓不具備專業(yè)技能的普通人也能通過自然語言構(gòu)建交互式內(nèi)容,VAST 正在嘗試定義下一代 UGC 互動(dòng)平臺(tái)的基石。在這一輪內(nèi)容生產(chǎn)邏輯的重構(gòu)中,行業(yè)亟需一個(gè)既快、又穩(wěn)、還能直接接入工業(yè)管線的 AI 3D 底座,而 VAST 正試圖通過 Smart Mesh 證明,他們就是那個(gè) XR 時(shí)代“大基建”的提供方。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.