337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

對話智象未來CTO姚霆:當Sora退場后,世界模型的終局是"輪回"

0
分享至

以Sora的發布和關停為時間節點,AI視頻生成產業分為兩個世界。

2024年春節,OpenAI發布Sora,一石激起千層浪,當年5月17日,智象未來旗下vivago平臺上線,這個時間點比快手可靈還早了兩周,這家核心班底來自微軟亞研院的多模態大模型創企,并不缺少對技術的敏銳嗅覺。

一年后,OpenAI驟然宣布關停了Sora的獨立服務,將視頻生成功能并入ChatGPT的付費體系,留給行業是一些未有明確答案的思考,多模態大模型的技術和商業化會走向何處,創業企業又該如何在窗口關閉前找到自己的空間。

在智象未來聯合創始人兼CTO姚霆看來,Sora的退場并非偶然,而是通用視頻生成這門好技術在商業化面前的必然結局,對于當前火爆的世界模型賽道,他給出了一個頗具哲學意味的答案:輪回。

據了解,智象未來的 ARR(年度經常性收入)達到數千萬美元量級,B輪融資正在最后 Close階段,持續獲得產業資本加持。這家公司的路線選擇,或許代表了中國 AIGC 創業公司在多模態賽道上的一種生存策略。


通用視頻生成是一門好技術,不是Sora的好生意

對話伊始,姚霆便開門見山地給出了自己的判斷。在他看來,Sora的“失敗”可以從三個維度來理解。

"第一,Sora想做的是非常通用的視頻生成,但這與垂直領域的應用需求相對脫離。"姚霆分析道,"OpenAI天然沒有視頻相關的業務,也沒有那樣的生態。"

第二,成本是不可忽視的現實問題。"今天跟互聯網時代不一樣,所有的服務上線背后都在跑GPU,成本還是很昂貴的。"姚霆坦言,智象每一次模型迭代,推理成本都是首要考量因素,做模型架構本身就要考慮成本,否則后面就沒法做大量服務。

第三,Sora缺乏商業化的土壤。對比字節跳動的Seedance和快手的可靈,這兩家公司的視頻生成產品都能與主營業務形成協同,而OpenAI并沒有這樣的業務場景來承接技術能力。

Sora的退場,也折射出國內外視頻生成路線的差異。

"國外更看重模型架構的創新,國內則傾向于做大而全的平臺鏈路。"姚霆觀察道。對于智象來說,這兩條路都不是唯一選擇。

"我們是從技術出身的,以前在微軟的時候,大家想做全世界最好的模型,對標谷歌、Facebook、CMU、伯克利。"姚霆回憶,"做視頻理解的模型,這種基因天然就是希望模型上有架構創新。"

智象也的確在踐行這一點。從2023年的Unet架構,到DiT,再到自回歸+DiT的融合,直到今天全新的全模態架構,智象每一次迭代都試圖在技術層面做更多的創新,而且每次還是精準的踩住了整個技術迭代的突破口。

"但同時,在中國做這件事,肯定還是要以垂直領域的商業化作為導向。"姚霆強調,"不是為了做模型炫技,而是要有商業化落地的指標。"

世界模型的五個等級——從靜態復刻到"輪回"

世界模型的概念在過去一年里經歷了劇烈的收斂過程,也是當前多數大模型相關企業想要講述的故事。

"世界模型的定義一直很廣,早期可以分成三個類別。"姚霆解釋道,"第一類是以語言模型為主,屬于高層知識的提煉和壓縮;第二類是Yann LeCun做的JEPA,偏中層的表達學習;第三類是底層的像素生成,也就是視頻生成。"

但如今,世界模型的定義正在收斂。姚霆認為,今天的世界模型可以大致分為三類:在視頻生成模型中融入因果關系和物理規律;根據用戶指令實時生成場景(如Genie-3);以及跟具身智能強相關的World Action Model。

對于智象而言,姚霆更看重兩個維度的突破。

"第一個是模型側,要用一個神經網絡同時理解和生成文本、圖像、視頻、3D以及動作。"姚霆強調,"它一定是端到端的全模態架構,各個模態之間不會單獨編碼,而是統一的tokenization。"

為什么要追求"全模態"而非"多模態"?姚霆的解釋很直接:"世界模型好歹要跟物理世界打通,如果不打通憑什么叫世界模型?從這個角度來說肯定要有具身的數據,不然就是割裂的數字世界模型。"

在他看來,世界模型的底座是基于視頻訓練出來的,還是基于VLA(視覺-語言-動作)訓練出來的,其實并不重要,最終的形態一定是任意輸入,任意輸出,想怎么輸入,想它輸出什么它就可以輸出什么。

但這還不是終局。


"從宏觀角度,我對世界模型分了幾個等級。"姚霆說,"第一級是靜態復刻,就是一幅圖;第二級是視頻,有三維有時間域;第三級是交互;第四級加入物理規律和因果關系;第五級,終局是輪回。"

他進一步解釋道,"輪回是什么?是完美的因果關系。比如蝴蝶效應,今天我在這兒扇了一下翅膀,明天那個地方就應該出現海嘯。再往上一級,才是真正的世界模型,才是真正的推理。"

這個說法聽起來有些哲學意味,但姚霆很快將其拉回到產品層面。

"第二個維度是Agent。"他說,"所有的Agentic App等于一個平臺(可能是PC或手機)乘以Harness(對底層skills的管理、適配和組合),再加上底層的skills(可能是OS或OpenAI)。"

姚霆舉例說明:用戶想做一個VLOG,只需要輸入"我想賺錢"這一句話,Agent就能自動搜索、調用、編排各種skills,完成從腳本撰寫到視頻制作的全流程。

"這需要全模態的支持。"姚霆強調,"底層有文本、視頻、圖像、語音,全打通了,才能知道誰跟誰該怎么組合。"

大廠環伺,創業公司如何出牌?

快手可靈月收入突破兩千萬美元,即夢背靠字節過億的生態日活。在這樣的雙寡頭格局下,智象這樣的創業公司如何找到出路?

"大廠在資本、人才、算力上都有優勢,包括入口。"姚霆坦率表示,但在某些條件下,它的束縛也會比較多,難免對主營業務有所妥協。相比之下,創業公司的團隊架構更加靈活。

"AI時代,機會是相對平等的。"姚霆說,"但作為初創公司,有幾點還是要做好。"

第一,認知要新。

"首先要對整個趨勢有充分的預判,不能等大廠做到什么樣我們再復制,這樣基本就沒機會。"姚霆強調,"還要有堅持,要做正確但很難的事情。智象的產品經理現在必須會用vibe-coding(AI輔助編程)。"

第二,速度要快。

"AI產品的穩定版本,產品推上線,用戶用兩次能成功得到一次想要的結果,這就是穩定版本。"姚霆說,"讓用戶使用、反饋、迭代,這樣才能形成壁壘。"

第三,架構要靈活。

"產品和技術的邊界越來越模糊,因為產品也可以通過vibe-coding寫前端。"姚霆打了個比方,"有點像打牌,上手一副牌很難改變,但出牌方式可以調整,有些‘王炸’是要拆掉的。"

面對大廠競爭,智象的應對策略已經明確:2026年的核心戰略是搭建"1+1+3"的架構體系。

"第一個'1'是全模態底座大模型,這是最重要的。"姚霆解釋道,"第二個'1'是HiHarness平臺,可以理解為中間的Harness層,負責打通各種skills。'3'是優先級最高的三個Agent:專業創作者智能體、商業營銷內容生成智能體、AI影視智能體。未來還會拓展出更多方向,比如具身智能、游戲引擎等。"


這個架構的核心邏輯,是從"分而治之"轉向"并而治之"。

姚霆說,"以前不同創作用不同方式,可能是工具可能是內容,今天會變成一個并而治之。底座是Agent,上面根據不同場景去實例化。"

他把這個邏輯比作搜索引擎:"當年做搜索引擎,下面有眾多網頁,今天網頁變成skills,如何在海量里面尋找、定位、編排,這是核心問題。"

全模態底座的價值就在于此,如果全模態模型天然把這些模態之間打通,那么只要建一套索引就可以解決所有模態的事情,不管用戶輸入什么,想要得到什么,都可以給到用戶最終結果。(本文作者 | 張帥,編輯 | 楊林)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
真夠狠!以色列提前動手大殺四方,伊朗損失慘重

真夠狠!以色列提前動手大殺四方,伊朗損失慘重

史政先鋒
2026-04-07 21:03:17
張雪的媽媽是作家何瓊,畢業于廈門大學,曾貸款55萬支持張雪創業

張雪的媽媽是作家何瓊,畢業于廈門大學,曾貸款55萬支持張雪創業

漢史趣聞
2026-04-07 08:45:15
鄭麗文站在千百人聚集的宴席聚光燈下,突然指著自己大聲宣告

鄭麗文站在千百人聚集的宴席聚光燈下,突然指著自己大聲宣告

果媽聊娛樂
2026-04-07 08:19:43
又一艘護衛艦被擊沉,俄羅斯這次真急了

又一艘護衛艦被擊沉,俄羅斯這次真急了

史政先鋒
2026-04-07 10:22:32
陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

陳麗華去世僅2天,小11歲老公遲重瑞過往被扒,他和翁帆處境一樣

一娛三分地
2026-04-07 18:37:11
鄭麗文剛落地上海,就傳出不尋常信號!6天后,兩岸會有大動作?

鄭麗文剛落地上海,就傳出不尋常信號!6天后,兩岸會有大動作?

閆樹軍論評
2026-04-07 16:29:13
中俄否決聯合國安理會關于重新開放霍爾木茲海峽的決議

中俄否決聯合國安理會關于重新開放霍爾木茲海峽的決議

桂系007
2026-04-08 02:26:35
如果當208的代價是染發染到頭禿你愿意嗎?

如果當208的代價是染發染到頭禿你愿意嗎?

言安堂
2026-04-06 08:35:30
凱恩歐戰打進75球,距離排名歷史第5位的勞爾只差1球

凱恩歐戰打進75球,距離排名歷史第5位的勞爾只差1球

懂球帝
2026-04-08 04:45:09
黑龍江畜生公公周永福被判死刑,法庭上囂張大笑:這輩子值了

黑龍江畜生公公周永福被判死刑,法庭上囂張大笑:這輩子值了

紙鳶奇譚
2025-02-06 14:31:24
命中了!伊朗真干了

命中了!伊朗真干了

互聯網大觀
2026-04-07 22:31:40
檳榔包裝上印著劉德華肖像,品牌方稱并非代言,而是18年前《投名狀》劇照宣發,律師解讀

檳榔包裝上印著劉德華肖像,品牌方稱并非代言,而是18年前《投名狀》劇照宣發,律師解讀

極目新聞
2026-04-07 19:20:23
為啥百姓可自由出入臺北市政府,在大陸不行?網友:無規矩不成方圓

為啥百姓可自由出入臺北市政府,在大陸不行?網友:無規矩不成方圓

杰絲聊古今
2026-04-07 20:02:29
張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

魯中晨報
2026-04-07 17:13:05
受賄數額特別巨大,四川省原副省長葉寒冰被提起公訴

受賄數額特別巨大,四川省原副省長葉寒冰被提起公訴

界面新聞
2026-04-07 10:02:03
即期布倫特原油價格漲至144.42美元/桶 創歷史新高

即期布倫特原油價格漲至144.42美元/桶 創歷史新高

財聯社
2026-04-08 03:05:05
時速超300!鄭麗文體驗大陸高鐵速度

時速超300!鄭麗文體驗大陸高鐵速度

叮當當科技
2026-04-07 18:47:11
山東旋轉門事件升級!官媒怒批,知情人曝猛料,不止道歉這么簡單

山東旋轉門事件升級!官媒怒批,知情人曝猛料,不止道歉這么簡單

奇思妙想草葉君
2026-04-07 20:12:16
美軍新型PrSM導彈首次實戰?2月28日擊中伊朗體育館致21名青少年遇難

美軍新型PrSM導彈首次實戰?2月28日擊中伊朗體育館致21名青少年遇難

網易新聞出品
2026-04-07 16:36:53
85歲陳麗華去世,巨額遺產分配公道,遲重瑞已放棄

85歲陳麗華去世,巨額遺產分配公道,遲重瑞已放棄

無處遁形
2026-04-07 21:08:12
2026-04-08 05:00:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
131867文章數 862073關注度
往期回顧 全部

科技要聞

滿嘴謊言!OpenAI奧特曼黑料大起底

頭條要聞

特朗普:伊朗人愿為自由承受轟炸

頭條要聞

特朗普:伊朗人愿為自由承受轟炸

體育要聞

裁判機構:VAR錯誤推翻巴薩紅牌

娛樂要聞

女首富陳麗華離世 被曝生前已分好遺產

財經要聞

10萬億財政轉移支付,被誰拿走了?

汽車要聞

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

教育
手機
親子
游戲
公開課

教育要聞

這位學生自制的學具你見過嗎?

手機要聞

驍龍8 Elite Gen6再次曝光:5.3GHz+LPE協處理器,友商沒法接招!

親子要聞

春天娃長個黃金期,喝對黑豆水,個子悄悄往上竄

PlayStation全新炸裂計劃公開!利好所有玩家

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版