337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

又一國產模型黑馬出世,追平Gemini 2.5 Pro,空間編輯反超視頻模型?

0
分享至


智東西
作者 江宇
編輯 漠影

大廠AI戰局升溫,轉型幾乎成為共識。模型在進化,Agent在落地,但成本高、落地難、數據不夠,行業還在補課。

而京東在AI上的布局已然聚焦清晰:圍繞供應鏈優勢,推進具身智能,讓AI真正進入物理世界。此次推出的一體化圖像模型——JoyAI-Image-Edit,高度適用于生成電商、具身智能訓練圖片。

近日,京東開源圖像模型JoyAI-Image-Edit,將空間智能納入圖像理解與編輯,讓AI開始處理真實世界中的空間關系,讓模型真正“理解空間,編輯空間”。

簡單解釋,這是一個以空間智能為核心的圖像生成與編輯模型,讓AI真正“看懂”三維空間,從而讓生成更合理、編輯更精準。


從公開評測來看,JoyAI-Image-Edit各項指標顯著領先,邁進了國際第一梯隊空間理解刷新同量級開源模型SOTA,達到世界一流水平,大部分指標媲美或超越閉源模型 Gemini 2.5 Pro。長文本生成中英文雙語領先,圖像編輯能力全面覆蓋,空間編輯精度甚至超過部分視頻世界模型


智東西也實測了一番,在物體位置調整這類場景中,模型能夠穩定保持結構一致性。

值得注意的是,此番調整的物體在畫幅中僅占據很小比例,且原物體并非形狀規則,為毛絨材質,并帶有手部細節。即便如此,模型在移動或旋轉時仍能有效減少透視錯亂與遮擋問題,畫面整體保持自然。


▲輸入圖與指令(左)、輸出圖(右)

進一步看,這類能力的主要落點,在電商內容生產與具身智能訓練這兩類場景尤為適配,進而也能延展到建筑設計、游戲開發和影視制作等場景。電商和具身,恰好與京東現有的AI布局形成了直接呼應。

一、把“空間智能”寫進模型:從“會改圖”到“會動空間”,圖像編輯能力開始分層

傳統圖像編輯模型的短板集中在空間層。語義能跟上,但空間關系容易崩,例如替換物體、修改姿態時,常出現比例失真、遮擋錯誤、光影不一致等問題,本質是缺乏幾何層面的理解能力。

JoyAI-Image-Edit則把“空間編輯”單獨拉出來做能力核心。模型在支持15類通用編輯任務之外,進一步支持物體移動、旋轉、視角變換等空間級操作,并可理解“移動0.3米”“旋轉45度”等具備明確幾何參數的指令,讓編輯過程具備“可控性”。


在能力結構上,模型還采用MLLM+VAE+擴散模型(MMDiT)的統一架構。


具體來說,MLLM負責空間理解與語義建模,擴散模型執行生成與編輯,空間信息直接參與生成過程,形成“理解—生成—再理解”的循環。

空間能力是怎么提升起來的?答案在于數據體系的重構——包括300萬規模的OpenSpatial-3M數據集、多視角生成數據,以及可記錄精確位姿參數的空間編輯數據。這些數據引導模型在訓練階段學習真實幾何關系。


得益于這種設計,在2D語義感知、3D空間理解、4D時空推理三個層級共13項Benchmark上,JoyAI-Image-Edit在9項空間理解Benchmark上均取得顯著提升,平均分達到64.4追平閉源的Gemini-2.5-Pro


在SpatialEdit-Bench上,JoyAI-Image-Edit的空間編輯能力表現尤為突出:Object Overall Score為0.649、Camera Overall Score為0.571,大幅領先所有圖像編輯模型,空間編輯精度超越Veo3.1、ViduQ2-Turbo和Kling等視頻世界模型

與此同時,在業界權威的榜單GEdit(偏向中文指令評測和真實用戶需求)和ImgEdit(偏向全面覆蓋的能力評測,強調推理和精細化編輯能力)上,JoyAI-Image-Edit得分分別為8.27和4.57,刷新開源圖像編輯模型SOTA


▲在249道評測集黑盒人工評測成績:JoyAI-Image-Edit表現優于Qwen-Image-Edit-2511以及Flux2.Dev


由此可見,將空間理解、生成和編輯整合在同一體系,可以使模型不僅知道“畫什么”,還知道“物體在什么位置、如何變化、是否合理”。

當圖像可以被真正“操作”,而不只是簡單修改時,圖像模型的能力邊界也隨之被重新定義。

二、電商+具身場景高可用,空間能力開始直接“變現”

空間能力成立以后,最先吃到紅利的,就是最依賴“真實世界”的場景

電商領域,商品多視角生成、虛擬試衣、商品擺位調整等任務對空間一致性要求極高。

JoyAI-Image-Edit的空間編輯能力——可以移動物體、旋轉角度、調整視角,并理解具體幾何參數——在電商場景下帶來了非常直觀的應用價值。

比如服飾和鞋類商品,經常需要展示不同角度、姿態或搭配組合。使用該模型,可以在原始圖片基礎上一鍵調整衣服折疊角度、鞋子擺放方向或包包手持位置,生成多角度素材,同時保持整體比例、光影和背景一致。


▲輸入圖(左)、輸出圖(右)、指令:Rotate the sneaker to show the front view

類似地,對于家電、家具或小型電子產品,空間編輯可讓商品在不同場景下“自動換位”或旋轉展示,如沙發在不同房間角度、咖啡機在不同臺面布局,無需重拍,就能生成多角度素材。


結合模型的通用編輯能力,還可以同時進行文字標注、色彩微調和背景修飾等“一鍵精修”式功能,實現一次操作完成多種需求。


這樣,電商團隊能夠快速產出多角度、精修、高可用的商品圖,大幅降低拍攝成本,同時保證展示效果的統一。

具身智能訓練中,這些能力同樣適用。

機器人依賴大量真實世界數據,但采集成本高、周期長。該模型可以生成具備空間一致性的高質量圖像數據,用于補充訓練數據,與真實采集數據形成互補,從而提高訓練效率和模型效果,輔助解決具身行業的數據難題。

此外,通過生成新視角輔助空間推理(Thinking with Novel Views),模型不僅用于內容生產,也能反向提升空間理解能力,為機器人“看懂世界”提供支持


由此可見,無論是電商還是具身智能,本質都依賴空間理解能力,而JoyAI-Image-Edit正是最直接落地的工具。

三、開源模型亮相,AI全景布局浮現端倪

這次開源JoyAI-Image-Edit顯然是京東聚焦于走向實體世界這一宏大AI布局的一部分,但通過觀察可以發現,開源并不是它唯一的動作。

除了這一模型,京東不久前還開源了JoyAI-LLM Flash模型,能力上在同等參數規模下顯著提升了性能與效率,降低開發者使用門檻,避免單純的參數規模競爭。

與此同時,京東在供應鏈和線下場景中的動作也在悄然推進:一方面,建設全球最大的具身智能數據采集中心,結合模型生成能力進行訓練,為數據難題提供了新的解法;另一方面,通過JoyInside將AI能力嵌入家電、機器人、AI玩具終端,讓模型直接落地真實環境,和用戶產生大量深度交互。

從開源模型的應用和這些場景動作結合來看,可以明顯感受到京東在模型、數據和終端之間嘗試形成閉環。

開源或許只是早期的一步,而京東在產業場景中不斷深挖AI實踐與價值,則讓我們得以觀察到其AI能力的潛在落地路徑。

結語:京東一手開源,一手落地

從JoyAI-Image-Edit這次開源動作可以看到,京東在AI上的選擇很明確:一手開源,一手落地。

在模型側,持續開放能力,把門檻降下來,讓更多開發者可以直接用起來;在場景側,把AI嵌入供應鏈、物理世界、真實產業場景,從數據、模型到終端形成閉環,讓能力在真實環境中跑通。

可見,京東的AI戰略更為務實。

供應鏈是京東最硬的一張牌。在AI時代,這張牌的價值進一步放大——模型可以嵌入商品、物流與設備,數據可以持續回流,能力可以不斷迭代。

在今天,AI有望成為京東的另一張“增長引擎牌”。

注:文中部分輸入圖來源于Arena

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
現金被盜,辦公室被洗劫!朱婷球隊遭遇巨大損失,恐影響爭冠

現金被盜,辦公室被洗劫!朱婷球隊遭遇巨大損失,恐影響爭冠

跑者排球視角
2026-04-10 23:55:54
一季度乘用車國內銷量401.3萬輛,同比下滑超兩成,上汽成銷冠,吉利較比亞迪多賣8895輛

一季度乘用車國內銷量401.3萬輛,同比下滑超兩成,上汽成銷冠,吉利較比亞迪多賣8895輛

時代財經
2026-04-10 22:24:15
中超奪冠熱門誕生:升到第2,擊敗上海海港和山東泰山,橫掃浙江

中超奪冠熱門誕生:升到第2,擊敗上海海港和山東泰山,橫掃浙江

足球狗說
2026-04-10 21:36:29
阿爾特塔續約談判開出條件:再給我3年,我要看到真金白銀

阿爾特塔續約談判開出條件:再給我3年,我要看到真金白銀

體育硬核說
2026-04-10 08:01:44
32.9℃!浙江今日中到大雨、局地暴雨大暴雨!受冷空氣影響,氣溫下降,最低14℃!第4號臺風生成,路徑公布

32.9℃!浙江今日中到大雨、局地暴雨大暴雨!受冷空氣影響,氣溫下降,最低14℃!第4號臺風生成,路徑公布

臺州交通廣播
2026-04-11 02:40:45
 一輛SUV在縣道時速156公里撞向對面出租車致3死3傷,事故調查報告公布

一輛SUV在縣道時速156公里撞向對面出租車致3死3傷,事故調查報告公布

澎湃新聞
2026-04-10 16:30:32
高市攤牌了,東京降級對華關系,并通告全球:中國欠日本兩筆賬

高市攤牌了,東京降級對華關系,并通告全球:中國欠日本兩筆賬

近史博覽
2026-04-11 01:09:05
3場28助!你好,新巨頭!湖人又一筆神級交易

3場28助!你好,新巨頭!湖人又一筆神級交易

籃球實戰寶典
2026-04-10 16:40:32
小小甲鈷胺,可以改善中老年人六大健康問題!

小小甲鈷胺,可以改善中老年人六大健康問題!

藥師方健
2026-04-09 22:01:20
陳麗華牙齒那么丑,為什么不去整?我媽一句話把我問懵了

陳麗華牙齒那么丑,為什么不去整?我媽一句話把我問懵了

小貓的圖庫
2026-04-09 16:15:03
“窮養女真可憐”,買10分鐘商務坐拍了9分鐘,鞋子讓人無語

“窮養女真可憐”,買10分鐘商務坐拍了9分鐘,鞋子讓人無語

蝴蝶花雨話教育
2026-04-10 12:52:50
美以悍然侵伊:踐踏憲章必遭唾棄

美以悍然侵伊:踐踏憲章必遭唾棄

烽火瞭望者
2026-04-10 06:33:37
美媒:一旦中國收復臺灣,美軍將全面空襲中國,解放軍會迎戰嗎?

美媒:一旦中國收復臺灣,美軍將全面空襲中國,解放軍會迎戰嗎?

何轐說
2026-03-19 13:25:41
談判前,美伊雙方相繼表態,伊斯蘭堡戒備森嚴→

談判前,美伊雙方相繼表態,伊斯蘭堡戒備森嚴→

環球網資訊
2026-04-10 22:53:16
劉維偉:與威瑟斯龐進行了交流也互相認可,沒什么太大問題

劉維偉:與威瑟斯龐進行了交流也互相認可,沒什么太大問題

懂球帝
2026-04-10 18:22:09
中央明確:社保最低繳費年限要提高,70、80后早做準備

中央明確:社保最低繳費年限要提高,70、80后早做準備

混沌錄
2026-04-10 17:39:15
就業卷到極限,12人花30萬買高鐵工作,月薪才兩千,還是勞務派遣

就業卷到極限,12人花30萬買高鐵工作,月薪才兩千,還是勞務派遣

眼光很亮
2026-04-09 16:15:14
第8次被解雇?穆里尼奧可能被提前1年解約 執教本菲卡又抓內鬼

第8次被解雇?穆里尼奧可能被提前1年解約 執教本菲卡又抓內鬼

智道足球
2026-04-10 17:39:38
古巴人吃飯都成問題了,為什么還不實行改革開放?

古巴人吃飯都成問題了,為什么還不實行改革開放?

讀鬼筆記
2026-04-09 19:07:38
陳麗華葬禮曝光!林大慶點破遲重瑞的真實處境,大兒子也在場送別

陳麗華葬禮曝光!林大慶點破遲重瑞的真實處境,大兒子也在場送別

觀察鑒娛
2026-04-10 09:05:38
2026-04-11 05:48:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11555文章數 117026關注度
往期回顧 全部

數碼要聞

惠普星Book Ultra 14輕薄本國補價9499元:Ultra 7 356H、2.8K OLED屏

頭條要聞

特朗普:美軍艦已裝最先進武器 未來24小時成關鍵窗口

頭條要聞

特朗普:美軍艦已裝最先進武器 未來24小時成關鍵窗口

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認戀情!聚會細節被扒

財經要聞

李強主持召開經濟形勢專家和企業家座談會

科技要聞

馬斯克狂發大火箭也養不起AI 年虧50億美元

汽車要聞

搭載第二代刀片電池及閃充技術 騰勢N8L閃充版預售35萬起

態度原創

健康
本地
親子
數碼
公開課

干細胞抗衰4大誤區,90%的人都中招

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

親子要聞

時間會融化所有尖銳,只剩平靜

數碼要聞

聯想推出2026款來酷斗戰者“戰7000”筆記本,7699元起

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版