網易首頁 > 網易號 > 正文申請入駐

影石：十年全景相機，拍出了一座數據金礦

2026-04-15 19:16:52　來源: 賽博禪心

北京舉報

分享至

research

? 一家相機公司的 AI 研究院，比很多大模型公司人還多

?「天空有多遠」和「杯子有多遠」，對算法來說完全是兩個問題

? 全景賽道太小了，不開源只有自己在玩

以上內容，來自我和影石 AI 研究院 Gavin 的對話

做全景相機的影石Insta360，最近把 4 篇頂會論文的核心算法 全部開源 了

DAP｜CVPR 2026

全景深度預測，純視覺，一張圖量距離

AirSim360｜CVPR 2026

全景仿真平臺，單日百萬幀，成本 20 塊

DiT360｜CVPR 2026

全景文生圖，輸入文字生成 360 度全景圖

DDGS｜ICLR 2026

稀疏視角 3D 高斯潑濺重建

影石，年營收近百億，在全景相機領域市占率66%，連續八年全球第一

不為人知的是，他們還有個數百人的 AI 研究院，比許多頭部大模型公司還大

Insta360 全景相機

一家相機公司，攢下了稀缺的空間數據

以下內容，來自我和 Gavin 的對話，在影石，他是研究院總監、董事會成員，這些工作都由他負責統籌和指導

同時，Gavin 是 TPAMI 編委，之前在字節跳動帶視頻生成大模型的數據基建。聊完之后我才明白，論文只是切面，真正有意思的是影石手里的數據

全景數據的空間密碼

我問 Gavin，全景數據和普通照片到底有什么本質區別

他跟我說：很不一樣

用手機拍一張照片，它是一個固定視角的平面投影。畫面邊緣之外的世界對模型來說完全未知。它輸出一個深度值，對不對，誰也不知道，沒有任何物理約束能去校驗它

全景圖完全不同，記錄的是完整的 360 度空間信息。全景圖的最左邊和最右邊在物理上一定是無縫拼接的，每一幀全景數據都自帶一個閉環的數學校驗：模型產出的空間信息如果不滿足這個幾何閉合條件，數據系統本身就會報錯

自校驗能力，普通照片不具備

Gavin 把這個特性總結為：「全景數據，自帶物理閉環的幾何約束」

訓練空間 AI 的時候，不需要額外的人工標注，數據本身就在約束模型的行為。對于任何在做具身智能、自動駕駛、空間計算的團隊來說，這種數據天然帶著一層「防幻覺」機制

這就是影石十年全景數據的真正價值。不只是量大，而是每一幀數據都自帶結構化的空間信息和內建的校驗機制

十年的全景數據

影石做了十年全景相機，積累了海量的全景空間數據。光是為 DAP 這個深度預測任務，經過數據清洗和場景平衡后篩出來的有效訓練集，就有 200 萬張。

此前，學術界最大的全景深度數據集就幾萬張

影石從十年前就在持續積累全景空間數據，早在 2020 年就用 3D 全景相機和貝殼找房合作采集室內空間數據

對此，Gavin 表示：在全景空間數據的積累上，影石在全球范圍內應該是最大的

DAP 的訓練數據來源三塊：公開數據集、用自研仿真平臺 AirSim360 生成的 9 萬幀合成戶外數據（覆蓋紐約、舊金山、羅馬等 5 個城市場景）、以及從互聯網采集的 170 萬張真實全景圖。注意，這 170 萬張圖沒有深度標注，靠一套三階段的偽標簽流水線自動生成 ground truth

一張全景圖，算出每個像素的距離。零樣本，全球第一

一張圖量距離，不需要激光雷達。對做空間感知的人來說，硬件成本從幾千塊的 LiDAR 模組降到一顆全景鏡頭。這個成本差異是量級的

不用激光雷達

我去讀了 DAP 的論文，發現了一件有意思的事：影石做深度預測用的是純視覺方案，不用激光雷達。只需要一張全景圖，就能算出每個像素的距離

DAP (Depth Any Panoramas)CVPR 2026

通過這個全景深度預測基礎模型，只需要一張全景圖，就能算出畫面中每個物體的距離，精確到像素。純視覺方案，不用激光雷達。用 200 萬級數據訓練，零樣本深度預測全球第一

為什么走這條路？Gavin 說參考的是特斯拉 FSD 的思路。特斯拉用 Data Scaling Law 證明了：數據夠多的時候，純視覺可以解決絕大部分問題。影石手里有全世界最大的全景數據集，走純視覺在數據量上有天然優勢

局限也有，大面積透明玻璃、純白色墻面，純視覺確實抓瞎。影石的做法是在無人機上配 ToF 傳感器做輔助，動態權重算法在不同場景下調整依賴程度。絕大部分場景純視覺覆蓋，極端情況傳感器兜底

影石最終想做的產品是一臺「完全自主的跟拍攝影師」，或者說：Cameraman

在這個過程中，設備不需要人操控，自己看懂空間、自己避障、自己構圖、自己用電影感的運鏡方式拍攝。這條路線的終局和自動駕駛是同一個邏輯：傳感器只是補充，數據規模才是壁壘

這個判斷對所有在純視覺和多傳感器融合之間做選擇的團隊都有參考價值。核心問題永遠是：有沒有足夠規模的數據，來喂純視覺方案

那 10% 的 Gap

影石做了一個仿真平臺 AirSim360，能在虛幻引擎 5 里原生渲染全景數據，單日產出 100 萬幀，成本 20 塊錢。官方說減少約 90% 的戶外實飛。我問 Gavin，那剩下的 10% 呢？

AirSim360CVPR 2026

這是一個全景無人機仿真平臺，借由虛幻5引擎，在其中搭建城市、山林等虛擬環境，接入真實飛控板做飛行訓練。自動生成深度、語義、實體等多層標注，不需要人工標注

那剩下的 10% 卡在哪？Gavin 說是真實世界里不可預測的物理噪聲。高速運動時的湍流、圖傳信號丟包、鏡頭震動導致的動態虛焦，這些在虛幻引擎里沒法完美建模。只能在真實世界里飛，炸一次機收集一次數據

然后我們聊到了室內和室外的區別，當然，這個話題跟我自己有關。我在同時裝修兩個幾百平的酒吧，正在把它們做成數字孿生，計劃讓具身智能的機器人在虛擬環境里訓練完直接來店里上班。做的過程中發現，室內的全景數據和戶外的完全是兩套處理邏輯

「因為天空的距離是不一樣的」

室外天空是無限遠的，算法設定一個無窮遠就行。但在室內，最遠距離就是天花板和墻壁

「天空有多遠」和「杯子有多遠」在深度幾何約束上完全是兩個概念。這也是很多深度預測模型只能做室內或者只能做室外的原因

對所有做室內具身智能的團隊來說，這是一個繞不開的基礎問題。DAP 在論文里做到了室內外統一的深度預測，但 AirSim360 仿真平臺目前只覆蓋了城市和戶外。Gavin 說內部已經在做室內空間的探索，包括無人機和機器人在多層建筑里自主穿梭的課題

影石現在也在和一些具身智能團隊合作，用定制化的全景設備給機器人當「眼睛」。360 度無死角，不用來回轉頭

做數字孿生還有一個繞不開的問題：怎么從幾張照片，還原出完整的三維空間？

拍的角度越少，重建就越快、成本越低，但質量也越難保證。影石的另一篇論文 DDGS 就在解決這個問題，而全景數據天然的全視角覆蓋，讓「少拍幾張」變得可行

DDGSICLR 2026

通過這項算法，只需要少量不同角度拍攝的照片，就能還原出可以自由旋轉查看的 3D 場景。全景相機一張圖覆蓋 360 度，天然減少了所需的拍攝次數

暖手寶問題

論文做出來了，但要塞進一顆運動相機的芯片，是另一回事。影石做的是消費級硬件，芯片算力和功耗被極度限制

Gavin 舉了個例子，目標追蹤領域效果最好的是 Meta 的 SAM 系列，追蹤什么物體都很準。但想放到影石的相機芯片上，底層硬件根本不支持 SAM 的某些網絡結構和算子

更致命的是散熱。相機體積太小，大模型跑起來發熱控制不住

「總不能把運動相機做成暖手寶」

所以影石的算法團隊做的事情，本質上是把學術界的大模型用裁剪、蒸餾和量化硬塞進消費級芯片。但問題還不止于此：由于全景數據的幾何畸變特性，通用學術模型的適配程度本身就不高，即使能跑進硬件，算法模型也要重新開發。這是為什么必須從底層自研，團隊需要數百人

這個問題不只是影石的。任何想把 AI 做進終端硬件的公司都面對同樣的約束：云端可以堆卡，終端沒這個條件。算力不夠的時候，算法設計本身就要為硬件讓路。影石在這件事上積累的經驗，對所有做端側 AI 的團隊都有參考價值

為什么開源

全景在 AI 領域還是一個很小的分支。影石占了全球 66% 份額，但整個賽道的體量有限。不開源，這個賽道就只有影石一家在玩

Gavin 說把底層技術開源，是希望學術界和工業界先用起來。用起來之后能反哺很多影石自己看不到的應用場景。一個人把蛋糕做不大，但基建鋪好了，別人進來，蛋糕才能變大

創始人劉靖康最近在上海一場黑客松上做了一件有意思的事。影石每年 1024 程序員節有個內部傳統：給最優秀的工程師發純金打造的鍵帽，回車鍵或者空格鍵，大約 30 克純金。這次劉靖康第一次把黃金鍵帽發給了外部的獲勝開發者，希望拿到鍵帽的人把它們拼在一起，拼出一個詞：NO BUG

NO BUG，用純金拼出來的

以及，對在做空間 AI 的開發者來說，影石這次開源的東西中還有一個值得一看：DiT 360，代碼和權重都放在了 GitHub 上

DiT360CVPR 2026

輸入一段文字描述，就能生成一張完整的 360 度全景圖。生成的圖在邊緣能無縫拼接，保持幾何結構的一致性，同時支持對已有全景圖做局部修改和擴展

聊到最后，Gavin 說了他對未來三年的押注：把感知和生成統一到一個全景基座模型里。三年后，設備放飛，完全自主地看懂空間、避障、構圖、拍攝。他管這個叫「完全自主的超級跟拍師」

然后他提到：最近在研究怎么讓無人機在室內自主爬樓梯

我說：我的新酒吧正好有樓梯，到時候留一段給你測試

關于 Gavin

Gavin（亓魯），90 后，2024 年加入影石。長期擔任 NeurIPS、ICML、ICLR、ICCV、CVPR 領域主席，AI 2000 全球人工智能學者，Google Scholar 引用 16000+

最后，感謝 Gavin 和影石研究院團隊的坦誠分享

影石 AI 研究院開源項目

https://github.com/Insta360-Research-Team

DAP 在線 Demo

https://huggingface.co/spaces/Insta360-Research/DAP

DiT360 在線 Demo

https://huggingface.co/spaces/Insta360-Research/DiT360

AirSim360 論文

https://arxiv.org/abs/2512.02009

DAP 論文

https://arxiv.org/abs/2512.16913

DiT360 論文

https://arxiv.org/abs/2510.11712

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

2999元起！大疆發布Osmo Pocket 4 一英寸口袋云臺相機

快科技 2026-04-16 20:44:37
12 跟貼 12
它不止是vlog相機！體驗大疆Pocket 4，口袋里的攝制組再升級

環球網資訊 2026-04-16 20:15:31
2 跟貼 2

影石Insta360 Luna Ultra 最新泄露圖和細節

相機Beta 2026-04-14 11:15:32
1 跟貼 1

AI終結藝術？別慌！當年被相機逼上絕路的畫家，都成了印象派大師

九江老渭 2026-04-14 11:45:00
0 跟貼 0
3598元，影石Insta360 GO Ultra塔代伊·波加查運動相機發布

IT之家 2026-04-15 21:48:10
1 跟貼 1

一位締造傳奇，一位獨愛中國，兩位相機大咖為何都來了北京

中國收藏雜志 2026-04-15 19:26:17
0 跟貼 0

大疆與影石：影像入口的無界之戰

華爾街見聞官方 2026-04-16 23:52:37
0 跟貼 0
大疆慘痛教訓：29名元老遭裁，16人被起訴，離職員工創立對手影石

z千年歷史老號 2026-04-16 16:04:24
1 跟貼 1

2999元！大疆Pocket 4出手就是王炸，兩年半等待值了

雷科技 2026-04-16 23:30:04
5 跟貼 5
飛機越來越顛簸了？“恐飛”人士都在害怕什么

新浪財經 2026-04-16 23:01:29
0 跟貼 0
杭州女子買5份海鮮3份僅退款商家氣憤跨省趕來質問

錢江晚報 2026-04-16 14:34:09
22646 跟貼 22646
核試驗驚動了誰？NASA科學家證實地球天空存在非人類智能

阿策聊實事 2026-04-17 00:25:48
0 跟貼 0
大疆與影石創新糾紛案件即將開庭

商業不許冷 2026-04-16 21:48:27
0 跟貼 0
人類正在淪為算法NPC，覺醒才是唯一出路！

桔子嘮生活 2026-04-17 04:17:35
0 跟貼 0
學界 | 埃因霍溫理工大學招收離散優化問題的算法與復雜性博士職位

新浪財經 2026-04-16 22:44:49
0 跟貼 0
你的歌單早被"假賬號軍團"攻陷了

薛定諤的BUG 2026-04-17 01:11:10
0 跟貼 0
從MBTI到SBTI：我們在放棄什么，又在追求什么？

知著網 2026-04-16 21:33:11
0 跟貼 0
世界模型元年啟示錄：動機、亂戰與暗礁

智械島 2026-04-16 23:53:55
0 跟貼 0
濰坊風箏節把天空玩出圈，天上集齊葫蘆娃“全家桶”

科教聚焦 2026-04-16 19:04:27
0 跟貼 0
濰坊的天空像一片海洋，各種海洋生物風箏齊飛天，鯊魚、章魚應有盡有

樂動向前 2026-04-16 23:00:08
0 跟貼 0
遼寧朝陽天宇出現震撼一幕，積雨云氣勢恢宏演繹奇幻世界

趣拍暴走 2026-04-16 16:59:55
3 跟貼 3
真登一下，你又受不了

新浪財經 2026-04-16 16:32:14
0 跟貼 0
4月16日，山東濰坊，顯眼包集體大現身

生活幫 2026-04-16 18:32:03
0 跟貼 0
天空：巴薩和尤文仍希望免簽B席，球員還沒確定下一站去哪兒

懂球帝 2026-04-17 01:31:33
2 跟貼 2
【夜讀 · 組詩】向邊關約定永恒

新浪財經 2026-04-16 21:10:01
0 跟貼 0
六激光雷達的問界M9換代，要有很多車展新車沒法賣高價了

路咖汽車 2026-04-14 16:21:04
0 跟貼 0
一個小女孩能有多會運鏡，鏡頭翻轉對準自己氛圍感立馬就來了

熱點制造機 2026-04-15 09:35:45
1 跟貼 1
兩名外籍乘客在網約車上對著部隊大門連續拍照，接下來又要去訓練場方向，司機覺得可疑，直接開車把他們交給了部隊

極目新聞 2026-04-16 08:59:25
5247 跟貼 5247
美民主黨對防長赫格塞思發起彈劾

界面新聞 2026-04-16 07:08:40
5786 跟貼 5786
最新：同濟大學已成立調查組

南方都市報 2026-04-16 16:57:13
1036 跟貼 1036
大批五一航班突然取消！廣東市民出行受到這些影響

南方都市報 2026-04-15 20:44:18
448 跟貼 448
男子因噪音過敏住5年隔音艙：自己設計，已接上百個訂單，幫噪音受困者找回睡眠

半島官網 2026-04-16 11:20:50
1628 跟貼 1628
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
2951 跟貼 2951
11.58萬標配激光雷達，誰逼瘋了智駕定價？

固件更新中 2026-04-16 21:32:08
1 跟貼 1
埃安N60預售11.58萬起，20項標配，年輕智駕首選

速度計 2026-04-16 23:47:54
0 跟貼 0
河南萬歲山武俠城演出中“大象”露出人腳，景區：沒飼養過大象，是4名工作人員扮的

環球網資訊 2026-04-16 11:29:34
2126 跟貼 2126
預售11.58萬起配激光雷達，埃安N60降維打擊？

BigCarShow 2026-04-16 22:59:25
10 跟貼 10
范瑋琪自曝隱情：十年網暴后首度登臺，50歲直面鏡頭

老表是個手藝人 2026-04-15 05:38:25
1 跟貼 1
確認了！兩人系間諜

浙江之聲 2026-04-16 22:16:31
457 跟貼 457
老外看中國和外國鏡頭下的中國軍艦，網友：只有中國人不知道大小

愛歌唱的叮當貓 2026-04-16 13:24:19
0 跟貼 0

賽博禪心

拜AI古佛，修賽博禪心

383文章數 50關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

房產

旅游

藝術

軍事航空

手機 / 數碼

房產 / 家居

影石：十年全景相機，拍出了一座數據金礦

這 4 個紅底黑字，藏著毛主席給一位普通母親的最高贊譽，看完淚目

特朗普：美伊下次會晤可能在本周末舉行

特朗普：美伊下次會晤可能在本周末舉行

皇馬拜仁踢出名局，但最搶鏡的還是他

絲芭傳媒創始人王子杰去世，享年63歲

海爾與醫美女王互撕 換血抗衰誰的生意？

趙明：智駕之戰，看誰在大模型上更高效

空間大五個乘客都滿意?體驗嵐圖泰山X8

態度原創

孩子積食，脾胃虛弱

人人人人！封關后首屆消博會，擠爆了！

這 4 個紅底黑字，藏著毛主席給一位普通母親的最高贊譽，看完淚目

封鎖霍爾木茲海峽后 美釋放雙重信號

海爾與醫美女王互撕換血抗衰誰的生意？

封鎖霍爾木茲海峽后美釋放雙重信號