- 克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
具身智能領域論文被引次數最高的華人學者,帶著十七年海外積淀,回來了。
剛剛,在第五屆中國三維視覺大會(China3DV 2026)上,李飛飛弟子、ImageNet作者蘇昊正式被復旦官宣加盟。
加盟復旦后,蘇昊將擔任浩清特聘教授,領銜建設通用物理智能研究院并出任院長
![]()
對于蘇昊的回歸,復旦大學官方將其定義為復旦“面向智能時代的關鍵落子”。
實際上,早在官宣之前,UCSD和復旦校內已有傳言流出,稱具身智能領域的領跑者蘇昊即將赴復旦任教。
如今靴子落地,坐實了這一場備受期待的回國。
誰是蘇昊?
蘇昊,具身智能領域論文被引次數最高的華人學者,ImageNet締造者之一,ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill等一眾奠基級項目的主導者,具身智能公司Hillbot聯合創始人兼CTO。
在此之前,他是加州大學圣地亞哥分校(UCSD)計算機科學與工程系副教授,同時還是具身智能實驗室主任。
早前,蘇昊在UCSD的個人主頁已經停止維護、不再更新。
![]()
在蘇昊新的個人主頁上,已經更新了在復旦的最新任職。
![]()
截至目前,其谷歌學術被引次數超過14.5萬次,在具身AI領域的華人學者中排名第一。
![]()
去年,他還與謝賽寧共同獲得了CVPR青年學者獎,理由是表彰他們在計算機視覺領域的杰出貢獻。
![]()
值得一提的是,蘇昊還是弋力(清華叉院助理教授)、盧策吾(穹徹智能創始人、上交教授)、王鶴(銀河通用創始人、北大助理教授)、嚴夢媛(OpenAI研究員)、莫凱淳(英偉達研究員)等一眾知名學者的師兄。
從北航到普林斯頓,再到斯坦福
2002年,蘇昊進入北京航空航天大學攻讀計算機科學本科,是北航高等理工學院的第一屆學員。
本科期間,他師從中科院院士、前北航校長李未教授,研究數理邏輯與定理自動證明。
2005年,經李未教授推薦,他前往微軟亞洲研究院(MSRA)實習,師從孫劍、沈向洋、周明。
彼時他主攻自然語言處理,但隨著研究深入,他逐漸意識到,相較于抽象的語言,直接來自物理世界的信號(如視覺)才是理解智能更根本的途徑
蘇昊的研究重心,也由此轉向計算機視覺。
2008年,在沈向洋的推薦下,蘇昊先后在普林斯頓和斯坦福參與了ImageNet項目,并在2009年跟隨李飛飛正式轉入斯坦福
![]()
ImageNet這一奠基性數據集,后來推動了近二十年的人工智能浪潮。
在ImageNet之后,蘇昊與李佳合作了Object Bank,進一步提升了圖像在高層視覺任務中的語義表示能力,使得簡單分類器也能在物體識別和場景分類等任務上取得優異性能,這篇研究發表于2010年的NIPS上。
![]()
3D視覺的奠基人
當2D視覺的方法論日趨完善后,蘇昊將目光轉向3D視覺。
2014年,在獲得北航數學博士學位后的他,在Leonidas Guibas指導下于斯坦福攻讀計算機博士,主攻三維感知。
2015年,他發布ShapeNet——全球第一個大規模3D數據集,包含逾300萬個3D CAD模型,涵蓋3135個類別,被外界譽為“3D領域的ImageNet”。
![]()
ShapeNet發布后,3D視覺研究隨即進入黃金發展期。
2017年,PointNet與PointNet++相繼發布,讓3D視覺相關論文在頂會的占比從不足10%躍升至70%。
其中PointNet是首個直接處理原始點云數據的深度學習模型,而PointNet++則進一步捕捉點云中的局部結構信息。
這兩項工作,如今已廣泛應用于自動駕駛系統。
![]()
2018年獲得斯坦福計算機博士后,蘇昊又發布了3D物體數據集PartNet,并入職加州大學圣地亞哥分校。
從視覺到具身
感知之后,蘇昊的下一個問題是,能不能把具體的感知算法整合進一個更大的系統
這一思考,驅動他從計算機視覺遷移到機器人研究。
2020年,他基于PartNet發布了全球第一個以可泛化操作為核心的模擬器——SAPIEN(命名靈感來自《人類簡史》中的“智人”),為機器人視覺與交互任務的研究搭建了關鍵基礎設施。
![]()
2021年,他又在此基礎上推出ManiSkill機器人操作仿真平臺,用于測試和訓練機器人操作技能。
![]()
同年ICCV,蘇昊發起workshop,聚焦基于物理的建模與仿真、基于學習的仿真、人體仿真到具身視覺和機器人學習等廣泛主題。
![]()
這些成果,也延續到了蘇昊創辦的具身智能公司Hillbot上。
2024年,蘇昊加入了具身智能的創業浪潮,創辦了Hillbot,并擔任首席技術官。
![]()
Hillbot旗下擁有的兩張王牌,正是蘇昊此前發布的SAPIEN仿真器及ManiSkill訓練平臺,主打模擬與3D生成。
另外,Hillbot已與英偉達合作,借助Nvidia Cosmos平臺生成高仿真視頻訓練數據。
產品方面,Hillbot推出了輪式機器人Hillbot Alpha,基于仿真訓練,主要用于復雜環境下的移動操縱任務,如零售店、咖啡館和制造車間等。
![]()
為什么選擇復旦?
對于加盟復旦這個選擇,蘇昊給出了簡潔而堅定的解釋:
- 因為復旦要做的事,與我要做的事,是同一件事。
那件事,指的便是推動“物理智能”的最終實現
所謂物理智能,是讓AI系統在物理世界中有效完成任務——既能理解這個世界,也能執行恰當的行動。
在蘇昊看來,這不僅是算法問題,更涉及機器人實體、多學科交融,以及一個完善的產業生態。
他看中復旦的理由具體而落地,復旦擁有深厚的數學、物理學科根基,積極推進的新工科建設,以及地處上海和長三角中心的產業與區位優勢。
![]()
以此為目標,加盟復旦后,蘇昊將領銜建設通用物理智能研究院
該學院依托復旦大學智能機器人與先進制造創新學院,打破傳統院系劃分,不設學科邊界,完全圍繞問題導向,匯聚數學、物理、計算機、人機交互、腦機接口等多領域頂尖人才。
他直言,研究院的目標是培養未來5到10年的人工智能領軍人物
在人才培養理念上,他強調兩點——高品位的科研眼光(知道什么問題值得做)和長周期的探索耐心(愿意把問題做完)。
- 論文不是目標,而是副產品。真正的標尺,是能否在真實世界中實現智能體的有效行動與自主決策。
研究院將重構課程體系,縮短從基礎到前沿的路徑,讓學生盡早進入科研與實踐,同時大力支持師生創新創業,推動成果轉化。
具身智能:樂觀,但謹慎
對于當下火熱的具身智能賽道,蘇昊的判斷是“謹慎的樂觀”。
樂觀的底氣來自問題本身,因為這是一個既有科學深度、又有巨大產業潛力的真問題
謹慎則來自于現實,因為當前涌現出的大量精彩演示,與真正的通用能力之間,仍存在關鍵斷層。
而填補這一斷層的核心,正是物理智能。
![]()
談到“具身智能的ChatGPT時刻”,蘇昊坦言,短期內實現大語言模型那種程度的泛化還不現實,但在更長時間尺度上,方向是清晰的。
他預見,具身智能將深度滲透制造業、服務業、養老行業等領域,最終推動人類走向“人機正面互動、人機共存的時代”。
而通往那一未來的橋梁,正建立在今天對物理智能的扎實探索之上。
蘇昊從中國出發,一路從2D到3D,從視覺到具身,一步步打通“讓機器理解世界”的關鍵路徑。
如今,他帶著這一切回來了——落腳復旦,直面物理智能這道真正的難題。
世界級AI科學家的加盟,也把復旦在AI和具身智能,推向了世界最前沿。
[1]https://mp.weixin.qq.com/s/sv768xtTCHv6Uy9qbD92EA
[2]https://www.haosu.ai/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.