337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌深夜大招!機器人學會看儀表盤干活,成功率飆升300%

0
分享至


機器人前瞻(公眾號:robot_pro)
作者 許麗思
編輯 漠影

智東西4月15日報道,昨天深夜,谷歌推出Gemini Robotics-ER 1.6。

去年9月,谷歌發布Gemini Robotics-ER 1.5。時隔半年多,谷歌機器人模型終于迎來一次大升級。

Gemini Robotics-ER 1.6能夠讓機器人以前所未有的精度理解周圍環境,在多項關鍵推理能力上進行了升級,包括視覺與空間理解、任務規劃以及任務完成判斷。它可以作為機器人的高層推理模型,原生調用Google Search、VLA以及其他第三方自定義功能,自主完成復雜作業任務。

谷歌提到,與Gemini Robotics-ER 1.5和Gemini 3.0 Flash相比,Gemini Robotics-ER 1.6在空間與物理推理能力上都有明顯提升,尤其是在點位定位、計數和任務成功判斷等方面。

與此同時,Gemini Robotics-ER 1.6還新增了一項能力——儀表讀數,這使機器人能夠讀取復雜的壓力表和液位觀察窗等設備。該功能是谷歌與波士頓動力合作開發的,特別適合用于高精度工業任務。

如圖,在指向與計數任務上,Gemini Robotics-ER 1.6的成功率為80%;在單視角成功檢測任務中,其成功率為90%;在多視角成功檢測任務中,其成功率為84%;在結合Agentic Vision的儀表讀數任務中,其成功率達到93%,相比Gemini Robotics-ER 1.523%的成功率,飆升了300%。


即日起,開發者就可以通過Gemini API和Google AI Studio使用Gemini Robotics-ER 1.6。

一、升級點位定位和多視角推理能力,提升機器人干活自主性

點位定位是具身推理模型的一項基礎能力,可以讓模型實現不同類型的推理任務,包括空間推理、關系邏輯、運動推理、約束理解等。

Gemini Robotics-ER 1.6可以把點位作為中間推理步驟,來完成更復雜的任務。它可以先通過點位來計數圖像中的物體,或者通過識別關鍵位置,再結合數學計算提高尺寸或距離估算的準確性。

如圖,Gemini Robotics-ER 1.6知道什么時候該指出目標、什么時候不該亂指。它能正確識別圖中有2把錘子、1把剪刀、1把油漆刷、6把鉗子,以及一組園藝工具。對于圖中并不存在的手推車和電鉆,它也不會錯誤標注。

相比之下,Gemini Robotics-ER 1.5就沒法正確識別錘子和油漆刷的數量,完全漏掉了剪刀,還會產生幻覺,指出了并不存在的手推車,鉗子的定位精度也較差。

Gemini 3.0 Flash的表現已經比較接近Gemini Robotics-ER 1.6,但在鉗子的處理上還不夠理想。

Gemini Robotics-ER 1.6還提升了多視角推理能力,能夠更好地理解多路攝像頭畫面以及它們之間的關系,即便在動態變化或存在遮擋的環境中,也能保持較高的判斷能力。

Gemini Robotics-ER 1.6可以綜合多個攝像頭視角的信息,判斷“把藍色筆放進黑色筆筒”這一任務是否已經完成。

像這樣的任務成功判斷(Success Detection)是機器人實現自主性的關鍵一環,因為它決定了機器人在執行任務過程中,是應該重新嘗試一次,還是可以進入下一步。

二、儀表識別成功率達93%,機器人可執行設備巡檢任務

工業廠區遍布溫度計、壓力表、化學液位觀測窗等各類精密儀器,需要長期持續監測。想要解決真實工業場景中這些復雜難題,就必須讓機器人學會儀器讀數識別。

Gemini Robotics-ER 1.6讓機器人能夠讀懂多種儀表,包括圓形壓力表、垂直液位計以及現代數字讀數設備。

讀取儀表并不是簡單的識別任務,而是一個復雜的視覺推理過程。系統必須精確感知多種視覺元素,例如指針、液位、容器邊界、刻度線等,并理解它們之間的關系。

液位觀察窗為例,模型需要結合相機拍攝角度帶來的畸變,估算液體實際填充了多少。對于壓力表,系統還需要讀取并理解文字標注的單位;有些表盤甚至有多根指針,對應不同的小數位,必須綜合后才能得出正確讀數。

依托儀器讀數識別與升級后的任務推理能力,波士頓動力的Spot四足機器人可以實現全自主巡檢,獨立感知、理解并應對各類工業實景挑戰。


Gemini Robotics-ER 1.6之所以能夠實現高精度儀表讀數,是因為它使用了Agentic Vision技術,也就是把視覺推理與代碼執行結合起來。

具體來說,模型會先采取一系列中間步驟:比如先放大圖像,更清楚地觀察儀表細節;再通過點位標注和代碼執行估算比例與區間,最終得到精確讀數,并結合世界知識理解其含義。


在儀表讀數任務上,四種模型的成功率依次提升:Gemini Robotics-ER 1.5成功率為23%;Gemini 3.0 Flash成功率為67%;Gemini Robotics-ER 1.6成功率為86%;Gemini Robotics-ER 1.6(啟用 agentic vision)成功率為93%。


結語:機器人走入現實應用,還需要具備足夠安全性

在機器人規模化落地民用與工業場景的當下,安全性早已和智能化、自主性同等重要,成為制約具身智能落地的核心門檻。

谷歌稱,Gemini Robotics-ER 1.6不僅在環境感知、空間推理、工業儀表識別等核心能力全面進階,更完成了安全能力的系統性升級,也是其目前安全表現最優的機器人專用模型。

在對抗性空間推理任務中,Gemini Robotics-ER 1.6對Gemini安全策略的遵守程度優于此前所有版本。同時,Gemini Robotics-ER 1.6在遵守物理安全約束方面也有明顯提升。

比如,在涉及點位輸出的任務中,它能更安全地判斷哪些物體可以被機械夾爪抓取,哪些不能碰,從而滿足夾持器限制或材料約束,比如“不要處理液體”“不要抓取超過20公斤的物體”等。

谷歌還測試了模型在文本和視頻場景中識別安全隱患的能力,測試依據來自真實世界的傷害事故報告。在這些任務中,Gemini Robotics-ER 1.6相比Gemini 3.0 Flash也有所提升:文本場景提升6%,視頻場景提升10%,說明它在識別潛在傷害風險方面更加準確。


對具身智能而言,真正決定機器人能否走出實驗室、走進大規模真實場景的,除了更強的大腦,還需要每一次感知、判斷與動作背后,都足夠安全可靠。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
抖音集團副總裁:近期沒有招聘到什么近億元年薪員工

抖音集團副總裁:近期沒有招聘到什么近億元年薪員工

界面新聞
2026-04-16 20:34:09
央視官宣:意甲直播版權正式回歸,至此五大聯賽轉播權已集齊

央視官宣:意甲直播版權正式回歸,至此五大聯賽轉播權已集齊

懂球帝
2026-04-16 21:15:11
許家印,KTV豪情終成妄念

許家印,KTV豪情終成妄念

哲空空
2026-04-15 11:40:51
伊朗警告美:若繼續封鎖伊朗港口,將阻斷紅海貿易

伊朗警告美:若繼續封鎖伊朗港口,將阻斷紅海貿易

參考消息
2026-04-16 13:58:05
日本派兵開始搞大事,人民日報向全球通告日本罪行,北約30國站臺

日本派兵開始搞大事,人民日報向全球通告日本罪行,北約30國站臺

傲傲講歷史
2026-04-13 23:21:05
追夢:前兩天我活在被倫納德羞辱的恐懼中,現在證明了我的油箱還有油

追夢:前兩天我活在被倫納德羞辱的恐懼中,現在證明了我的油箱還有油

懂球帝
2026-04-16 17:10:26
機構:若美軍持續封鎖 伊朗兩周內或被迫大幅減產

機構:若美軍持續封鎖 伊朗兩周內或被迫大幅減產

財聯社
2026-04-15 17:30:11
陳麗華500億家產無紛爭!長子一語定調遲重瑞:你這光頭真有福相

陳麗華500億家產無紛爭!長子一語定調遲重瑞:你這光頭真有福相

小娛樂悠悠
2026-04-16 13:24:03
美國,調查“特朗普交易”

美國,調查“特朗普交易”

中國基金報
2026-04-16 07:41:05
諸葛亮去世后蜀漢延續廿九年,劉禪處決數人,抉擇堪稱正確

諸葛亮去世后蜀漢延續廿九年,劉禪處決數人,抉擇堪稱正確

嘮叨說歷史
2026-03-24 18:55:31
國民黨再掀大內斗,兩大部門直接開火,有人包庇“藍皮綠骨”?

國民黨再掀大內斗,兩大部門直接開火,有人包庇“藍皮綠骨”?

DS北風
2026-04-16 19:32:14
不敗即無敵?本賽季歐洲主流聯賽唯一不敗之師,卻遭遇巨大尷尬

不敗即無敵?本賽季歐洲主流聯賽唯一不敗之師,卻遭遇巨大尷尬

體壇老球迷
2026-04-16 21:21:00
趙子琪連發數條內容喊話芒果TV:是逼我爆所有的料嗎?不要面子上當好人、背地里不做人!

趙子琪連發數條內容喊話芒果TV:是逼我爆所有的料嗎?不要面子上當好人、背地里不做人!

海峽網
2026-04-16 11:20:45
2215%!暴漲

2215%!暴漲

放毒
2026-04-16 18:36:42
印度信用崩盤?三哥買貨竟被要求全款先付,這下真成國際笑話了!

印度信用崩盤?三哥買貨竟被要求全款先付,這下真成國際笑話了!

眼界看視野
2026-03-12 13:59:14
潑水節車輛被多人噴水,車主發聲將追責,拉車門男子被扒

潑水節車輛被多人噴水,車主發聲將追責,拉車門男子被扒

奇思妙想草葉君
2026-04-16 16:21:10
月底有登島作戰可能、給中東留點“爛尾”,后或退出北約搞加拿大

月底有登島作戰可能、給中東留點“爛尾”,后或退出北約搞加拿大

邵旭峰域
2026-04-16 16:40:03
殷桃再次挑戰男人裝,白色短袖搭配深灰色西服女王范滿滿!

殷桃再次挑戰男人裝,白色短袖搭配深灰色西服女王范滿滿!

說不盡的人心
2026-04-16 21:33:24
喬致庸臨終告誡后人:一個家族想要富過三代,秘訣只有三個字

喬致庸臨終告誡后人:一個家族想要富過三代,秘訣只有三個字

千秋文化
2026-03-28 21:09:01
馬刺助教肖恩·斯威尼成休賽期熱門主帥人選

馬刺助教肖恩·斯威尼成休賽期熱門主帥人選

北青網-北京青年報
2026-04-16 19:32:06
2026-04-16 22:15:00
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11611文章數 117031關注度
往期回顧 全部

科技要聞

趙明:智駕之戰,看誰在大模型上更高效

頭條要聞

上海業主傻眼 安保、保潔突然全離崗小區垃圾堆積成山

頭條要聞

上海業主傻眼 安保、保潔突然全離崗小區垃圾堆積成山

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創始人王子杰去世,享年63歲

財經要聞

海爾與醫美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態度原創

數碼
房產
時尚
旅游
親子

數碼要聞

消息稱AMD將推出銳龍7 5800X3D處理器AM4平臺十周年紀念版

房產要聞

人人人人!封關后首屆消博會,擠爆了!

8個監控攝像頭,這就是“完美丈夫”對她的愛

旅游要聞

新民視頻 | 限時一個月!上海樂高樂園“悟空小俠”主題月4月17日啟幕

親子要聞

寶藍和爸爸一起過圣誕節,裝扮圣誕樹,還做了美味的蛋糕~

無障礙瀏覽 進入關懷版