337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

騰訊混元團隊打造手機AI助手突破:從失敗中學習的智能操作系統

0
分享至


當你拿起手機想要完成一個復雜任務時,比如錄制一段音頻并保存到特定文件夾,或者打開某個應用調整設置,你可能需要點擊十幾個不同的按鈕,在各種菜單間跳轉。如果操作失誤,往往需要重新開始?,F在,騰訊混元團隊開發了一個名為UI-Voyager的AI助手,它不僅能自動完成這些復雜的手機操作任務,更重要的是,它能從每一次操作失誤中學習,變得越來越聰明。

這項突破性研究發表于2026年3月,由騰訊混元實驗室主導完成,研究編號為arXiv:2603.24533v1。研究團隊開發的這個4B參數的AI模型在AndroidWorld基準測試中取得了81.0%的成功率,不僅超越了所有現有的大型模型,甚至超過了人類操作員80.0%的表現水平,這在手機自動操作領域可謂是一個里程碑式的成就。

傳統的手機AI助手往往只能完成一些預設的簡單操作,而UI-Voyager的獨特之處在于它能夠學會復雜的多步驟操作,更關鍵的是它擁有一種"從錯誤中學習"的能力。就像一個聰明的學生,它不會因為一次考試失敗就放棄,而是會仔細分析自己在哪個環節出了問題,然后在下次遇到類似情況時做出正確的選擇。

一、打破傳統:讓AI從失敗中獲得智慧

在現實生活中,我們學習新技能時往往是通過試錯來進步的。學騎自行車時,我們可能會摔倒很多次,但每次摔倒都能讓我們更好地理解平衡的要領。然而,傳統的AI訓練方法就像只給學生看標準答案,而從不分析錯誤答案為什么是錯的。這種方法在處理復雜的手機操作任務時顯得力不從心。

騰訊混元團隊意識到,在手機操作這樣的復雜任務中,失敗的操作軌跡實際上包含著大量有價值的學習信息。比如,當AI嘗試打開設置菜單時,它可能會先錯誤地點擊了通知欄,然后才找到正確的設置圖標。這個"先錯后對"的過程中,錯誤的那一步同樣包含著重要的學習價值,它告訴AI哪些操作是無效的,應該避免。

研究團隊發現,現有的AI訓練方法主要存在兩個致命缺陷。第一個問題是效率低下的失敗學習機制。當AI完成一個需要20多個步驟的復雜任務時,如果最終失敗了,傳統方法會簡單地將整個操作序列標記為"失敗",而無法精確定位是第5步的錯誤點擊還是第15步的錯誤滑動導致了最終失敗。這就像一個老師只會給學生的整張試卷打個"不及格",而不會指出具體哪道題做錯了。

第二個問題是模糊的責任分配機制。在長序列的操作中,AI往往無法準確判斷哪一個具體步驟導致了任務失敗。這種模糊性使得AI很難從失敗經驗中提取有用的改進信息,就像一個廚師知道菜品最終不好吃,但不知道是調料放多了還是火候不對。

二、創新架構:兩階段自我進化的學習系統

面對這些挑戰,研究團隊設計了一個兩階段的訓練系統,這個系統的工作原理就像培養一個優秀的學徒工一樣循序漸進。

第一階段被稱為"拒絕式微調",這個名字聽起來有些嚴厲,但實際上是一個非常聰明的篩選機制。想象一下,你正在教一個學徒如何制作復雜的工藝品。在這個階段,你不會直接糾正他的每一個錯誤動作,而是讓他自由嘗試,然后只保留那些最終成功的作品作為學習樣本。這種方法讓AI能夠在大量的嘗試中自然地發現有效的操作模式。

具體來說,系統會讓AI模型針對同一個任務生成多個不同的操作方案,然后通過一個自動驗證器來判斷哪些方案能夠成功完成任務。只有那些被驗證為成功的操作序列才會被保留下來,作為下一輪訓練的高質量數據。這個過程會不斷重復,每一輪都會產生更好的訓練數據,從而推動模型能力的持續提升。

經過三輪這樣的迭代訓練,模型的成功率從最初的37%大幅提升到了73%,這個進步幅度相當可觀。但研究團隊并沒有滿足于此,他們知道真正的突破還在后面。

第二階段是整個系統的核心創新,被稱為"群組相對自蒸餾"。這個名字雖然聽起來很技術化,但其背后的理念非常直觀。設想你正在教一群學生解決同一道數學題,有些學生找到了正確答案,有些學生做錯了。傳統的做法是簡單地告訴錯誤的學生"你做錯了",但更聰明的做法是找到他們與正確學生的解題路徑在哪一步開始分叉,然后針對性地糾正那個關鍵分叉點。

這種方法的精妙之處在于"分叉點檢測"技術。系統會仔細比較成功和失敗的操作序列,尋找它們開始出現差異的關鍵節點。比如,在一個"打開文件管理器并找到特定文件"的任務中,成功的操作可能是向下滑動打開通知欄,而失敗的操作可能是向上滑動嘗試打開應用抽屜。系統能夠精確識別出這個關鍵的分叉點,然后將正確的操作方法教授給失敗的嘗試。

為了實現這種精確的分叉點檢測,研究團隊采用了一種叫做SSIM(結構相似性指數)的圖像比較技術。這種技術能夠準確判斷兩個手機屏幕截圖是否顯示相同的界面狀態,從而確定成功和失敗的操作序列在哪一點開始出現分歧。這就像有一雙能夠精確識別細微差別的眼睛,能夠發現兩個看似相似的界面之間的關鍵區別。

三、關鍵技術:精準識別操作分叉點的智慧

分叉點檢測技術的工作原理可以用一個簡單的例子來說明。假設AI需要完成"錄制音頻并保存文件"這個任務,它會同時嘗試多種不同的操作路徑。成功的路徑可能是:打開錄音應用→點擊錄制按鈕→錄制完成→點擊停止→選擇保存位置→確認保存。而失敗的路徑可能是:打開錄音應用→點擊錄制按鈕→錄制完成→點擊停止→誤點擊刪除按鈕→任務失敗。

通過比較這兩個路徑的屏幕截圖序列,系統能夠精確定位到分叉點發生在"錄制完成點擊停止"之后的那一步。在這個關鍵節點,成功路徑選擇了"保存"操作,而失敗路徑選擇了"刪除"操作。一旦識別出這個分叉點,系統就能構建出高質量的糾錯訓練樣本:在相同的界面狀態下,應該選擇"保存"而不是"刪除"。

這種分叉點檢測不僅能夠處理明顯的錯誤操作,還能識別更加細微的差別。比如,在瀏覽器中導航時,成功的操作可能是點擊"向下"按鈕移動到正確位置,而失敗的操作可能是點擊"向右"按鈕撞到障礙物。雖然這兩個操作在某種意義上都是"導航操作",但它們的結果截然不同。系統能夠識別出這種細微但關鍵的差別,從而提供精準的糾錯指導。

更令人印象深刻的是,這種分叉點可能出現在操作序列的任何位置,甚至是第一步。研究團隊展示了一個"關閉藍牙"任務的例子,其中成功和失敗的操作從第一步就開始分化:成功路徑是向下滑動打開通知欄,然后點擊快速設置中的藍牙圖標;而失敗路徑則是向上滑動嘗試打開設置應用。這種從一開始就出現的分叉點同樣能夠被系統準確捕捉和利用。

四、突破性成果:超越人類表現的AI操作員

在AndroidWorld這個包含116個不同復雜任務的測試平臺上,UI-Voyager展現出了令人矚目的性能。這個測試平臺就像一個全面的"手機操作技能考試",涵蓋了從簡單的應用啟動到復雜的文件管理、系統設置調整等各種真實場景。

最終的測試結果讓整個研究團隊都感到驚喜。僅有4B參數的UI-Voyager模型達到了81.0%的成功率,這個成績不僅超過了所有其他AI模型,包括那些參數量達到235B的超大型模型,更重要的是,它還超過了人類操作員80.0%的基準表現。

這個成果的意義不僅在于數字上的突破,更在于它證明了"從失敗中學習"這一理念的有效性。相比之下,傳統的強化學習方法如GRPO和PPO在同樣的任務上只能達到76%左右的成功率,而且需要大量的訓練時間才能達到這個水平。

研究團隊還發現,群組相對自蒸餾方法在那些最困難的任務上表現尤為出色。在一些成功率極低的復雜任務中,比如創建特定的播放列表、管理復雜的文件結構等,這種方法能夠將成功率從接近零提升到相當可觀的水平。這表明該方法特別適合處理那些需要精確操作序列的復雜任務。

更令人鼓舞的是,這種學習能力還體現在模型的適應性上。當面對新的、在訓練中從未見過的任務時,UI-Voyager表現出了良好的泛化能力。這種泛化能力來源于它對操作失敗模式的深入理解,使其能夠在新情境中避免類似的錯誤。

五、實際應用:改變我們與手機交互的方式

UI-Voyager的成功不僅是技術上的突破,更預示著我們與智能設備交互方式的根本性改變。在不久的將來,我們可能不再需要記憶復雜的操作步驟或在各種菜單中迷失方向。

考慮一個典型的使用場景:你想要在手機上完成一系列相關的任務,比如整理照片、創建相冊、分享給朋友,然后設置自動備份。傳統上,這需要你在多個應用之間切換,記住各種操作步驟,還要處理可能出現的各種異常情況。有了UI-Voyager這樣的AI助手,你只需要描述你的目標,它就能自動完成這整個復雜的操作流程。

更重要的是,這種AI助手具備了自我改進的能力。當它在某個特定的手機型號或應用版本上遇到新的界面布局時,它能夠快速適應并學習新的操作方法。這種適應性對于處理不斷更新的移動應用生態系統來說至關重要。

從技術發展的角度來看,UI-Voyager代表了AI從"執行指令"向"理解意圖"轉變的重要一步。它不僅能夠執行具體的操作命令,更能夠理解用戶的高層次目標,并找到實現這些目標的最佳路徑。即使在遇到意外情況或界面變化時,它也能夠靈活調整策略,找到替代的解決方案。

這種能力的應用前景非常廣闊。除了個人手機使用,它還可以被集成到企業應用中,幫助自動化復雜的業務流程。比如,在客服系統中,AI可以自動處理復雜的查詢和操作請求;在測試環節,它可以自動執行復雜的用戶界面測試;在無障礙技術領域,它可以為行動不便的用戶提供更加智能的操作輔助。

六、技術挑戰與解決方案:完善細節的工程智慧

盡管取得了顯著成功,研究團隊也誠實地分享了開發過程中遇到的技術挑戰和相應的解決方案。這些挑戰的解決過程展現了團隊在工程實現方面的深度思考。

首先是實時執行環境帶來的復雜性。與實驗室中的靜態測試環境不同,真實的手機操作環境是動態變化的。屏幕可能在動畫過程中被截圖,應用可能正在加載,系統通知可能隨時彈出。這些動態因素都會影響分叉點檢測的準確性。

為了解決這個問題,研究團隊開發了一套時間感知的匹配算法。這套算法不是簡單地比較單張截圖,而是在短時間窗口內尋找最佳匹配,同時考慮了界面元素的動態變化。比如,當一個按鈕在加載過程中顯示不同的狀態時,算法能夠識別出這些狀態實際上代表相同的邏輯界面。

另一個挑戰是如何處理手機操作中的異步性和不確定性。不同的手機設備有不同的響應速度,相同的操作在不同時刻可能產生微妙的時序差異。研究團隊通過引入時序平滑機制和多候選匹配策略來應對這種不確定性,確保系統能夠在各種設備條件下穩定工作。

在操作空間的設計上,團隊選擇了相對高層的操作原語,如點擊、滑動、輸入文本等,而不是底層的像素級操作。這種選擇既簡化了學習難度,又保持了足夠的表達能力。但同時,這也意味著系統無法處理一些需要精確手勢的高級操作。研究團隊認為,這種權衡在當前階段是合理的,未來可以通過分層操作建模來擴展到更復雜的操作類型。

七、深度分析:為什么這種方法如此有效

UI-Voyager成功的關鍵在于它對失敗信息的充分利用。傳統的機器學習方法往往將失敗樣本簡單地丟棄或標記為負樣本,但這種做法忽略了失敗樣本中蘊含的豐富信息。

從信息論的角度來看,一個失敗的操作序列實際上包含了大量有價值的信息。它告訴我們在特定的狀態下,某些操作是無效的,應該避免。更重要的是,通過與成功序列的對比,我們可以精確定位導致失敗的關鍵決策點。這種精確定位是傳統方法難以實現的。

群組相對自蒸餾方法的另一個優勢是它的數據效率。傳統的強化學習方法需要大量的試錯來學習有效策略,而這種方法能夠從相對較少的成功樣本中提取最大的學習價值。通過精確的分叉點識別,每個成功樣本都能夠糾正多個失敗樣本,大大提高了學習效率。

此外,這種方法還具有很好的可解釋性。當系統做出某個操作決策時,我們可以追溯到具體的分叉點和糾錯樣本,理解這個決策的來源。這種可解釋性對于構建可信賴的AI系統來說非常重要。

從認知科學的角度來看,UI-Voyager的學習機制與人類的學習過程有相似之處。人類在學習復雜技能時,往往會通過對比成功和失敗的經驗來改進自己的策略。專家和新手的一個重要區別就在于專家能夠更精確地識別關鍵的決策點,避免重復犯錯。UI-Voyager的分叉點檢測機制在某種程度上模擬了這種專家級的錯誤分析能力。

說到底,UI-Voyager的成功展示了一個重要的研究理念:在AI系統的設計中,我們不應該簡單地模仿現有的方法,而應該深入思考問題的本質,尋找更加符合任務特性的解決方案。手機操作任務的復雜性和動態性要求AI系統具備強大的錯誤恢復和自我糾正能力,而傳統的監督學習或強化學習方法在這方面都有其局限性。

騰訊混元團隊的這項工作不僅在技術上取得了突破,更重要的是為AI研究提供了一種新的思路:如何更好地利用失敗信息來加速學習過程。這種思路有望在更多的AI應用領域發揮作用,推動整個行業向更加智能和高效的方向發展。雖然目前UI-Voyager主要應用于AndroidWorld測試環境,但其核心理念和技術架構為構建更加智能的人機交互系統奠定了堅實基礎。隨著技術的進一步完善和優化,我們有理由期待在不久的將來看到更多基于這種"從失敗中學習"理念的AI產品進入我們的日常生活,讓我們與智能設備的交互變得更加自然和高效。

Q&A

Q1:UI-Voyager是什么?

A:UI-Voyager是騰訊混元團隊開發的手機AI操作助手,它能自動完成復雜的手機操作任務,比如打開應用、調整設置、管理文件等。它的特別之處在于能從操作失敗中學習改進,就像一個會從錯誤中吸取經驗的智能學徒。

Q2:UI-Voyager比人類操作手機還厲害嗎?

A:是的,在AndroidWorld的116個測試任務中,UI-Voyager達到了81.0%的成功率,超過了人類操作員80.0%的表現。更令人印象深刻的是,它只用了4B個參數就超越了許多參數量達到235B的大型AI模型。

Q3:普通人能使用UI-Voyager嗎?

A:目前UI-Voyager還處在研究階段,主要在AndroidWorld測試平臺上驗證技術效果。但這項技術的成功為開發實用的手機AI助手奠定了基礎,未來很可能會被集成到實際的手機系統或應用中,幫助用戶自動完成復雜操作。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
張本美和奪冠,三十多年前何智麗的回旋鏢打回中國乒乓球隊

張本美和奪冠,三十多年前何智麗的回旋鏢打回中國乒乓球隊

羅納爾說個球
2026-03-17 21:33:29
留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

觸摸史跡
2026-04-02 14:39:03
萬科前董事長郁亮曾兩次拒絕王石

萬科前董事長郁亮曾兩次拒絕王石

地產微資訊
2026-03-04 08:40:10
北京挖出大太監李蓮英之墓,開棺后,考古人員被嚇得渾身發抖

北京挖出大太監李蓮英之墓,開棺后,考古人員被嚇得渾身發抖

歷史人文2
2026-04-05 11:30:03
以色列彈盡糧絕,伊朗痛打“落水狗”,突然齊射100枚重型導彈

以色列彈盡糧絕,伊朗痛打“落水狗”,突然齊射100枚重型導彈

音樂時光的娛樂
2026-04-06 11:42:26
突然拉升!美聯儲、鮑威爾,突發!降息,大消息!

突然拉升!美聯儲、鮑威爾,突發!降息,大消息!

證券時報e公司
2026-04-04 22:12:45
哈蘭德戴帽后拿走比賽用球,隊友球上留言:干得好,你這該死的怪胎

哈蘭德戴帽后拿走比賽用球,隊友球上留言:干得好,你這該死的怪胎

懂球帝
2026-04-06 11:22:10
每體:巴薩決心歐冠首回合鎖定勝局,因到了馬競主場變數太大

每體:巴薩決心歐冠首回合鎖定勝局,因到了馬競主場變數太大

懂球帝
2026-04-06 10:49:10
田曦薇從小就是班花級別,這美貌不要太出眾!

田曦薇從小就是班花級別,這美貌不要太出眾!

動物奇奇怪怪
2026-04-05 17:08:34
“只剩咱倆了,你也100了,都不容易”!查爾斯國王看望百歲保姆

“只剩咱倆了,你也100了,都不容易”!查爾斯國王看望百歲保姆

書醬瞄瞄
2026-03-20 15:37:53
42歲王皓偷偷抹眼淚!決勝局咆哮鼓勵王楚欽:放手一搏,釋放出來

42歲王皓偷偷抹眼淚!決勝局咆哮鼓勵王楚欽:放手一搏,釋放出來

風過鄉
2026-04-06 11:19:33
特朗普入院,48小時通牒成笑柄反噬美國

特朗普入院,48小時通牒成笑柄反噬美國

未來展望
2026-04-06 12:35:07
蹊蹺!上海一小區地下車庫突然出現10多輛破舊“僵尸車”……意欲何為?

蹊蹺!上海一小區地下車庫突然出現10多輛破舊“僵尸車”……意欲何為?

環球網資訊
2026-04-06 09:22:16
轟38+6+6!請把球給哈登,米切爾賽后明牌了,他還透露騎士戰術

轟38+6+6!請把球給哈登,米切爾賽后明牌了,他還透露騎士戰術

巴叔GO聊體育
2026-04-06 11:42:14
仰天大笑+吐舌慶祝!18歲日乒王牌被贊真天才 日媒:成隊史第二人

仰天大笑+吐舌慶祝!18歲日乒王牌被贊真天才 日媒:成隊史第二人

顏小白的籃球夢
2026-04-05 14:35:02
一覺醒來,特朗普躺進醫院?48小時最后通牒,淪為國際大笑話

一覺醒來,特朗普躺進醫院?48小時最后通牒,淪為國際大笑話

劉森森
2026-04-06 10:21:08
朝鮮宣布停用中國衛星,改用俄羅斯衛星,無形中幫了中國一個忙

朝鮮宣布停用中國衛星,改用俄羅斯衛星,無形中幫了中國一個忙

共工之錨
2026-04-05 00:18:42
蔣介石咽氣后宋美齡想獨攬大權,蔣經國一句話宋美齡連夜逃往美國

蔣介石咽氣后宋美齡想獨攬大權,蔣經國一句話宋美齡連夜逃往美國

紀實文錄
2025-05-15 16:21:00
法國冠軍車手銳評張雪機車奪冠,7字一針見血,直戳中國人心窩里

法國冠軍車手銳評張雪機車奪冠,7字一針見血,直戳中國人心窩里

興史興談
2026-04-06 11:21:37
上海年近八旬老夫妻被撞!全身多處骨折,還是全責!又是這種車,83歲鄰居也因此受傷

上海年近八旬老夫妻被撞!全身多處骨折,還是全責!又是這種車,83歲鄰居也因此受傷

新民晚報
2026-04-05 16:42:09
2026-04-06 13:16:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業世界
7875文章數 558關注度
往期回顧 全部

科技要聞

前同事被蒸餾成Token,AI能否偷走職場經驗

頭條要聞

美以被指欲借庫爾德人攻入伊朗 庫區官員:絕不會介入

頭條要聞

美以被指欲借庫爾德人攻入伊朗 庫區官員:絕不會介入

體育要聞

球員系列賽大滿貫!趙心童10-3世界第一 加冕賽季第4冠

娛樂要聞

喬任梁離世10年 父母曝舞臺光鮮的背后

財經要聞

118噸!這家央行,大幅拋售黃金!

汽車要聞

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態度原創

房產
手機
教育
公開課
軍事航空

房產要聞

小陽春全面啟動!現房,才是這波行情里最穩的上車票

手機要聞

vivo X300s / X300 Ultra維修備件價格公布,199換電池

教育要聞

單位邀請函 | 2026上海高?!按杭敬倬蜆I攻堅行動”暨藝術人才專場招聘會

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美飛行員獲救細節:美伊發生激烈交火 至少4死1傷

無障礙瀏覽 進入關懷版