![]()
始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!
過去很長一段時間里,行業內始終圍繞著一個核心問題展開思考:如果 AI 真的能成為 “助手”,它能否像人類一樣,拿起手機將一件事從頭做到尾?
在大眾的想象中,AI 不該只局限于聊天框內的文字交互,更應走進用戶日常依賴的各類 App 里:既能在外賣軟件中完成從選品到下單的全流程,也能在云手機中批量處理通知、點贊評論,還能在銷售、客服、出勤等場景中,自動完成那些重復繁瑣、讓人不愿手動操作的任務。AutoGLM 團隊做的正是讓 AI 真正掌握 “使用手機” 的能力。AutoGLM已上線始智AI-wisemodel開源社區,歡迎體驗。
![]()
模型地址
https://wisemodel.cn/models/ZhipuAI/AutoGLM-Phone-9B
https://wisemodel.cn/models/ZhipuAI/AutoGLM-Phone-9B-Multilingual
01.
為行業構建公共底座
從產品層面看,AutoGLM 已能支撐多個真實場景;從技術積累來看,其成果足以形成多份深度技術報告。而在這樣的節點選擇開源,團隊有著三重明確的考量:
1. 打破少數廠商的技術壟斷
AI 手機已是行業明確趨勢,但如果 “AI 使用手機的核心能力” 僅被少數廠商掌握,將直接限制開發者的創新空間 —— 開發者的產品迭代需依賴平臺開放接口,用戶的核心設備也可能逐漸淪為 “他人的入口”。AutoGLM 開源的首要初衷,便是將這一核心能力轉化為全行業可共享、可打磨的公共底座。無論是將其作為積木嵌入自有系統,還是拆解、重寫、改造,每個開發者和團隊都能將其化為自身產品的一部分,讓 AutoGLM 從 “智譜的技術” 變為 “行業的工具”。
2. 讓隱私與控制權留在使用方手中
Phone Use 能力的規模化應用,必然觸及個人微信、支付信息、聊天記錄、企業內部系統等敏感領域。AutoGLM 團隊認為,這些核心數據不應由技術提供方掌控。通過開源與私有化部署,企業和開發者可在自身合規環境中,完整掌控數據、日志和權限,讓手機真正成為 “專屬 AI 手機”。正如團隊所強調的:“技術向整個生態開放,數據與隱私永遠留在使用方這一側。”
3. 降低行業創新門檻
AutoGLM 的研發之路充滿挑戰,團隊啃下的技術難題、踩過的坑、重寫的框架,在諸多場景中都具備復用價值。但 “一花獨放不是春”,Agent 技術的全面爆發,需要全行業的共同參與。團隊期待看到:
有團隊基于 AutoGLM 打造真正的 AI 原生手機;
有研究者拆解其中模塊,形成新論文、新算法;
有個人開發者將 Demo 轉化為實際項目,在小眾場景中落地應用。
他們的最終愿景是:從開源之日起,人人都能擁有自己的手機 Agent。
![]()
02.
從 “亂點” 到 “可控” 的技術突破
自2023年4月起,AutoGLM 團隊便從零起步,開啟長達32個月的技術探索。他們的核心目標很明確:讓 AI 不僅能 “說”,更能 “做”。
1. 從 “亂點的手” 到 “可控的手”
最初的版本中,基于大模型構建的系統僅能執行 “點擊”“滑動” 等基礎操作,偶爾能完成短流程任務,更多時候會陷入無意義的操作或死循環。為解決這一問題,團隊耗時近一年梳理問題、搭建框架:
構建了完整的 Phone Use 能力框架;
抽象出點擊、滑動、輸入、截圖、界面理解等基礎動作;
讓模型學會將自然語言指令拆解為穩定、可回放的操作步驟;
成功處理網絡波動、彈窗打斷、廣告遮擋等真實場景中的 “臟信息”。
2024 年 10 月 25 日,團隊發布了首個能在真機上穩定完成完整操作鏈路的 AutoGLM,該產品也被業內認定為全球首個具備 Phone Use 能力的 AI Agent。
2. 人類歷史上第一個 AI 發出的手機紅包
2024 年 11 月,AutoGLM 實現了一項標志性突破 —— 發出人類歷史上第一個由 AI 獨立完成的手機紅包。這一操作并非依賴腳本錄制或內嵌 API 調用,而是 AI 通過 “看見” 屏幕界面、“理解” 功能含義,一步步手動點擊完成。這一成果向行業傳遞了明確信號:手機上的諸多交互場景,首次可以完全由 AI 獨立接手。
![]()
3. 升級至云手機:安全優先的技術演進
2025 年,AutoGLM 2.0 正式發布。團隊驗證了強化學習的規模擴展定律,提出 MobileRL、ComputerRL 和 AgentRL 算法,讓 AI 能在數千個虛擬設備環境中同時進行強化學習,大幅提升了 Agent 的準確性和泛化能力。
更值得關注的是,為保障用戶隱私安全,團隊并未讓 Agent 直接操作用戶的真實手機或核心 App,而是將其部署在與真實世界隔離的云端虛擬手機中:
所有操作均可回放、審計和干預;
敏感數據實現嚴格隔離;
主動放棄了微信等涉及用戶隱私的高頻 App 操作權限。
這一設計背后的邏輯清晰而務實:在讓 AI “會用手機” 之前,先確保它 “不會亂伸手”。
03.
一套 “拿來就用” 的完整能力
此次開源提供了一整套可直接落地的技術工具,具體包括:訓練完成的核心模型;Phone Use 能力框架與工具鏈;覆蓋 50 + 高頻中文 App 的可直接跑通 Demo;針對 Android 系統的適配層與示例工程;詳細文檔與快速上手指南。
其中,模型以 MIT 開源許可證開放,所有代碼以 Apache-2.0 許可證托管于 GitHub 倉庫。開發者既可將其作為現成的基礎設施直接使用,也可按需拆用部分模塊,甚至進行徹底改造,核心目標是幫助每個使用者更接近心目中的 “AI 原生手機”。
當前的 AutoGLM 并非完美答案,真實世界的手機應用場景復雜多樣,它尚未完全覆蓋;未來的 AI 手機生態,也可能出現遠超當下想象的形態。而 AutoGLM 團隊所做的,只是將對 “AI 會不會用手機” 這一問題的一次完整探索,誠實、完整地交到行業手中。
正如 Andrej Karpathy 所言,從 AutoGLM 開源開始,人人都能擁有自己的手機 Agent。我們面臨的或許不只是 “Agent 元年”,更是 “Agent 的十年”。接下來,AutoGLM 團隊將持續深耕技術,也期待與全行業共同推動 Agent 開源生態的發展。唯有如此,那個存在于想象中的 “賈維斯”,才會真正走進每個人的生活。
----- END -----
![]()
wisemodel相關:
系列模型:
關于wisemodel更多
1
歡迎持續關注和支持
開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。
2
歡迎加盟wisemodel開源社區
始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優質內容
歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關于wisemodel開源社區
始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。
向上滑動查看
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.