2026年巴塞羅那Fira Gran Via展館3號館,中國移動的展臺上,一群人圍在靈犀智能體的體驗區(qū)前。有人對著手機說“預訂下周去上海的機票和酒店”,屏幕上的智能體開始自主操作——打開航班應用、比價、選擇時段、填寫信息、喚起支付,最后將行程單收入日歷。整個過程無需用戶手動切換應用,無需一次次點擊確認。
這一幕,或許預示著通信入口正在經歷一場三十年來未有的變革。
自撥號盤和消息收件箱誕生以來,人們與手機的交互方式幾乎沒有發(fā)生本質改變。無論是功能機時代還是智能機時代,通信入口始終停留在“功能堆疊”的邏輯上——想要什么,自己去應用里找;需要跨應用操作,自己動手切換。這種以人為中心的操作模式,在應用數(shù)量爆炸的今天,正在逼近效率的天花板。
中國移動給出的答案,是以靈犀智能體為核心載體,對終端、消息、通話三大通信入口進行AI原生重構。這不是單一產品的升級,而是一套覆蓋端、云、網的能力矩陣。
![]()
1、終端智能體:GUI Agent如何讓手機“自己動手”
終端智能體的核心能力載體,是圖形用戶界面智能體——一個聽起來有些拗口、但理解起來并不復雜的概念。它的本質,是讓智能體像人一樣“看懂屏幕、操作應用”。
傳統(tǒng)的應用自動化依賴API接口,需要開發(fā)者專門適配。但GUI Agent走的是另一條路:它通過多模態(tài)大模型實時解析手機屏幕中的UI元素、文字、圖像,將它們轉化為可理解的語義信息,然后模擬人類觸控軌跡,完成跨應用跳轉、表單填寫、按鈕點擊等操作序列。這意味著,即使某個應用沒有開放接口,智能體依然可以“看著屏幕”完成操作。
這套能力的實現(xiàn),依賴端云協(xié)同的架構設計。端側模型保障實時響應,用戶的隱私數(shù)據(jù)不出手機;云側模型處理復雜意圖推理,將“預訂下周去上海的機票和酒店”這樣的模糊指令,拆解為航班查詢、比價、下單支付、行程管理等一系列可執(zhí)行步驟。兩者分工協(xié)作,既保證了響應速度,也守住了隱私邊界。
在MWC展臺上,中國移動展示了與三星、榮耀等全球頭部終端廠商的聯(lián)合研發(fā)成果。靈犀GUI Agent被深度集成至AI手機系統(tǒng)層,成為出廠預置的原生能力。用戶以自然語言發(fā)出指令,智能體可自主完成從查詢到支付的全流程——無需人工介入,無需應用間手動切換。那些曾經需要反復點擊、多次跳轉的操作,正在被一句語音指令取代。
這不僅僅是便利性的提升。當智能體能夠“看懂屏幕、操作應用”,手機的定位正在發(fā)生變化:它不再是被動的工具,而是具備自主執(zhí)行能力的數(shù)字助手。從“人找服務”到“服務找人”,交互邏輯的底層正在被重寫。
![]()
1) 消息智能體:5G消息入口的AI化重生
如果說終端智能體重構的是手機的操作方式,那么消息智能體重構的,是那個被大多數(shù)人遺忘的入口——短信收件箱。
很長一段時間里,短信的存在感持續(xù)衰減。驗證碼、營銷廣告、快遞通知,它的功能越來越單一,與用戶的交互越來越弱。但5G消息的誕生,讓這個入口重新獲得了可能性:富媒體、交互性、系統(tǒng)級觸達,它具備成為超級入口的天然條件。
靈犀消息智能體要做的,是把這些可能性兌現(xiàn)為真實的服務能力。
從技術架構上看,靈犀消息可以概括為“三層聚合”。通道層以5G消息為原生入口,用戶無需下載、無需安裝,系統(tǒng)級觸達讓服務可以直達每一臺手機。調度層搭載MoMA多模型與智能體聚合服務引擎,可根據(jù)任務類型智能路由最優(yōu)模型——目前已支持12款業(yè)界模型、20余個中國移動內部智能體的調度,推理速度提升42%。執(zhí)行層封裝了70余項原子化能力,覆蓋問答、溝通、應用、娛樂、業(yè)務辦理五大類場景。
這些能力在具體場景中如何呈現(xiàn)?以聚會規(guī)劃為例。用戶告訴靈犀“周末和朋友聚餐,幫我選餐廳、訂座、邀請人”,智能體開始自主運作:根據(jù)口味偏好推薦餐廳,通過AI代訂完成電話訂座,識別好友手機號后自動推送邀請消息,最后將導航信息收入日歷。整個過程在5G消息界面內完成,用戶無需切換應用,無需反復確認。所謂“一語智辦”,正是將復雜任務拆解為多步執(zhí)行序列,讓智能體替人完成那些瑣碎的操作。
從產業(yè)視角看,消息智能體的價值不止于用戶體驗的提升。它證明了一件事:5G消息不僅是富媒體通知通道,更可以成為運營商級智能體運行平臺。以輕量化路徑實現(xiàn)通信能力向服務能力的躍遷,這條路徑正在被驗證可行。
![]()
1) 通話智能體:新通話打開的能力開放新范式
通話,是通信最原初的形態(tài),也是三十年來變化最小的形態(tài)。撥號、接通、說話、掛斷——這套流程從固定電話時代延續(xù)至今,幾乎沒有被重新定義過。
5G新通話要改變的,正是這個“幾乎”。它的本質,是將通話中的實時語音、視頻流轉化為可編程能力接口,向第三方應用開放。通話不再是單純的語音通道,而是一個可以承載服務的能力平臺。
靈犀通話智能體基于這一架構,落地了三大核心應用。
同聲傳譯解決的是跨境溝通的語言壁壘。當兩個使用不同母語的人通話時,系統(tǒng)實時進行語音流雙語處理,將對方的話翻譯成自己的語言,將自己的話翻譯成對方的語言。整個過程中,用戶聽到的是母語,說的也是母語,語言障礙被技術消解于無形。
通話健康管家是與支付軟件聯(lián)合開發(fā)的產品。用戶在通話中可以喚起在線問診,可以拍攝藥盒查詢用藥說明,可以一鍵預約附近醫(yī)院掛號。通話即服務——這個曾經的概念性描述,正在變成可操作的閉環(huán)體驗。健康服務不再需要打開應用、搜索、點擊、預約,一通電話就能串聯(lián)起問診、用藥、掛號的全流程。
無障礙ASR則是面向特定人群的定制化方案。為聽障人士訓練的專屬聲學模型,能夠將其發(fā)音特征轉譯為常人可懂的內容。更重要的是,這套模型可以移植至新通話、5G消息等多端口,讓無障礙溝通能力在不同入口間無縫流轉。技術普惠,在這里有了具體的落點。
這三類應用指向同一個方向:通話正在從“比特管道”升級為“服務入口”。當每一通電話都可以承載翻譯、健康、購物、娛樂等多元服務,運營商在5G乃至6G時代的價值鏈位置,正在被重新定義。
![]()
1) 從靈犀到6G:智能體通信的早期實踐
站在MWC2026的展臺上回看,靈犀智能體的布局其實有一條清晰的演進脈絡。
終端智能體讓手機學會“自己動手”,消息智能體讓收件箱變成服務平臺,通話智能體讓語音通道承載多元能力。三者看似獨立,實則共享同一套底層邏輯:以AI重新定義通信入口,讓智能體替人完成那些繁瑣的操作、跨越那些無形的障礙。
這套邏輯的延伸,指向一個更遠的圖景——6G。
在6G的構想中,智能體通信網絡是核心特征之一。網絡不再只是連接管道,而是智能體之間協(xié)同感知、決策、執(zhí)行的使能平臺。各類智能體不僅需要通信,還需要通過網絡完成協(xié)同感知、推理和決策。這比“萬物互聯(lián)”又進了一步:從連接到智聯(lián),從數(shù)據(jù)傳送到智能協(xié)作。
從這個角度看,靈犀在終端側、消息側、通話側的AI原生實踐,本質上是6G智能體通信的早期落地驗證。當手機上的GUI Agent能夠自主執(zhí)行復雜任務,當5G消息能夠調度多模型完成服務閉環(huán),當新通話能夠開放能力接口承載第三方應用——這些探索正在為未來的智能體通信網絡沉淀經驗、驗證路徑。
從巴塞羅那的展臺出發(fā),靈犀智能體正在走入越來越多的終端、消息界面、通話場景。它的目標不是制造炫酷的演示效果,而是讓每一次通信都更有價值、讓每一個入口都更有能力。從“萬物互聯(lián)”到“萬智智聯(lián)”,這一步已經邁出。
![]()
