AI大模型開始具備上帝視角,所有人都在問同一個問題:下一代計算終端會是什么形態?
眼鏡是最熱門的答案。但光帆科技創始人董紅光給出了一個反直覺的方案:一對單耳僅11克重、卻裝了攝像頭的AI耳機。
![]()
作為小米第89號員工、MIUI 早期核心成員,光帆科技創始人董紅光他在過去十多年里深度參與了移動互聯網交互規則的構建——圖形界面、觸控操作、APP生態,這些今天看來理所當然的東西,都是那一代人一行行代碼寫出來的。但從手機到AI硬件的跨越中,董紅光第一次發現,自己熟悉的規則全都要推倒重來。
那個靠點擊、滑動在無數APP孤島間切換的時代,正在撕開一條裂縫。
這期對話圍繞幾個核心問題展開:為什么是耳機而非眼鏡?從圖形界面到意圖感知,交互邏輯發生了什么根本變化?一個越用越懂你的AI助手,跟純工具有何不同?以及,為什么通用硬件的價值一定大于專用硬件?
一、為什么是耳機,而非眼鏡
當全行業都在押注智能眼鏡時,光帆科技卻選擇了把眼睛裝在耳機上。
董紅光是智能眼鏡的狂熱愛好者,但放棄眼鏡這個形態來自冷靜的判斷:眼鏡的重量、光機顯示效果、續航、對妝容的影響——這些問題短期內難以解決。更關鍵的是,新品類需要用戶付出佩戴成本,而收益是否足夠覆蓋成本?
"耳機已經是成熟的可穿戴大品類,"董紅光說,"用戶的佩戴成本已經被聽音樂、打電話這些功能解決了。在這基礎上增加AI能力,就像當年iPhone——在舊有品類之上疊加智能化,用戶的購買決策成本和使用成本都更低。"
![]()
這套邏輯和當年蘋果做iPhone的策略如出一轍。蘋果當時同步推出了iPhone和iPod Touch,兩者幾乎一模一樣,但不能打電話的Touch銷量慘淡。原因很簡單:手機是成熟大品類,用戶本來就要帶一個出門,在這個基礎上疊加智能化,門檻幾乎為零。
至于為什么不選擇吊墜或胸針?答案很直接:攝像頭應該到頭部位置。胸前掛件適合記錄,像執法記錄儀一樣;但感知類應用需要攝像頭與眼睛齊平。"你看什么,就想讓它看什么。如果放在胸前,你為了讓它看到,就得調整身體姿態——這不符合人的直覺。"
而且耳機天然占據了離嘴巴和耳朵最近的位置,是語音交互的第一界面。扎克伯格最近也說,AI硬件交互的第一界面應該是音頻,他們甚至打算在下一代嘗試不帶顯示屏的AI眼鏡。
大家想的其實差不多,只是用不同形態來呈現。
為什么是"耳機+手表"的多設備聯動?
AI時代有個關鍵前置條件:算力必須在云端。大模型無法在端側跑出好效果,這意味著交互與計算解耦。既然云端是大腦,它長出來的身體就不必只有一個。
"我們用耳機+手表的套裝,既能規避眼鏡的重量和續航短板,又能提供更多傳感器和交互形態。"
![]()
眼鏡想集成麥克風、揚聲器、攝像頭、顯示屏于一身,技術難度極高。光帆把功能拆解:耳機負責聽、說、看(攝像頭);手表負責屏幕顯示、觸控交互、GPS定位和生物傳感。手表還能放獨立聯網模塊,分擔計算和連接任務,減輕耳機的散熱和續航壓力。
這是一個在當下更務實的方案——用多設備的物理組合替代單一設備的工程難題,在眼鏡技術完全成熟之前,提供一套最接近全能AI助理的落地體驗。
做成這個耳機難在哪里?
在11克的單耳空間里,光帆塞進了視覺模組、電池、通信模塊。這個過程充滿一把辛酸淚。
最大的挑戰是:沒有一顆芯片能同時搞定通信、耳機功能和攝像頭。這就需要塞好幾個芯片,體積和重量都會暴增,功耗變大,電池也得更大,最后導致佩戴舒適性全面崩潰。
![]()
"我們的堆疊極致到沒有任何縫隙。結構工程師想調一點造型,都說沒有任何空間了。"
![]()
最讓人意外的難點是:攝像頭前面的弧線造型。"我們希望把攝像頭隱藏起來,因為一顆攝像頭盯著你會讓人很不舒服。"
但弧面會讓光線產生干涉,AI就看不清東西了。為了保證弧面效果又讓AI能看清,整個結構設計極其復雜:中間是標準圓形,然后過渡成橢圓形。而且不能用玻璃,只能用高透光率的樹脂材料,還得耐摔、耐磨。"這件事大家很容易忽略,但我們花了巨大精力。"
最痛苦的取舍是攝像頭像素。一開始想搞1200萬或800萬像素的高清攝像頭,能拍照錄像。但那樣體積大、功耗大、重量大、電池也得大——為了三五天用不了一次的功能,犧牲平時一直佩戴的體驗。
最后選擇了200萬像素。"這顆攝像頭的使命是看懂、是感知,不是拍照。它是理解環境,不是記錄世界。"
二、從圖形界面到意圖感知
這是全球第一款具備視覺感知能力的AI耳機。
市場傳聞,OpenAI也要做類似產品,但為什么是光帆率先做出來?
![]()
網傳OpenAI的智能耳機樣式
董紅光的回答很坦誠:"大公司能力很強,我毫不懷疑他們能做得更好。但我們想得更早,動手更快。"創業第一天就在想是否有更好的形態,而大公司可能更想先探索現有形態并做優化。
更重要的是團隊基因——做操作系統需要軟硬結合,需要在軟件、硬件之間反復推導。"做操作系統的人對這些邏輯更敏感。"
在最早期階段,光帆就吸引了寧德時代、韶音、兆易創新等產業鏈頭部公司的投資——基本上聚集了可穿戴領域全產業鏈的陣容。這些產業方深耕多年,對趨勢極其敏感。當董紅光展示方案時,一位產業大佬連說三次"我看到了未來"。
為什么?因為AI讓所有事情值得重新做一遍,AI硬件一定會被重新定義。
過去這些可穿戴設備只是手機配件,價值有限。但當它們變成交互入口,能做的事就太多了。
而光帆自研操作系統的能力,正是把這件事落地的關鍵。
為什么AI硬件需要自研操作系統?
"我們倒很想用別人的操作系統,"董紅光說,"創業公司資源有限,希望聚焦在產品本身。但確實沒辦法。"
今天無論是Windows還是Android,都沒辦法支持AI助理的形態。它們還是以圖形交互為主,不是以調度大模型、用語音和視覺方式交互為核心的。
傳統手機OS超過一半的代碼是圖形代碼——怎么操作GPU,在屏幕上畫東西,抽象成按鈕、下拉框、列表。但AI操作系統不需要這些,它更多是:怎么編排語言?怎么調動傳感器?什么時候開攝像頭?什么時候用語音告訴你?什么時候用手表屏幕顯示?
手機OS的核心是調度GPU進行圖形渲染,響應點擊。AI OS的核心是調度大模型和傳感器。
光帆的操作系統采用"云端+端側"雙層架構:云端運行核心操作系統,負責調度大模型、編排任務、處理意圖理解,這是大腦所在;端側運行實時操作系統,負責管理連接、傳感器數據采集和即時反饋,相當于神經末梢。
這套系統的核心是多模態交互系統——操作系統充當司令官,決定何時開啟攝像頭(視覺感知)、何時調用麥克風(聽覺)、何時通過耳機播報或手表屏幕顯示。
帶攝像頭的AI耳機如何挑戰智能手機的傳統交互模態?
手機交互是被動的、工具化的。比如出行要打網約車,用戶腦子里有需求,必須一步步點擊操作——解鎖、找APP、輸入地址、確認車型、支付。這是人適應機器的工具邏輯。
AI交互是主動的、代理式的。用戶只需直接表達最終需求——"幫我打車回家",AI負責在后臺理解意圖、拆解步驟、調用服務。這是機器適應人的代理邏輯。
董紅光舉了個例子:很多有錢人都有助理,但有錢人自己不會打車嗎?當然會。但當旁邊跟著助理時,他就會經常說"幫我打個車回家"。AI更像是這樣一個助理,能幫你把事情干了。
以打車場景為例:這看起來簡單,但充分調動了光帆所有的能力。
![]()
首先是主動式觸發。系統知道用戶的機票信息、航班時間、航站樓,通過GPS知道當前位置,結合實時路況計算,會主動在耳邊提醒:"晚上7點你有個飛機,我看了一下路況,你現在差不多該出發了,要不要我幫你叫個車?"
用戶說"好",它就去叫車。叫車之前,還會在手表上顯示上車點——因為用戶得看一下具體在哪里上車。打完車后,耳機播報"車打到了,白色豐田",手表同步顯示車牌號。
看這套東西看起來好像很簡單,但實際上調度了各個應用的數據(日歷、機票、打車),調度了各個器件(GPS、耳機揚聲器、手表顯示)。手機上完成同樣的事情,至少需要十幾次點擊。而且手機是被動的——用戶自己腦子里一直得想著這事,掏出手機操作半天發現還早,過一會兒再掏,再操作。
主動式的好處就是你不用想了。
理想的AI體驗是讓用戶忘掉硬件的存在——在后臺悄無聲息處理瑣碎意圖,僅在必要時打擾用戶,讓用戶盡快回歸現實生活。
三、主動智能:越用越懂你
很多人會問:攝像頭是常開感知嗎?不是。常開意味著功耗和散熱都搞不定。
光帆的攝像頭有兩類觸發方式。第一類是事件性觸發:用戶明確說"幫我看一下這是什么",攝像頭就開了,識別完就關。第二類更有意思——預判性觸發。
比如系統要主動跟你閑聊,或者要播報一條消息,它會先開一下攝像頭,看你忙不忙。如果發現你正在跟別人聊天,它就不打擾了。
主動服務的難點在于分寸感。什么時候主動?主動到什么程度?
董紅光的策略是收著做:很明確應該提醒的,就提醒;模糊的場景,先收一收。
![]()
光帆和純工具最大的不同是:它關心使用者,關心主人是誰。
博物館的講解器、商場的導覽機,都是工具,不需要知道使用者是誰。但AI助理必須深度了解用戶,才能做到主動服務。
光帆構建了一整套用戶畫像體系。記憶來源有四類:
第一類是傳感器帶來的記憶片段——去了哪里、看到什么,這些都會被向量化存儲。
第二類是對話內容——閑聊時聊了什么,讓AI干什么事,這些都會被切片化處理。
第三類是行為記錄——幫用戶訂機票、打車、買東西,這些交易行為也會被存儲。
第四類是主動托付——用戶明確讓AI記的事情,明確指令一般都是比較關鍵的事,這類記憶優先級最高。
這些記憶會做權重處理。比如用戶每天早上都跑步,慢慢跑步場景權重就高了;偶爾進一次城,這個陌生地區的權重就比較低。慢慢地構建出精準的用戶畫像。
"比如去故宮,有的人第一次去,我就給你講解講解。但有的人是故宮發燒友,天天去跑,我就沒必要講了。這種差異化體驗完全依賴用戶畫像的積累。"
這也造成了遷移成本。用戶使用得越多,留下的記憶片段越多,AI就越懂用戶。換到一個從零開始的新設備會很難受——就像換了一個助理,什么都得重新教。
好消息是,記憶存儲在云端,不在端側。換設備時記憶跟著走,未來出二代產品也不用"重新招助理"。理論上,這些記憶甚至可以打包帶走。
幾個核心場景:打車、博物館、旅游
打車場景前面已經詳述。這里再補充博物館和旅游場景。
博物館是光帆的核心場景之一。傳統的博物館講解器需要租借設備、走到特定位置才能觸發講解。很多打車的AI產品也在推博物館講解功能,但需要用戶詳細描述"我在某博物館看到了某個東西"——如果用戶自己也不認識,還怎么描述?
光帆的解法是:因為有GPS,自然知道用戶在哪個館;因為有視覺識別,自然知道這是什么作品。用戶只需要看著展品,手表上輕輕一劃(支持息屏觸摸),就能聽到講解——不用說話。
"我是i人,我們設想過很多場景,希望盡量不讓他說話就能搞定一些東西。"
旅游場景更有想象空間。名山大川不一定需要純視覺感知,基于地理位置就能觸發。"走到虎跳峽了,我覺得你這個地點應該欣賞些什么樣的美景,給你大概說一說。"
更實用的是餐廳推薦。用戶在街頭說"我想吃個清淡一點的",系統不用用戶描述周圍有什么,直接開攝像頭掃一下前方幾個餐廳,優選出清淡的那家。
![]()
還有實時翻譯。異地旅行時,視覺加聽覺的組合,自然就能完成翻譯。
"單旅游場景就足夠吸引非常多人了。甚至應該成為核心的出貨渠道——博物館、藝術展、名山大川、異地翻譯,所有需要講解和解釋的場景。"
最后是靈感記錄。董紅光自己天天在用的功能:開車時有個靈感,輕輕一敲耳機就說,不用掏手機。過去你得掏手機、選應用——日程輸到日歷,待辦輸到Todo,有些事輸到備忘錄,有些發到微信——到處輸,到處找。現在就是碎碎念,AI幫你整理。回頭可以直接問"我那天記了個什么事",它就給你找到了。
"平時經常腦子中一閃而過一堆靈感,掏手機的過程中就忘了。現在敲一下就說,完事了。"
四、通用硬件的價值一定大于專用硬件
AI硬件分兩種:專用和通用。
專用AI硬件像MP3、數碼相機、功能手機,一個設備上就兩三個功能。這種情況下,操作系統可有可無,硬件直接對接功能,中間一層薄薄的小系統就夠了。
但通用AI硬件要做AI助手,不可能只干一兩件事。需要接入海量應用和服務——旅游、打車、日程、外賣、博物館講解——只有操作系統才能把復雜硬件和多傳感器穿起來,把海量應用接進來。
"專用硬件像是只做一件事的工具,只需簡單指令集。通用AI硬件要成為具備感知、記憶和決策能力的'智能體',需要操作系統來統籌云端大腦、端側感官以及海量服務生態。"
這也是為什么光帆一上來就強調操作系統的普適性。就像iOS和Android最初是為手機設計的,后來發現平板、車機、電視都能用——凡是有圖形界面的都能用。光帆的思路是:凡是以語音交互為主的AI品類,未來都可以用這套操作系統。
光帆如何解決AI設備的吃灰問題?
AI硬件最大的問題是:新鮮感只有幾天。
人形機器人買回來翻個跟頭就吃灰了,智能眼鏡也很少有人持續佩戴。
光帆的解法是,高頻帶低頻。
首先,選擇的兩個品類本身就是成熟大品類。開放式耳機用戶本來就會天天佩戴——聽歌、接電話。手表用戶本來就會每天戴——看時間、運動健康。即便不用AI功能,這兩個設備依然有極高的日常實用價值。
"即使用戶不使用AI功能,這兩個設備依然是好用的耳機和手表。這就解決了'吃灰'問題——設備一直在用戶身上,AI就有機會在合適的場景被喚醒。"
![]()
其次,在剛需場景和高頻場景之間平衡。博物館講解是剛需但低頻,消息提醒是高頻——重要消息在耳邊提醒,下一個會什么時候開,到家提醒取快遞,到超市提醒買東西。高頻場景讓用戶持續佩戴,低頻剛需場景在需要時正好派上用場。
"我們得益于操作系統,開發一個應用成本很低。所以既要剛需的,又要高頻的。"
光帆的科幻終局
"光帆"這個名字來自科幻領域的星際推進技術——不攜帶燃料,靠光壓持續加速。在有限燃料下,傳統火箭只能做短途旅行。但光帆可以做得很輕,一點一點往前走,慢慢提升速度,接近光速,走得很遠。
董紅光說這正是他們做事的風格。
第一,AI賽道是確定的,但路徑需要探索。"我們用務實的方式,讓用戶以更低成本接受,一點點推進。"
第二,探索本身就有價值。"別人沒有做過的路徑,未見得是對的,但這個探索本身就有價值。"
第三,最后支撐前行的是希望。"創業資源有限,很多時候彈盡糧絕。但光代表希望——當你彈盡糧絕的時候,依然能通過希望讓這家公司繼續前行。"
在看不清遠方的AI大航海時代,董紅光最篤定的是什么?
"AI一定能改變人的生活。今天雖然大模型離很多人都很遠,但它可以離人很近,只是工程和產品上還沒有落地。這件事是確定的。"
在用戶每一次不再掏出手機的那個瞬間,AI硬件的價值才真正顯現。光帆選擇了自研OS,選擇了給耳機裝上攝像頭這個反直覺的方案,正是在確定的方向上,做不確定的探索。
一點一點往前走,慢慢提升速度,走得很遠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.