1月6日至9日,在拉斯維加斯舉辦的消費電子展(CES)上,一處展臺前的場景格外吸睛。
兩位參展者正進行一場看似混亂的對話,你說中文,我說英文。可對方說完,另一人都能立即用母語回應,點頭、反問、討論細節,毫無障礙。
秘密藏在他們的耳畔:時空壺W4,全球首個骨聲紋AI同傳耳機。
![]()
98%準確率的高水準同傳,嘈雜展會里的“溝通神器”
在時空壺的展區,正呈現出一幅特別的景象,兩位體驗者相對而坐,各自耳畔都戴著一只耳機。
男士剛用英文問完“Have you had lunch?”,女士已經自然地用中文回答:“是的,這里有一些不錯的美食選擇。我還沒吃午飯”。
接著女士用中文反問“你在展位這里過得怎么樣”,男士也毫不猶豫地笑著接話,“我就是有一些忙。”
整個過程中,他們的目光始終自然相接,偶爾伴隨手勢,對話節奏流暢如常。而在他們周圍,是CES展區熙攘的人潮與持續的喧鬧背景音。
![]()
長久以來,傳統翻譯耳機普遍被兩大瓶頸所困:嘈雜環境下“聽不清”,復雜語境中“譯不準”。而這,恰恰是決定跨語言溝通體驗好壞的關鍵所在。
而時空壺W4,正用兩項全球首創技術,直擊這兩大痛點。
第一項是AI骨導收音。傳統方案要么靠多麥克風陣列降噪,但在極端噪音前依然力不從心;要么硬件收音與軟件翻譯割裂,導致整體體驗不佳。
W4創新地加入了一枚骨聲紋傳感器。它的原理很簡單:人說話時,聲音不僅通過空氣傳播,還會引起顱骨的震動。這枚傳感器就是專門用來捕捉這種震動信號的。
“兩個人近距離說話時,怎么防止我的聲音竄進你的耳機里?”時空壺創始人田力坦言,“過去我們做過很多嘗試,試過矢量型降噪,靠方向性波束控制收音距離,效果不錯,但還不夠極致。”
現在,骨聲紋傳感器捕捉顱骨震動,兩顆氣導麥克風收集空氣傳播的聲音,三者信號融合計算后,就能實現“只收我聲,不擾你耳”的精準收音。再吵的環境,也能穩穩鎖定說話人的聲音。
![]()
聽清之后,下一個挑戰是譯準。
時空壺的解決方案是,通過與AI大模型深度融合,具備了聯系上下文理解語境的能力。
舉個例子,很多翻譯設備至今都搞不懂“手沖”咖啡里的“手沖”二字。如果你在國外想點一杯手沖咖啡,不少“實時翻譯耳機”可能會理解成讓你“洗手”。
![]()
而W4不僅能準確翻譯,還能結合場景幫你下單一杯“手沖咖啡”。
不僅如此,基于巴別系統,時空壺上線了業內首創的AI翻譯引擎優選技術。
要知道,全世界有幾千種語言,英文轉西語、中文轉韓語、德語轉英文,每一組語言對的語法邏輯、表達習慣都天差地別,根本沒法靠一個通用引擎搞定所有。
而AI引擎優選系統能實時識別當前語言對,并自動調度后臺中最擅長處理該語言對的專精引擎,就像為每一種語言都配備了一位“母語譯員”。
“從創業第一天我們就想明白,翻譯引擎未來一定是混合狀態。”田力指出,“沒有哪家公司能把所有語言都做到頂尖——谷歌可能英語強,中文就不一定,小語種更難。”
所以,時空壺既自研一些引擎,特別是小語種和個性化引擎,也與OpenAI、豆包、通義千問等頭部平臺都有合作。
田力透露,目前,阿拉伯語有十幾億使用者,但全球AI公司對其識別普遍不佳,因為缺少本土技術生態。時空壺自己深耕后,目前識別準確率已超過許多大廠。
關鍵在于,時空壺并非將這兩項頂尖技術簡單并列,而是首創性地將其融合為一個完整、協同的智能翻譯系統。
![]()
這是翻譯耳機行業首次把“聽得清”和“譯得準”真正貫穿到同一個閉環之中,也因此讓W4成為了迄今為止業內最準的AI同傳翻譯耳機。
數據顯示,W4支持43種語言、96種口音,面對面同傳翻譯準確度高達98%,100db噪音環境下依舊能夠穩定翻譯。
![]()
9年的技術深耕,挖出一條護城河
這樣的高水準同傳體驗,到底是怎么做到的?
故事要從創始人田力的經歷說起。2006年到2010年,他在電子科技大學讀書,畢業后入職華為,很快就拿下了中國區最年輕的金牌個人獎。
三年后他選擇離開,原因是“特別想看看外面的世界”。
2016年底,田力在深圳大學城附近成立了時空壺。
那時候AI已經很火,商湯、曠視等企業估值都到了幾百億,翻譯方面,谷歌翻譯都好多年了,用戶好幾億,微軟也有相關服務和產品。
但田力發現了一個核心痛點:“盡管有這么多工具,出國、談工作、交朋友,最大的障礙還是語言。這說明缺的不是技術,而是一個真正好用的產品。所以我們才出現,我們想實現的是兩個人能像海報上那樣自由自在地交談。”
![]()
次年,當整個行業都在想怎么把“拿在手里”或“屏幕里的翻譯”做得更好時,時空壺推出了全球第一款翻譯耳機WT2。
WT2的技術特點是“1+2”模式,即一部手機配合兩只耳機實現雙向翻譯。雖然不完美,但創新的模式和追求自然對話的模式,在海外眾籌平臺Kickstarter上獲得了超預期3倍的支持,籌得16萬美元。
這筆錢不多,但至關重要:它證明了市場需要翻譯耳機,也證明了這條路走得通。
但技術攻克的難關才剛剛開始。就像自動駕駛分L1-L5級別,AI翻譯也有清晰的進階路徑。
L1是基礎文本翻譯,類似早年電子詞典;L2是“你說一句、我等一句”的回合制翻譯,這是當時行業的主流水平。
而從L2邁向L3,實時同聲傳譯,除了“聽不清”外,還橫亙著一座無法繞開的技術大山:
標準藍牙耳機是單通道設計,無法實現兩只耳機獨立收音、實時互傳。
![]()
時空壺選擇死磕自研。歷時數年,終于在2021年拿出的W3上真正實現了穩定、低延遲的雙向同傳。
同時,他們獨創的“三麥克風陣列+矢量降噪”技術,讓耳機能像雷達一樣精準鎖定用戶的聲音。
正是這些底層突破,讓他們將對話延遲壓縮到了僅有3-5秒。目前聯合國級別的同聲傳譯人員同傳延遲大概在2秒左右。
![]()
與巨頭共舞,在競爭與趨勢中堅定前行
憑借扎實的技術護城河,時空壺得以更從容地面對全球市場的復雜競爭。
2023年后,AI翻譯軟件免費化,白牌硬件價格戰慘烈,而蘋果、谷歌的生態優勢又如影隨形。
就在這片紅海中,時空壺在2024年營收做到了2億元,連續六年行業第一,全球用戶超百萬,產品賣到170多個國家。
在田力看來,時空壺和很多公司最大的區別就在這兒。“巨頭們是已經有了一個產品,比如耳機、手機,然后把翻譯作為生態中的一個功能來覆蓋,是‘我有錘子,找顆釘子’。我們不是,從創立第一天起,我們的目標就只有一個:解決跨語言溝通的問題。”
“我現在做AI的,基本都繞不開翻譯,智能助理總得會說話吧?但問題是,翻譯是一個‘順便就能做好’的功能,還是一個‘需要專注做深’的事?我們堅定認為是后者。”
他舉了個例子:很多產品的翻譯功能,看似美好,實際用起來要么延遲高,要么交互別扭;蘋果的翻譯功能,還得雙方都用蘋果設備才能流暢使用,場景太受限。
“而且,蘋果會專門為翻譯,做一個不依賴iPhone的獨立設備嗎?不太可能。我們甚至做過不能聽歌、不能打電話的耳機。因為在我們眼里,它不是耳機,是‘可穿戴的交流設備’。未來,我們的產品可能會更不像手機配件,一切設計都只為讓溝通更沉浸。”
![]()
“我們現在的體量還很小,但市場潛力巨大。”田力的目光看得很遠,“一方面,全球人工翻譯市場有100億美元,我們可以替代一部分;但更重要的是,很多場景以前根本請不起人工翻譯,比如普通人出國旅游、小商戶和海外客戶談生意,這些都是全新的增量市場。”
“就像大疆早期做無人機,不是為了替代誰,而是開創了一個新賽道。我們也是如此,比起盯著競爭對手搶蛋糕,更想把整個市場的蛋糕做大。”
現在,時空壺的目標很清晰:把翻譯體驗從L3推到L4的水平,讓跨語言溝通變得像呼吸一樣自然。
值得一提的是,即便站在了行業的高點,田力依然保持著創業者的警惕與清醒。
“未來兩三年肯定會遇到危機,不光是因為我從華為出來,更因為創業公司永遠不能自滿。”他坦誠道,“我們雖然在細分領域有點領先,但市場遠沒定局,規模也還小。最關鍵的是,眼睛要盯著用戶,而不是天天看競爭對手,否則很容易跑偏。”
田力最喜歡做的事,是聽用戶的故事:有用戶每天早晚用時空壺耳機,和異國的妻子視頻聊天;有在中國生活的澳大利亞演員,靠著它學會了中國功夫……
![]()
“看到這些真實的案例,你會很感動,覺得真的幫到了他們,完成了人和人之間的連接。這些東西帶給我們的成就感,遠比競爭來得重要。”田力表示。
![]()
結語
當科技行業紛紛追逐風口、搭建生態時,時空壺卻選了條更窄的路,九年專注一件事:讓人聽清并理解彼此。
這份專注,也體現在他們的一個特別命名里。時空壺有個會議室叫“巴別魚”,靈感源自《銀河系漫游指南》:主角在飛船上聽不懂外星人,往耳朵里塞只魚,就能馬上聽懂。
如今,時空壺的探索,正讓這條魚以耳機的形態,從科幻游進現實。也讓其自身成為巨頭林立的時代里,一個獨特的生存樣本。
?END?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.