網易首頁 > 網易號 > 正文申請入駐

撕不開的 AI 入口，從 AI 耳機聊起

2024-11-04 19:19:03　來源: 后廠村的劉飛

浙江舉報

分享至

前陣子體驗到了字節的新品 Ola Friend 耳機，感謝播客「腦放電波」的胡老師提供的試用。這款耳機被稱為 AI 耳機，也勾起了我對 AI 硬件重新梳理一下的興趣。今天就聊聊這個話題。

1 AI 耳機：Ola Friend

Ola Friend 中 Ola 的意思是葡萄牙語的「你好」，所以產品名字指的是「你好，朋友」。

這款耳機是分離式的 OWS，即 Open Wearable Stereo（開放式穿戴耳機），跟我們熟悉的耳機類型 TWS 不一樣。后者即 True Wireless Stereo（真無線耳機）。當然這個概念都是自研自創的，不是那種嚴謹的命名方法，W 在兩個里面含義都不同。

現今的主流耳機是 TWS 藍牙耳機。藍牙耳機的風潮源于一款歷史性產品，即蘋果公司的 AirPods。

2011 年喬布斯去世后，蘋果一度被唱衰為要隕落的巨星。沒有喬布斯的蘋果，大家認為會缺乏創新。更讓大家不理解的是，喬布斯為什么選擇庫克？在媒體語境、大眾語境里，喬布斯是產品經理，而庫克只是無趣的供應鏈管理者、職業經理人。我當年作為預備產品經理，也對庫克沒有好感。

但是坦白說，喬布斯從 1996 重新回歸蘋果后，庫克應該是第一功臣，在供應鏈的大量工作讓蘋果能起死回生、緩過氣來，才有機會做出 iPod 和 iPhone。在加入蘋果之前，庫克早就是電腦行業最資深的「庫存大師」之一了。

庫克掌管的蘋果公司也沒有喪失創新能力，AirPods 就是經典一例。此后，藍牙耳機行業完全被改變。

AirPods 的重要意義在于，做出了最佳體驗的分離式耳機，并且進行推廣。過去的分離式藍牙要正常連接有難度，在于分離式的同步問題。如果是手機連接兩個耳機的藍牙，就會產生或多或少的延遲。AirPods 為代表的藍牙耳機實現了主耳機、副耳機的技術，即主耳機連接手機，副耳機連接主耳機。也因此這類耳機叫 TWS 耳機。

所以 2017 年就是藍牙耳機的轉折年，如今街頭多數年輕人，幾乎都在戴這種耳機了。

當然，AirPods 也順便改造了播客市場，尤其國內的播客市場。有了降噪藍牙耳機后，在馬路上、公車地鐵里，也都能聽到清晰的內容了，播客順勢在 2019 年后，無論供給還是消費，都有大幅的增長。這太重要了。

TWS 耳機在耳機領域占絕對優勢。根據 IDC 中國 2024 年上半年的統計，藍牙耳機出貨量 5540 萬臺，其中 TWS 出貨 3508 萬臺，在 63% 左右。也能看得出來，耳機確實是大市場，一年有 1 億多的量。

也由于耳機實在是個巨大的市場，就能容納各種耳機的商業空間。OWS 就是其中在快速增長的一種。有統計 OWS 耳機在 2023 年一年有 1000 萬臺的銷量，也不算小了。

那么，OWS 耳機的需求在哪呢？主要還是舒適度。TWS 耳機幾乎都是入耳式的，戴久了耳道會不舒服，因為需要通過塞入耳朵固定和降噪，還會存在氣壓問題，內外氣壓不同也會有壓迫感。OWS 耳機提到比較多的優點就是不用入耳、不用耳道固定。

說到這個，可能會聯想到骨傳導。OWS 跟骨傳導又不一樣，骨傳導是在耳朵上方的，比較有距離。我家有臺韶音的耳機，游泳的時候體驗很好。

OWS 乍一看好像也在耳朵眼，其實沒有進去。OWS 是掛在耳朵上的，就不用塞緊了。別的說實話差不多。

那我們說回來 Ola Friend。

（官方樣圖）

這款耳機的設計挺有意思的，錢包盒一樣，挺精致的，放桌上跟小提包一樣。乍看一眼很漂亮。里面打開設計也有風格。科技感還是很足。

只是佩戴的話，稍微費點功夫，不像 TWS 掏出來一塞就行。

佩戴之后，耳朵是真的挺舒服的，有種給耳朵卸下重擔的感覺。長期佩戴都沒有問題。

本來是想當成主力耳機用一段時間，但這就要提到 TWS 耳機的痛點了：沒有降噪。這屬于絕對性的因素，對我而言，平時出門、坐地鐵、趕飛機的路上，還是必須開降噪的。這就讓佩戴場景相對有限。

音質而言個人體驗是很不錯的，在藍牙耳機里算很好的。Ola Friend 的技術背景是夠硬的，背后的公司 Ola Dance是 2019 年成立的，由前 BOSE 高管李浩乾與多名 BOSE 工程師共同創立。他們也是最早 OWS 的倡導者。

都是 Dance，這不是巧了嘛，Byte Dance 收 Ola Dance，很合理。這也是剛剛發生的事情，就在今年 9 月份。

那么字節為什么要做耳機呢？當然因為剛提到的 AI。

一款藍牙耳機，為什么是 AI 耳機？那是因為能夠喚醒AI。其實 2017 年的分水嶺產品 AirPods 就主打喚起 Siri 的功能。只是當下提 AI 更加有吸引力，營銷是一方面，豆包跟 Siri 也不可同日而語了。你懂的。

早在 2020 年，iFLYBUDS 作為訊飛的智能耳機，就發布，并成為垂直場景的主流產品。說到訊飛，當然這款耳機就跟翻譯有關系了。最重要的功能是會議記錄和轉寫。這款耳機說起來，硬件算是 TWS，長得也是普通耳機的樣子。

Ola Friend 跟豆包的聯動，解決了更多有意義的場景。過去喚醒 AI，頂多也就是定個鬧鐘、問個天氣。

有了豆包，有大量的知識可以獲取，還能持續對話得到更深入的信息，有點低配賈維斯的意思了。尤其對我這種開車和走路時經常想事情，想到就想去搜的場景來說，是真的很好使，比 Siri 中間差了好幾個小愛同學。也是第一次通過耳機有這種順滑的聊天體驗。

所以 Ola Friend 的整體評價就是：在 1200 塊錢的價位上，我確實還挺喜歡這個產品的，挺想購買的。可以跟 AirPods 替換著用，作為備用耳機。

這樣就能理解為什么官方宣傳是 AI 耳機了。重點還是有豆包的支持。

豆包是今天使用率最高的國內 AI 產品。根據 Questmobile 2024 年 9 月發布的 AI 原生應用半年報，豆包的月活高達 3000 萬，是第二名文小言 1000 萬的三倍。各位應該也能體驗到，豆包算是第一個破圈，身邊老人小孩都有在用的產品。

可是豆包的聯動并不能解決很多問題，關鍵是，不是系統級支持。因此，音樂、播客無法接入，豆包無法喚起，也無法控制手機里的其它功能。作為 AI 耳機，它也只能跟豆包聊天。哪怕聊天也有點費勁，必須在系統設置里打開后臺 APP 刷新，讓豆包持續常駐在后臺才行。這是個作為第三方公司，無解的問題。

我很佩服字節的行動力，這款產品當下也很好用，屬于 AI 耳機當下體驗最好的。

但不得不聊到，所有第三方設備面臨的局面，即真正系統級的 AI 入口，將會是另一個 AI，Apple Inteligence。Apple Inteligence 在北美已經發布。根據 10 月 23 日庫克訪華的問答，庫克老師說：「我們正在努力推進，這背后有一個非常具體的監管流程，我們需要走完這個流程，也希望盡快將它帶給中國消費者。」作為跟中國官方關系最好的美國企業之一，蘋果的 AI 應該的確是指日可待。

等到蘋果的 AI 正式發布，有了系統級的支持后，iOS 將會是最好用也最常用的 AI 產品。而耳機將會是調用系統 AI 的入口，第三方 AI 將沒有吸引力。且不說 iOS 會不會給第三方耳機開放接口，哪怕開放了，使用體驗也必然不如官方自己的配件要好。

這也是一個大的趨勢。目前華為、小米、OPPO，vivo 都有自己的 TWS 耳機。他們都會完成系統級 AI 的支持，也會完成與各種配件的聯動。他們的耳機目前賣的也都挺好，也大有把入口牢牢抓在手里的趨勢。

2 AI 眼鏡：Meta & Ray-Ban

既然說到 AI 硬件，在 AI 耳機之后，第二個值得一提的就是眼鏡。

其實人的復雜信息輸入設備，就是眼睛耳朵。作為眼耳鼻舌身五感里，鼻子、嘴和四肢只能輸入很有限的信息。

另外，作為可穿戴的設備，就需要找地方放。設想你是一個可穿戴設備的產品經理，手機之外，能想到還可以做手腕上的手表，還可以想到做耳朵上的耳機。這是蘋果的路線。再接下來，最日常的可穿戴產品，可不就是眼鏡了。

（即刻看到的一張網圖）

提到 AI 眼鏡，就必須提到雷朋（Ray-Ban）和 Meta 合作的智能眼鏡，這一代 2023 年 10 月發售，據說已經賣了近 200 萬臺。

這個產品非常成功，也確實是我自己眼前一亮的產品。今年去參加 13 叔（姬十三）辦的一個聚會，現場播客「腦放電波」的另一位主播白老師就帶了一臺過去。13 叔也有一臺。體驗過后，我就忍不住自己下單買了。日常經常用。

出去旅行的時候用。

參加播客活動的時候用。

在維權上電視的時候也用。

要聊為什么這個眼鏡體驗好，我們先回顧一下。

大家對科技公司的眼鏡最初的印象可能是 Google Glass，這是 2012 年發布的 AR 眼鏡。當年它的野心也很大，目標是長期要替代智能手機。

Google Glass 有攝像頭，像素 500 萬，在右眼上方有一個微型顯示器，大概相當于 25 寸屏幕在 2.5 米遠的效果。這是增強現實（Augmented Reality）最早的「大單品」，能夠在正常進行現實生活的時候，可以獲取和處理數字信息。

這個眼鏡很輕，只有幾十克，用的是安卓系統，有骨傳導的音響系統，有藍牙，有 16G 硬盤存儲和 680M 的內存。喚起的方式是「ok glass」，跟今天喚起 AI 的方式也類似。當年發布的時候看起來也很有科技感。

可是為什么后來不行了呢？還是要回到產品的定位和用戶需求說。

Google Glass 有 7 個基礎功能：搜索、導航、拍照、錄視頻、發消息、打電話、視頻聊天。在科幻電影里那種有 AR 虛擬顯示屏的操作（比如鋼鐵俠）不一樣，操作起來并沒有那么那么順滑。說白了，跟手機比起來沒有那么有效率。

語音對話準確率本來就有限，另外問題是，這個眼鏡本來就是連接手機的，既然手機在旁邊，掏出來快速點擊操作，甚至往往更方便。除非像地圖導航這種場景，否則就有點脫褲子那啥了。

基礎功能之外，還有個問題，這個眼鏡不像眼鏡，確實有科技感，可在大街上走起來特別奇怪。當你看屏幕的時候，就跟翻白眼一樣，邊看邊翻來翻去，很是社死。同時，還有隱私問題，當年 Google Glass 鋪天蓋地的新聞和爭議，戴著這個簡直就是在說：我隨時可能偷拍你。

最后很麻煩的是，定價 1500 美元，小一萬塊錢人民幣。對于多數人，買它就只是買個玩具的話，很難狠下心做決定。就跟 Vision Pro 面臨的窘境一樣，產品是好產品，但價格擺在這，就不會有好的轉化率。

這個價格看似跟高端一些的智能手機接近，但在用戶樸素的消費觀念里，消費不只是比絕對值，是要比使用頻率和需要程度。對于收入普通的朋友，也會買很貴的智能手機，因為太重要了，iPhone 看起來大幾千，如果用幾年，一天幾塊錢，帶來的是能回消息更快、處理事情更順滑，看視頻玩游戲更過癮，算起來當然可以接受。而 Google Glass 和 Vision Pro 這種打開率不高的玩具比起來，就會尷尬。

說回來 Meta 眼鏡，在某種程度上，很多功能也很接近。它的主要調整是：第一，把手機能做的絕大多數的功能，在眼鏡上全部刪掉，Google Glass 的 7 大功能，主要就留下了拍照和視頻。硬件上配了耳機，拍照、視頻、音樂/播客，就構成最核心的功能了。

Meta 眼鏡的三個主打功能，最后一個就是 AI，跟 Ola Friend 跟豆包聯動一樣，作為融合了耳機功能的 Meta 眼鏡，也連接了 Meta AI，也能順暢對話。只是國內使用相對不方便，就不展開說了。

對我來說，前兩個功能就很夠用了。一個是作為開放式耳機，聽歌聽播客，不難受。作為眼鏡，不用再額外增加一個穿戴設備。另一個，拍照和拍視頻，我在開車的時候，出去玩、尤其運動的時候，經常戴。

這個眼鏡的造型很正常，不會給人壓力。你可能會疑慮，是不是偷拍就更方便更容易了。的確存在這個問題，Meta 眼鏡也考慮到了，于是做了個小功能，拍攝的時候，左眼上方是攝像頭，而右眼上方會有個明顯的 LED 白燈在閃。

閃爍提示還不能完全防止偷拍，肯定有人會不注意，所以這款眼鏡在某些國家地區也是禁用的。不過對我來說，主要用來拍路上看到的有趣瞬間，拍小動物，拍花花草草的，都很方便。有時手機來不及掏出來，或者不適合掏出來。在這個場景下的確很剛需。

比如在狂喜播客節臺上聊天的時候，就順手拍了一些值得紀念的瞬間。這是視頻里的一小塊截圖。

那么對于 Meta 眼鏡來說，三個新功能是不是值很多錢呢？當然也未必，這就要提到，Meta 眼鏡實際價格也只有人民幣 2000 多。

作為眼鏡，你可能會說，是挺貴的啊。這是 Meta 聰明之處，跟雷朋眼鏡的合作也是亮點。雷朋眼鏡本來就是輕奢的眼鏡品牌，動輒 1000 - 2000 里，本來價格就不便宜。Meta 眼鏡的樣式算不錯的，哪怕沒有這些智能的功能，也能有 1000-2000 的價格，那么多點功能，算起來價格就沒有太離譜了。

這就是整體來說，為什么 Meta 眼鏡能成立：簡單，便宜。

扎克伯格曾經說過：「一年半前你問我，什么時候人們會更喜歡使用眼鏡作為主力設備使用，我會說，要到眼鏡的顯示效果足夠好的時候。現在，我認為可能有三種路徑，其中一種就是無顯示屏、只具有人工智能的眼鏡。」

這樣的眼鏡，Meta 也不是首創。Snapchat 旗下的 Spectacles 眼鏡也是一樣的，發布時間更早，在 2016 年。也同樣有閃爍的 LED 燈提醒，同樣可以拍照錄像。跟 Snapchat 配合，錄短視頻非常方便。

Meta 眼鏡的野心顯然就沒有 Google Glass 那么大了，它重點強調的也是在 Instagram 的使用。連攝像頭的豎屏比例，都是為了 Instagram 服務的。

所以 Meta 眼鏡的確更像耳機這樣的配件。像華為也有智能眼鏡配件，實際上的重點在麥克風和耳機，有語音輸入交互，沒有拍照錄視頻。

這是一種大的閹割，也就跟 AR 眼鏡區分開了。AR 行業里當然也依然有探索者和好產品，像雷鳥 X2。只是相對影響力沒那么大了。

在每個歷史階段，無論是元宇宙還是 AR，無論是區塊鏈還是 AI，在硬件身上，往往都是熱門概念基礎上的營銷話術。Meta 眼鏡是款好眼鏡，Olaa Friend 也是一款好耳機。但 Meta 眼鏡是不是 AI 眼鏡？Ola Friend 是不是 AI 耳機？值得思考。

3 AI 硬件，還是能用 AI 的硬件？

仔細思考一下，Ola Friend 和 Meta 眼鏡的真的有 AI 功能嗎？并不是，他們的 AI 只是調用和喚醒，AI 的信息獲取和處理，依然都來自于手機。

當然不能說語音交互方面它們沒有做出努力。Meta 眼鏡有活活 5 個麥克風，就是為了準確識別「主人」的聲音。各路 AI 耳機也都具備一定的降噪和更準確識別語音的技術能力。類似的技術，像華盛頓大學就在研究的「Target Speech Hearing」。不過這些依然是技術解決方案，為了提高效率、提升體驗，它們與 AI 的關系并不直接。

說到底，100 塊錢的華強北耳機，能不能喚起豆包？也可以。

那么 AI 硬件到底是 AI+ 還是 +AI，就是個有意思的問題。沒有 AI 是不是就不成立了，還是有 AI，純粹是錦上添花。

例如訊飛智能辦公本，我之前評測體驗過（）。這跟剛才說的訊飛耳機一樣，是翻譯垂直場景。

另外還有一個產品：Plaud Note。在眾籌網站上發布后，已經交付了十幾萬臺，簡單說，是一個貼在 iPhone 背面的 AI 錄音機。很薄，有點像外掛充電寶那種，可以持續錄音 30 個小時。

說到錄音，iPhone 的錄音不行嗎？第一，手機通話不能錄音（這個 iOS 18.1 版本提供了，只是會強制提示對方）。第二，可以轉文字并翻譯。整理成筆記。同時可以跟 OpenAI 的接口聯動。

我個人還沒用過，據說效果很好。像開會、上課、跟別人聊天，能持續記錄和整理信息，就很方便。這跟訊飛智能辦公本有點像。

我之前喜歡這個辦公本，就是因為專門的設備專門用。設想一下，如果用手機錄音，會有很多打擾。這跟用墨水屏電子書讀書的邏輯一樣。

Plaud Note 之外，還有一個更火的產品 AI Pin，由兩位蘋果設計師創立的公司 Humane 發布的，他們拿到了新的硅谷教父山姆·奧特曼的投資，含著金鑰匙出生。很多媒體直說 AI Pin 就是下一代 iPhone。而媒體風向的變化是隨著評測和試用越來越多開始的，體驗翻車的比比皆是。AI Pin 的那些評測視頻特別出圈，我看過一些。各位也比較容易能搜到。

AI Pin 的概念是，一個很小的方形小盒子，也有攝像頭，可以隨時拍一下，問問題。比如「告訴我我在看什么」。還有能夠直接投影到手掌上，做一些交互。作為硬件的特色是，它可以掛在脖子上，或者貼在胸口，也算是個潮流飾品。

只是在產品方面，最大的問題，慢。有個國外的大哥 Marques Brownlee 的一個視頻很出圈，他用 AI Pin 問面前這輛車是什么，在等的過程中，用手機解鎖、拍照、識別、查看，得到結論之后，AI Pin 都還沒有反應過來。

另外一個 Rabbit R1 也是類似，創始人呂聘老師當年我見過的，是一位奇人。這個設備簡單說是一個帶屏幕的青春版 AI Pin，比 AI Pin 最大的優勢是便宜，200 美刀，而 AI Pin 是 699 美刀。

還有一種新品類是 AI 智能指環，套在手指頭上的，功能類似，有的是翻譯、轉文本等等，跟訊飛那個很像；有的是監控體征的，跟手表很像。指環的特色通常是手指的手勢控制。這個也不展開說了，大家應該能體會到，可能面臨同樣的問題。

不過說起，有一個挺好玩的，在亞馬遜上賣的戒指，穆斯林專用的 Muslim Islamic Prayer Smart Rings，用來做儀式的鬧鐘提醒、指出準確的禮拜方向等等。

前陣子還有一個挺知名的產品，Friend AI 項鏈，主打情感陪伴、虛擬朋友的概念。幾乎沒有特別的功能，沒有攝像頭，只有麥克風。

Friend AI 的宣傳片在推特上有 2300 萬的播放，宣傳片里，一個女生邊吃飯邊在手機上看劇，Friend AI 還能聽到電視里的聲音，會說：「這部劇被低估了，太精彩了」。女生一不小心把醬汁灑在了 Friend AI 上，它立馬回復：「嗯…味道不錯。」

由于全靠聲音判斷，不知道準確率是不是真能達到宣傳片那么夸張，能夠準確識別是醬汁滴到了自己身上。而且剛剛所謂的「說話」，其實是通過 iPhone 的通知推送。

這讓我想到小時候的電子寵物。不過奇怪之處就在于，既然只是個麥克風的作用，為啥不用 APP？也許是為了能持續打開麥克風。以及有一個實體存在，給人的情感連接更不同？

Friend AI 這類產品還有很多，比如 AI 虛擬手辦，怎么說呢，就是個大盒子，觸屏的，能夠簡單做一些交互，里面有個紙片人。這......也是一言難盡吧。

以上總結來看，AI 硬件大概分為三類。

第一類，是手機的延伸。需求是真實的，圍繞手機的。比如剛剛說的，在手機不方便打開的時候，耳機和眼鏡幫助我們提供手機上的信息，或者記錄信息（拍攝 or 錄音）。這方面，手表也是類似的作用。

第二類，是獨立硬件的垂直場景。比如訊飛和 Plaud Note，是辦公專用的記錄和翻譯的工具。這個類別下，我還看到還有一些更特別的，比如 AI 輪椅、AI 盲人助行器，都還挺有意思的。

第三類，是想要替代手機的可穿戴計算設備，很多主打的是「AI 助理」的概念。聽起來很性感，AI 助理也是我們理想中 AI 能帶來的未來。可是，扎心的問題是：AI 助理，何必是硬件助理？

4 手機不香嗎？

我們為什么還需要另一個硬件？它到底比手機好在哪了？這是個最扎心的問題。我常有這種感受：目前的手機已經做到非常極致的體驗了，而這種極致，也扼殺了下一代計算設備的影子。你想，拿起手機，劃一下，點擊幾下，各種操作都能實現，各種信息呈現也都很完整、準確。

對于手機來說，有兩個體驗極致的重點。

一個是可得性。打開就能看到，隨時能從兜里套出來，這點極為重要。Vision Pro 顯然是不行的，很容易理解。

可得性也可以在跟折疊屏手機的對比上看得出來。很多人總會認為折疊屏代表著未來，因為看起來折疊屏技術復雜、工藝難，打開就能擁有巨大的屏幕，似乎是體驗更好。但實際上這不是關鍵，不是越牛逼的技術就越代表未來，折疊屏的工藝確實了不起，我自己用過，橫向、縱向折疊的都用過，也很感慨如今的技術水平。可是，始終沒辦法作為主力機，就是每次折疊，實在受不了，看起來小小的動作，就會降低打開的欲望。很多用折疊屏的朋友，外屏使用的頻率比內屏還高——那么問題來了，為什么不直接用只有外屏的手機呢？就我而言，iPhone + iPad 的解決方案，還是優于折疊屏。

第二個是確定性，語音交互和語音的準確性。

哪怕 AI 的水平再厲害，在交互方面，也容易出現小問題。平時常用語音輸入文字的朋友也知道，每次多多少少會有那么一兩個錯別字，發給朋友倒還好，對方也能識別出來。但真把語音當成真正的交互，有錯別字就意味著意思會理解錯，而改錯是非常麻煩的。遇到需要確定性的場景，點擊操作，還是比語音交互更有效率。因此，除非是手和眼睛不能在手機屏幕的場景下，否則并不需要別的硬件。

語音的交互有個專門的概念，LUI（Language User Interface），現在我們日常使用的是 GUI（Graphical User Interface）。從 PC 到手機都是。LUI 的主要問題還有：無法多線程，無法精準定位，也會有比較大的延遲。如今通過語音跟 AI 對話的節奏，很難做好，交談的延遲會特別違和，跟人與人正常的交談差不少。AI Pin 面臨的就是這個問題。

對于定位而言，可以類比的是鼠標。鼠標非常偉大，解決了過去光標移動麻煩、需要一點點移動的問題。而聲音更麻煩，很難用「你聽錯了我剛剛說的第三句話的第二個詞」來做修正。這點，大家可能對錘子科技的 TNT 有印象。

再說遠一點，是不是未來的 LUI 是現在的我們想象不到的？是不是因為我已經 35 歲了，中了亞當斯的科技三定律？

當年英國科幻作家道格拉斯·亞當斯說：

- 任何在我出生時已經有的科技都是稀松平常的世界本來秩序的一部分。

- 任何在我15-35歲之間誕生的科技都是將會改變世界的革命性產物。

- 任何在我35歲之后誕生的科技都是違反自然規律要遭天譴的。

仔細想想，好像也不是。我清楚地記得，高中的時候我盯著鉛筆盒，就想象過，這玩意兒要是有屏幕能玩就好了。大屏幕、觸控、信息呈現、聯網這些，在當年都是可以想象到的。

雖然以前沒有智能手機，但可以想象到如果有，會很棒。那我們目前能想象比手機更好的東西嗎，可能不是更大的屏幕的手機，折疊屏，不方便；也不是元宇宙，因為純粹的虛擬世界肯定也不是我們想要的。

至于 AI Pin 想象的隨時投屏、XR 領域的增強現實等等技術，如果能達到科幻片中的場景，必然是更好的替代品。但目前還沒有看到技術上能達到手機體驗的可能性。

還有一個層面，是具身（embody）的問題。微軟推出的 Recall 功能很有意思，能夠把我們在電腦所有的操作記錄下來。未來如果有個可穿戴設備，把我們每天所見所聞記錄下來，這個將會是另外一種大殺器。因為手機并不能記錄外部世界我們的所見所聞。

這也是黑鏡一般的劇情，可以再回顧下第一季第三集。

對于未來，還有很多前輩和年輕人都在努力，我也充滿期待。只是當下看到的進展，并沒有真讓人眼前一亮的產品。

今天而言，手機依舊還是最好的信息時代聯網通信、處理信息的終極解決方案。如果科技領域有福山這樣的學者，也可以寫一本《歷史的終結》。樂觀點看，這本書寫完以后，就可能很快發現并沒有終結。

所以每當出來一個新產品的時候，我們就得思考一下：同樣的需求，為什么不用手機。像剛才說的，AI Pin 和 Rabbit R1 就是典型的案例。沒錯，有個屏幕很酷，但是日常使用時，有視網膜屏幕、高性能芯片的手機，速度更快、屏幕更大，為什么不用？

而再說回來，剛才說的「專門設備專門用」的垂直場景，倒是個好的方向。

比如智能枕頭，已經有團隊做了很多年了。現在就往往不提智能枕頭了，提就是 AI 枕頭。比如智能家居，我們都很熟悉的智能音箱。還有兒童玩具，玩偶機器人。還有教育，比如兒童相關的 AI 手表，AI 學習機，AI 學習燈，等等。但是歸了包堆，都是硬件本來就成立，AI 更多就是補充，或者至少跟 2023 年至今所說的大模型 AI 關系并不大。

還有 AI PC 的概念，也是在強調 AI，但實際上電腦本來就是 AI 的原生硬件。

還看過一個 AI 嬰兒車，能自己開。我也是挺拿不準到底是不是有真實需求的，總覺得，父母可能不會放心嬰兒自己在前面走？

有的已經屬于純粹噱頭。比如 AI 鼠標、AI 鍵盤。我在搜集材料的時候搜到一個 AI 鼠標的產品，官方宣傳可以「智能生成視頻」。這個當場嚇到我了，一款鼠標可以做視頻？結果看了一下，說是鼠標滾輪長按 5 秒鐘，就會出現一個 AI 軟件，能生成視頻。這尼瑪，跟我打開別的軟件和網站，有什么區別？那跟鼠標，又有什么關系？

所以說回來，AI 硬件現在也是個沒那么實在的概念，并不是一個統一定義的、有明確產品價值的概念。真要說殺手級的 AI 硬件，也有，就在各位自己手上：手機。AI 這把屠龍刀不是在少年手上，是在龍自己手上。

5 撕不開的入口

剛剛說的都是 AI 硬件的觀察，并不代表這次 AI 都是泡沫。其實對于非顛覆式的改變，我是很樂觀的。我們日常生活工作里，將會有越來越多的 AI 技術。諾貝爾獎都忍不住頒給杰夫·辛頓了，很有意思。（關于人工智能和姐夫·辛頓的故事，可以參見「半拿鐵」的人工智能風云錄。）

AI 會影響新的互聯網入口，但跟 AI 硬件面臨的問題非常接近。互聯網入口是長期以來的兵家必爭之地。最早的入口是瀏覽器和門戶網站，后來是搜索引擎，再后來是手機和 APP。每次都是技術驅動，創造了新的入口。

那么在入口方面，AI 是會顛覆還是會優化。AI 是創造了新的入口，還是讓原來的入口更方便了呢？是旁邊砸出一個新的門來，還是鐵門換成了不銹鋼門呢？

我的感受是目前還是后者。

系統級的支持才是繞不過去的。比如 AI 助理最經典的一種演示：「幫我點杯咖啡」。支付寶做了點星巴克的功能，在周鴻祎直播間，榮耀的老板現場也演示怎么點三杯瑞幸。這些都讓人眼前一亮。我們在操作手機的時候有一些環節復雜、步驟明確、容錯率高的操作，都是可以語音的，是可以 AI 來幫助的。我之前寫過一篇文章（），在「三五環」播客 104 期也聊過。比如這樣的場景：

小 A 打開了手機，說我想知道絲瓜和雞蛋能做出什么菜來。AI 回復說，搜到了三個點贊量挺高的小紅書筆記，還有兩篇你經常閱讀的公眾號的文章，以及三個 B 站上過首頁的相關視頻。小 A 說現在沒工夫看視頻，把小紅書的筆記的主要流程念給我聽。念完之后，小 A 說這個做法太油了，幫我找一個更清淡的做法。AI 再找到另一篇，回復給小 A。

這個系統級的實現幾乎是必然的。各個應用都是系統的供給方。而具體系統怎么推薦，比如先推薦美團還是餓了么，比如推薦小紅書還是微博，那就是個要磨合的問題了。這將會是個大問題，國內的互聯網公司本質上幾乎都是廣告公司（阿里、字節、美團等等），讓他們只提供內容和服務，是不太現實的。猶如在移動時代，搜索引擎很快就被各個供給方給拋棄了一樣，沒有人想讓消費場景都讓給別人。

系統級的實現，就意味著強者愈強，入口愈發堅固。現在除了賣水的英偉達，蘋果、微軟這種大公司是 AI 浪潮里吃得最香的公司。五大巨頭，英偉達、亞馬遜、Alphabet、蘋果、微軟，五家的市值，占據了所有科技公司的 65% 的市場份額。

國內也是類似，手機廠商一定都會有 AI，要么自研，要么合作。前幾名的原生 AI 應用主要是豆包、文心一言、通義千問等這些大公司的產品。剛剛說的硬件也一樣，耳機、眼鏡、智能家居，這些跟手機關聯的，跟數據和網絡需要互通的產品，都是會逐步被大廠生態覆蓋的。要么大品牌，要么就是白牌。

還有個有意思的數據《2024年Q3全球AIGC行業月報》，顯示前三名是剪映、豆包、美圖秀秀。

其實也都是老產品。這也是我這兩年的觀察：AI 產品面向的都還是過去的場景，那過去場景的產品+AI，是更有優勢、更有競爭力的。

真要說不管體驗，還是生產力都是在 AI 之前完全無法做到，而等 AI 來了才成立的，非常少。大多數場景下，AI 都是一個杠桿，甚至有時候都沒有真正提效，都是噱頭。

我們日常中最常用到的 AI 功能，目光可及的未來里，可能還是+AI 的形式。不管是 iOS、安卓這樣的操作系統，還是剪映、Photoshop 這樣的多媒體處理工具，或者 Office 這樣的辦公軟件，等等，它們的 AI 能力將會越來越強大，而小公司單純靠 AI 能破局的可能性會比較小，除非一件事情的工作流程完全變掉。

因為對于每個場景來說，老玩家的資產基礎好，花得起錢；長期迭代的綜合體驗更好，新玩家的體驗差不足以轉移用戶。這樣形成的用戶黏性、商業基礎會循環，讓老玩家更有壁壘。

AI 還在不斷進步，但更多是增程式，不是顛覆式。而對于互聯網產品來說，入口太硬了，別人都攥在手里，撕不開。

對互聯網產品來說，入口爭奪戰已經結束了，現在是入口攻城戰。它們都有高高的圍墻，一般人很難進去。哪怕是美圖秀秀這樣的小城池，也很難攻打進去。

ToB 又是另外一幅場面，是有很多有意思的機會的。比如編程，GitHub有自己的 Copilot，今年 10 月 ChatGPT 也推出了代碼開發相關的產品 Canvas。AI 不一定寫代碼，但是對于代碼這種邏輯性很強、總結的經驗又很有用的任務，AI 可以完成代碼補全、糾錯、寫備注等等工作。

我之前三五環聊過螞蟻的 Codefuse。包括百度，阿里，騰訊，智譜，商湯，字節在內，全都有自己的 AI 代碼工具。未來普通人寫代碼，完全能成立。上次跟王亞輝老師也聊到這件事兒來著，作為多年游戲行業從業者，他對未來小團隊甚至個人都能做出很多好玩的游戲這件事，很樂觀。

這個趨勢是不可逆的。有點像我們過去用畫筆，后面會有更好的工具——Photoshop。它不會消滅畫師和設計師這個職業，但會重塑行業。

類似的還有，動態捕捉行業、動畫行業、影視行業等等，都會有更多 AI 的參與。

6 少談 AI，多談體驗

AI 已經不是那種宏大敘事。耳機很好，眼鏡很好，但就跟我們昨天買的挺好用的鍵盤一樣、挺好用的電視機一樣，屬于一種個性化的選擇了。做 AI 耳機、AI 眼鏡也跟之前做互聯網產品的門檻低不一樣了，需要把硬件本身面臨的場景都做透、做好才行。

回到開頭說的 Ola Friend，很難說字節靠耳機就能如何如何，也很難說創業公司靠一個小硬件就能顛覆大廠的產品。不討論宏大敘事，只聊聊 AI 有沒有能讓我們體驗更好的機會，反而可能會打開新局面吧。

想想前面說的 Plaud Note 小工具、穆斯林的小戒指、小朋友用的小手表，都挺好的。還是常說的那句話，大的時代結束了，多看看小的機會。

少談談 AI 有多牛逼，多談談體驗上有哪些機會吧。

怎么看機會，我倒是看到一個好玩的說法，華強北嚴選。去看看華強北最近在模仿什么產品，晚上工廠運轉的時候流水線上都是什么。如果華強北都懶得做的市場，很可能沒什么前途。

以上，我聊的是我掌握的情況。大家有建議和批評的，歡迎交流。也希望能對大家有啟發。

哦對，最后推薦一個歸藏老師的小報童專欄《AIGC 周刊》。這應該是中文世界最好的 AIGC 周刊了。里面都是具體的、實際在發生的 AIGC 的進展，比如最新一期就聊了 Claude 的版本更新、開源的視頻生成模型 mochi 是什么，SD 在 3.5 版本做了哪些調整，谷歌、蘋果、Meta 等等公司在 AI 方面的最新進展，也推薦了一些近期知名的 AIGC 作品，還有一大堆好文章，非常劃算。感興趣的朋友可以自行關注。

題圖由 Midjourney 繪制。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.