閱讀本文大概需要 1.14 分鐘
凌晨 OpenAI 在線直播發布會,推出了一個并不算完全全新的模型:GPT-4o,但看到它的演示效果,著實還是被驚到了。
要知道,原本的 GPT-4 已經很牛了,可以分析圖像和文本,甚至能從圖像中提取文本和描述圖像內容。但這次,GPT-4o 給它加上了語音功能。
要知道,之前的 ChatGPT 也有過語音版,但問題多多,比如你不能打斷它,聲音聽起來像是個沒吃飽的機器人,完全么得感情,體驗上就很一般,大家還是能直觀感受到機器跟人的區別。
但這次發布的這版 GPT-4o 就更「聰明」了,基于 GPT-4 的多模態能力,變成了一個真正的語音交互助手。
實話說,它的實時語音對話效果太驚艷了,沒有任何停頓處理的間隔,語氣和語調都更像人類。這就像你在和一個特別健談的朋友聊天,不需要等它完全說完你才能接著說,而是你可以隨時打斷它。還能讓它用各種語音語調調整說話的情緒。不僅能說,還能唱歌,這種真實感到什么程度呢?
就是當你看到直播演示里,演示那哥們熄屏中斷 ChatGPT 時,讓人忍不住感到這種打斷是對「她」的不禮貌,你會忍不住想說「能不能別老打斷她說話」?這種情感上的共鳴距離電影《Her》中的 Samantha 又近了一步。可以想象,情感陪伴行業又要熱鬧起來了。
另外,讓人印象深刻的,還有實時翻譯這塊,雖然很多人覺得現在翻譯軟件什么的都很多了,但當你看到它演示實時翻譯的時候,你依舊會被驚訝到,那叫一個絲滑,這下出國是真不用愁語言溝通問題了。
除此之外,GPT-4o 還提高了 ChatGPT 的視覺能力。通過攝像頭實時觀察真實世界和屏幕內容,GPT-4o 不僅能「看到」,還能「理解」。你可以讓它讀取電腦屏幕上的代碼,它能直接理解并操作,發送圖片給它,也能迅速得到反饋和相應的描述。
直播過程還演示了做題的,要是小孩做題不懂的,還可以把數學計算式作為視頻投給 ChatGPT,和實時語音一起使用,同 ChatGPT 討論數學問題。坦白說我覺得家長能適當帶小孩嘗試使用這些功能,其實還挺有意思的。
之前有朋友就給家里小孩嘗試使用,結果發現跟 ChatGPT 交流起來十分順暢,,甚至還激發了更多的疑問和思考。相比于盯著學校那幾本枯燥的課本,和 ChatGPT 一起「玩」更有趣,更能讓小孩產生更多好奇。
尤其現在 GPT-4o 提供的語音+視頻功能,其實是更便于更多人體驗適應的,畢竟,會打字的人總是少于會說話的人嘛。
這次更讓人驚訝的是,GPT-4o 模型免費給注冊用戶,如果你現在用的是 GPT-3.5 免費版,那你可以直接體驗到有限的 GPT-4o 模型的。另外 GPT-4o API 速度是原版的兩倍,但價格卻便宜一半,并且具有更高的速率限制,這對開發者來說也很友好了。
最后,盡管有不少人覺得這次發布會聊勝于無,沒有超出預期,可能因為 AI 更新迭代的速度太快,大家都在期待 ChatGPT-5 這樣的重大更新。但我認為,GPT-4o 的推出實際上具有更深遠的意義。
技術可以不斷更新迭代,但讓 AI 真正融入人們的生活,關鍵在于它在情感上更接近人類,加強應用和人性化能力。語音+視頻呈現的實時交互效果,正是邁向這一目標的重要一步。更重要的是,這次更新降低了用戶的使用成本,讓更多人能夠體驗和適應這些新功能。
有時候慢下來,反而是快,真正的突破不在于技術本身的飛躍,而在于技術如何更貼近生活,讓更多人受益。這種「進步」的深刻性和影響力,不亞于直接推出一個 ChatGPT-5。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.