作者丨歐雪
編輯丨袁斯來
過去兩年,主流AI交互依賴于輸入框——用戶先組織語(yǔ)言提問,AI再給出答案。
這種“對(duì)話式”交互效率極高,卻與人類最自然的認(rèn)知路徑相悖。我們認(rèn)識(shí)世界,從來不是從“提問”開始,而是從“看見”開始。
一家成立于2025年的年輕公司Chance AI,正在嘗試解決這個(gè)問題。它提出了另一種AI產(chǎn)品形態(tài)——Visual Agent(視覺智能體),試圖讓AI從“回答問題”的工具,進(jìn)化為“看懂世界”的系統(tǒng)。
Chance AI的創(chuàng)始人曾熙,路徑橫跨學(xué)術(shù)與產(chǎn)業(yè)。他在巴塞羅那大學(xué)獲得博士學(xué)位,研究方向是認(rèn)知科學(xué)與當(dāng)代藝術(shù),關(guān)注人類如何通過視覺理解世界。畢業(yè)后進(jìn)入消費(fèi)電子行業(yè),在OnePlus、OPPO負(fù)責(zé)產(chǎn)品與設(shè)計(jì),隨后加入字節(jié)跳動(dòng),在Flow部門參與豆包等AI產(chǎn)品從0到1的探索。
之前的從業(yè)經(jīng)歷讓他意識(shí)到一個(gè)結(jié)構(gòu)性問題:大語(yǔ)言模型擅長(zhǎng)“生成語(yǔ)言”和“回答問題”,但對(duì)于人類如何在現(xiàn)實(shí)世界中基于視覺形成判斷,AI提供的支持仍非常不足。
2025年1月他從字節(jié)離開,3月注冊(cè)公司,7月正式運(yùn)營(yíng),9月上線首款產(chǎn)品Chance AI。
Chance AI以攝像頭為核心交互入口,用戶打開即可拍攝眼前事物,AI實(shí)時(shí)進(jìn)行視覺推理。
在實(shí)際使用中,它被廣泛用于逛展時(shí)解讀藝術(shù)品、購(gòu)物時(shí)分析穿搭、識(shí)別卡牌與潮玩版本、檢測(cè)皮膚狀態(tài),以及拍菜單、識(shí)植物、看寵物等日常探索。曾熙向硬氪透露,目前大部分使用場(chǎng)景由用戶自發(fā)挖掘,而非團(tuán)隊(duì)預(yù)設(shè)。
![]()
Chance AI被用于逛展時(shí)解讀藝術(shù)品(圖源/企業(yè))
從技術(shù)來看,其Visual Agent在衡量多模態(tài)模型視覺推理能力的權(quán)威基準(zhǔn)MMMU-Pro評(píng)測(cè)中取得86.07分,位居世界第一。
今年3月,Chance AI成為Art Central官方AI合作伙伴,這是AI首次進(jìn)入國(guó)際大型藝術(shù)展會(huì)的“觀看過程”。在現(xiàn)場(chǎng),觀眾用攝像頭對(duì)準(zhǔn)藝術(shù)品,AI會(huì)實(shí)時(shí)參與觀看,一邊看一邊交流。
![]()
AI首次進(jìn)入全球大型藝術(shù)展會(huì)的“觀看過程”(圖源/企業(yè))
支撐這一體驗(yàn)的是其剛推出的“Live模式”——實(shí)時(shí)視覺交互系統(tǒng)。與行業(yè)中已有的實(shí)時(shí)識(shí)別不同,其Live模式可以在實(shí)時(shí)視覺場(chǎng)景中,將知識(shí)檢索、內(nèi)容對(duì)比、上下文理解、多能力調(diào)度等多種視覺智能能力整合為一個(gè)完整的、具備實(shí)時(shí)響應(yīng)能力的智能體。
![]()
Chance AI上線的Live模式使用場(chǎng)景(圖源/企業(yè))
截至目前,Chance AI全球總下載量超過20萬,月活躍用戶在4-6萬之間。
曾熙透露,公司目前幾乎沒有進(jìn)行市場(chǎng)投放,所有增長(zhǎng)均來自自然傳播,其核心用戶是25歲以下的年輕人。
談及未來規(guī)劃,曾熙表示,2026年最重要的目標(biāo)是在北美學(xué)生群體中進(jìn)行更大規(guī)模的擴(kuò)張。但這不是傳統(tǒng)意義上的市場(chǎng)推廣,而是深入用戶社群,挖掘年輕人真實(shí)的使用場(chǎng)景。
與純AI應(yīng)用層創(chuàng)業(yè)者不同,這位擁有硬件大廠背景的連續(xù)創(chuàng)業(yè)者,從一開始就把“軟硬一體”寫進(jìn)了產(chǎn)品路線圖。曾熙認(rèn)為,未來適合他們產(chǎn)品的硬件形態(tài),應(yīng)該是一顆包攬人們所有視覺信息的攝像頭。
我們對(duì)曾熙做了訪談,聊了聊他對(duì)行業(yè)發(fā)展以及技術(shù)路線的看法。
以下是訪談節(jié)選:
硬氪:目前很多AI產(chǎn)品都有視覺能力,Chance AI的差異化優(yōu)勢(shì)在哪里?
曾熙:我認(rèn)為接下來很難有一家獨(dú)大的AI公司了,大家會(huì)分得很開。我們選擇深耕視覺,是因?yàn)榻裉齑蠹疫€沒關(guān)注到,但未來會(huì)是主流。
我們的護(hù)城河不是模型多強(qiáng),而是能多快跟真實(shí)用戶交互。今天我們自己設(shè)計(jì)的功能不到20-30%,剩下都是用戶告訴我們的——拍皮膚、看菜單、識(shí)別卡牌、吐槽……你要做到這些,必須跟用戶離得足夠近。我們?cè)?jīng)在6個(gè)小時(shí)內(nèi)滿足了一個(gè)紐約大學(xué)的潮流文化社團(tuán)的需求,讓他們能識(shí)別特定卡牌。這是Google或OpenAI做不到的。
硬氪:目前APP沒有任何收費(fèi)內(nèi)容,未來的商業(yè)模式怎么走?
曾熙:我們目前有三個(gè)方向。第一,高級(jí)功能訂閱,這是今年的計(jì)劃。我們工程能力比較好,成本做得低,所以沒有迫切的收費(fèi)壓力。第二,硬件授權(quán),我們正在和一些硬件廠商聊,他們投入在硬件很難有時(shí)間打磨模型層之上的產(chǎn)品,這是我們擅長(zhǎng)的。第三,廣告推薦,但會(huì)非常謹(jǐn)慎。對(duì)我們來說,優(yōu)先級(jí)最高的是先養(yǎng)成用戶習(xí)慣——讓用戶看到什么都習(xí)慣性地先拍一拍。如果你成為一個(gè)入口級(jí)的產(chǎn)品,商業(yè)機(jī)會(huì)自然會(huì)出現(xiàn)。
硬氪:你們會(huì)自己做硬件嗎?大概什么時(shí)候?
曾熙:看行業(yè)情況。當(dāng)我們判斷供應(yīng)鏈成熟以后,一定會(huì)奮不顧身地殺進(jìn)去。但更重要的是,我們不會(huì)為了做硬件而做硬件。
我們的本質(zhì)是視覺推理能力,Live模式只是這種能力的一個(gè)展現(xiàn)。我們認(rèn)為未來的隨身AI硬件一定是一個(gè)攝像頭,可以包攬你所有眼睛正在看的東西,然后提供下一步有價(jià)值的行動(dòng)。這是我們跟所有現(xiàn)有產(chǎn)品的本質(zhì)區(qū)別——我們的起點(diǎn)沒有輸入框,起點(diǎn)就是“看”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.