網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

早期項(xiàng)目 | 字節(jié)、OPPO、一加三重背景產(chǎn)品人，將軟硬一體寫入底層，要讓AI看懂世界

2026-04-10 09:09:09　來源: 36氪

北京舉報(bào)

分享至

作者丨歐雪

編輯丨袁斯來

過去兩年，主流AI交互依賴于輸入框——用戶先組織語(yǔ)言提問，AI再給出答案。

這種“對(duì)話式”交互效率極高，卻與人類最自然的認(rèn)知路徑相悖。我們認(rèn)識(shí)世界，從來不是從“提問”開始，而是從“看見”開始。

一家成立于2025年的年輕公司Chance AI，正在嘗試解決這個(gè)問題。它提出了另一種AI產(chǎn)品形態(tài)——Visual Agent（視覺智能體），試圖讓AI從“回答問題”的工具，進(jìn)化為“看懂世界”的系統(tǒng)。

Chance AI的創(chuàng)始人曾熙，路徑橫跨學(xué)術(shù)與產(chǎn)業(yè)。他在巴塞羅那大學(xué)獲得博士學(xué)位，研究方向是認(rèn)知科學(xué)與當(dāng)代藝術(shù)，關(guān)注人類如何通過視覺理解世界。畢業(yè)后進(jìn)入消費(fèi)電子行業(yè)，在OnePlus、OPPO負(fù)責(zé)產(chǎn)品與設(shè)計(jì)，隨后加入字節(jié)跳動(dòng)，在Flow部門參與豆包等AI產(chǎn)品從0到1的探索。

之前的從業(yè)經(jīng)歷讓他意識(shí)到一個(gè)結(jié)構(gòu)性問題：大語(yǔ)言模型擅長(zhǎng)“生成語(yǔ)言”和“回答問題”，但對(duì)于人類如何在現(xiàn)實(shí)世界中基于視覺形成判斷，AI提供的支持仍非常不足。

2025年1月他從字節(jié)離開，3月注冊(cè)公司，7月正式運(yùn)營(yíng)，9月上線首款產(chǎn)品Chance AI。

Chance AI以攝像頭為核心交互入口，用戶打開即可拍攝眼前事物，AI實(shí)時(shí)進(jìn)行視覺推理。

在實(shí)際使用中，它被廣泛用于逛展時(shí)解讀藝術(shù)品、購(gòu)物時(shí)分析穿搭、識(shí)別卡牌與潮玩版本、檢測(cè)皮膚狀態(tài)，以及拍菜單、識(shí)植物、看寵物等日常探索。曾熙向硬氪透露，目前大部分使用場(chǎng)景由用戶自發(fā)挖掘，而非團(tuán)隊(duì)預(yù)設(shè)。

Chance AI被用于逛展時(shí)解讀藝術(shù)品（圖源/企業(yè)）

從技術(shù)來看，其Visual Agent在衡量多模態(tài)模型視覺推理能力的權(quán)威基準(zhǔn)MMMU-Pro評(píng)測(cè)中取得86.07分，位居世界第一。

今年3月，Chance AI成為Art Central官方AI合作伙伴，這是AI首次進(jìn)入國(guó)際大型藝術(shù)展會(huì)的“觀看過程”。在現(xiàn)場(chǎng)，觀眾用攝像頭對(duì)準(zhǔn)藝術(shù)品，AI會(huì)實(shí)時(shí)參與觀看，一邊看一邊交流。

AI首次進(jìn)入全球大型藝術(shù)展會(huì)的“觀看過程”（圖源/企業(yè)）

支撐這一體驗(yàn)的是其剛推出的“Live模式”——實(shí)時(shí)視覺交互系統(tǒng)。與行業(yè)中已有的實(shí)時(shí)識(shí)別不同，其Live模式可以在實(shí)時(shí)視覺場(chǎng)景中，將知識(shí)檢索、內(nèi)容對(duì)比、上下文理解、多能力調(diào)度等多種視覺智能能力整合為一個(gè)完整的、具備實(shí)時(shí)響應(yīng)能力的智能體。

Chance AI上線的Live模式使用場(chǎng)景（圖源/企業(yè)）

截至目前，Chance AI全球總下載量超過20萬，月活躍用戶在4-6萬之間。

曾熙透露，公司目前幾乎沒有進(jìn)行市場(chǎng)投放，所有增長(zhǎng)均來自自然傳播，其核心用戶是25歲以下的年輕人。

談及未來規(guī)劃，曾熙表示，2026年最重要的目標(biāo)是在北美學(xué)生群體中進(jìn)行更大規(guī)模的擴(kuò)張。但這不是傳統(tǒng)意義上的市場(chǎng)推廣，而是深入用戶社群，挖掘年輕人真實(shí)的使用場(chǎng)景。

與純AI應(yīng)用層創(chuàng)業(yè)者不同，這位擁有硬件大廠背景的連續(xù)創(chuàng)業(yè)者，從一開始就把“軟硬一體”寫進(jìn)了產(chǎn)品路線圖。曾熙認(rèn)為，未來適合他們產(chǎn)品的硬件形態(tài)，應(yīng)該是一顆包攬人們所有視覺信息的攝像頭。

我們對(duì)曾熙做了訪談，聊了聊他對(duì)行業(yè)發(fā)展以及技術(shù)路線的看法。

以下是訪談節(jié)選：

硬氪：目前很多AI產(chǎn)品都有視覺能力，Chance AI的差異化優(yōu)勢(shì)在哪里？

曾熙：我認(rèn)為接下來很難有一家獨(dú)大的AI公司了，大家會(huì)分得很開。我們選擇深耕視覺，是因?yàn)榻裉齑蠹疫€沒關(guān)注到，但未來會(huì)是主流。

我們的護(hù)城河不是模型多強(qiáng)，而是能多快跟真實(shí)用戶交互。今天我們自己設(shè)計(jì)的功能不到20-30%，剩下都是用戶告訴我們的——拍皮膚、看菜單、識(shí)別卡牌、吐槽……你要做到這些，必須跟用戶離得足夠近。我們?cè)?jīng)在6個(gè)小時(shí)內(nèi)滿足了一個(gè)紐約大學(xué)的潮流文化社團(tuán)的需求，讓他們能識(shí)別特定卡牌。這是Google或OpenAI做不到的。

硬氪：目前APP沒有任何收費(fèi)內(nèi)容，未來的商業(yè)模式怎么走？

曾熙：我們目前有三個(gè)方向。第一，高級(jí)功能訂閱，這是今年的計(jì)劃。我們工程能力比較好，成本做得低，所以沒有迫切的收費(fèi)壓力。第二，硬件授權(quán)，我們正在和一些硬件廠商聊，他們投入在硬件很難有時(shí)間打磨模型層之上的產(chǎn)品，這是我們擅長(zhǎng)的。第三，廣告推薦，但會(huì)非常謹(jǐn)慎。對(duì)我們來說，優(yōu)先級(jí)最高的是先養(yǎng)成用戶習(xí)慣——讓用戶看到什么都習(xí)慣性地先拍一拍。如果你成為一個(gè)入口級(jí)的產(chǎn)品，商業(yè)機(jī)會(huì)自然會(huì)出現(xiàn)。

硬氪：你們會(huì)自己做硬件嗎？大概什么時(shí)候？

曾熙：看行業(yè)情況。當(dāng)我們判斷供應(yīng)鏈成熟以后，一定會(huì)奮不顧身地殺進(jìn)去。但更重要的是，我們不會(huì)為了做硬件而做硬件。

我們的本質(zhì)是視覺推理能力，Live模式只是這種能力的一個(gè)展現(xiàn)。我們認(rèn)為未來的隨身AI硬件一定是一個(gè)攝像頭，可以包攬你所有眼睛正在看的東西，然后提供下一步有價(jià)值的行動(dòng)。這是我們跟所有現(xiàn)有產(chǎn)品的本質(zhì)區(qū)別——我們的起點(diǎn)沒有輸入框，起點(diǎn)就是“看”。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.