![]()
曾獲 a16z crypto 領投、主打“多模型對比 + 眾包評測”的 AI 平臺 Yupp,已經正式宣布停止服務。
![]()
我們做出了一個艱難的決定:逐步停止 yupp.ai 的服務。 ?
需要了解的信息:
網站將持續開放至 2026 年 4 月 15 日。
在此期間,新用戶注冊和發起新對話功能將關閉,但用戶仍可按照相關說明查看聊天記錄并下載聊天數據。 ?
事情經過:
團隊于去年 6 月上線,目標是打造一個面向 AI 模型評估的雙邊市場:一方面讓用戶使用多個模型,另一方面利用這些真實世界中的使用數據,幫助 AI 實驗室評估模型。
平臺累計吸引了超過 130 萬用戶注冊,也有多家實驗室成為付費客戶;但最終,產品并沒有達到足夠強的產品市場匹配度。 ?
與此同時,行業格局變化得非常快。
模型能力正在迅速增強,用戶的使用方式也在朝著智能體系統演進:模型不再只是獨立聊天機器人,而是與工具、記憶和外部服務相連接。在這樣的新環境下,停留在聊天機器人這一層的眾包模型評估,重要性正變得越來越低。 ?
致社區用戶:
團隊對一起打造出的成果感到自豪。對團隊而言,最有意義的事情之一,就是能夠讓社區免費使用全球頂尖的 AI 模型。大家利用這些能力去學習、創作、分享優秀作品,用反饋參與塑造 AI,并推動自己的職業成長;隨后,又把這些經驗和能力帶回到朋友、家人和所在社區之中。這一切都意義重大。 ?
這是一則令人失望的消息。對于這樣的結果,我們深表遺憾,也真誠感謝大家一路以來的支持。我們相信,大家一定會把在這里積累的知識和能力帶向更遠的未來,并取得更大的成就。感謝每一位參與其中的人。感謝大家的支持,也再次為這一結果致歉。 ?
最后,我們也想感謝客戶、投資人以及才華橫溢的成員,正是大家的投入讓這段旅程成為可能。感謝支持。 ?
Yupp 3 月 31 日發布的官方公告,網站將保留到 2026 年 4 月 15 日,期間不再開放新用戶注冊和新對話功能,老用戶只能查看聊天記錄并下載數據。
Yupp 始于一支履歷頗為亮眼的團隊。由 Pankaj Gupta 和 Gilad Mishne 于 2024 年 6 月 共同創立,另外 Jimmy Lin 擔任首席科學家。
Pankaj Gupta 是聯合創始人兼 CEO,曾在 Twitter、Google、Coinbase 任職。
![]()
Gilad Mishne 為聯合創始人兼 AI 負責人,曾任 GoogleX 機器學習負責人。
![]()
Jimmy Lin 則擁有 MIT 計算機科學博士背景,現為滑鐵盧大學計算機科學教授。
![]()
Pankaj 與 Gilad 早年都曾在 Twitter 做過面向大規模用戶的產品與系統。
Yupp 的創業邏輯,是試圖把兩端需求連接起來。
一端是普通用戶面對越來越多的大模型,難以判斷誰更適合自己;另一端是 AI 實驗室需要來自真實世界的人類反饋,來持續評估和優化模型。
Yupp 因此把自己定位為一個面向 AI 模型探索與評估的平臺。于 2025 年 6 月 正式對外發布產品,主打“在一個平臺上免費比較多個模型”,并通過用戶偏好反饋形成評測數據。
![]()
在產品機制上,Yupp 的核心做法也比較直接,用戶輸入問題后,可以看到多個模型給出的回答,并通過比較、選擇和反饋參與模型評估。
![]()
Pankaj Gupta 在公開介紹中稱,平臺上線時已支持 500 多個模型,覆蓋 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等主流模型;用戶在平臺上提交反饋后,還可獲得積分,繼續免費調用這些模型。
資本市場也很快跟進。
Pankaj Gupta 在公開發文中寫道,Yupp 此前完成了一筆 3300 萬美元(2.25 億元人民幣)種子輪融資,由 a16z 的 Chris Dixon 領投,另有 45 位以上天使投資人與小型投資者參與,其中包括 Jeff Dean、Biz Stone、Evan Sharp、Aravind Srinivas、Kunal Shah,以及斯坦福教授 Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar 等人。
目前這一數字已經擴展到 800 多個模型,覆蓋 OpenAI、Google、Anthropic 等主流廠商。
![]()
從融資背景看,Yupp 一度被視為 AI 評測賽道里頗具想象力的新公司。
![]()
但從結果來看,這套邏輯并沒有跑通。
Yupp 在停服公告中承認,自 2025 年 6 月上線以來,雖然吸引了超過 130 萬注冊用戶,也拿下了多家付費實驗室客戶,但始終沒有建立起足夠強的產品與市場匹配。
Yupp 當時每月已積累數百萬條偏好數據,平臺也曾上線模型排行榜,但這些數據資產并沒有轉化成足夠穩固的商業閉環。
更關鍵的變化,出在行業本身。
Yupp 在公告里給出的解釋很直接,過去幾個月,模型能力提升太快,用戶使用 AI 的方式也正在從“單輪聊天機器人”轉向“智能體系統”,即模型開始與工具、記憶和外部服務結合使用。
![]()
在這種新環境下,單純停留在聊天機器人界面的眾包評測,戰略價值正在下降。
Yupp 原本賭的是“誰能更好評測模型”,但市場更快轉向了“誰能更好組織模型完成任務”。
這也解釋了為什么 Yupp 的問題,并不只是“融資之后燒錢失敗”這么簡單。
它真正撞上的,是 AI 演化路徑的變化。
早期,多模型橫向比較、排行榜、用戶投票,確實有助于讓普通用戶感知模型差異,也能為實驗室提供一些真實反饋;但隨著模型能力快速拉齊,行業競爭的重心開始從“回答誰更好”轉向“系統誰更能干活”。
在這一階段,評測的價值不再停留在聊天結果優劣,而是進入工具調用、記憶管理、任務編排和長期執行這些更復雜的層面。
云頭條聲明:如以上內容有誤或侵犯到你公司、機構、單位或個人權益,請聯系我們說明理由,我們會配合,無條件刪除處理。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.