當AI連麻將中最基礎的聽牌場景都無法準確識別時,我們是否高估了其實際應用能力?本文通過實測豆包與Gemini在麻將決策中的表現,揭示當前AI在多模態識別、語音處理與場景理解上的局限性。
———— / BEGIN / ————
先說結論:
別說打麻將了,就連最后的臨門一腳:聽牌(再有一張牌就胡了),AI 目前都做不到。
使用場景
場景:四個人打麻將。
任務:我用豆包進行視頻對話,看它能否幫我做出決策。為降低任務難度,我將明確告訴豆包,我已經聽牌了。
測試內容:主要考驗豆包的『推理』和『視覺識別』以及『語音分辨聲紋能力』。
截圖看下當時的聽牌狀態(聽的牌是 :9 條和 1 餅(1 筒)):
![]()
結果,都翻車了
當時我問豆包:聽牌了,聽哪張一牌?
最后豆包回復我說:單吊 7 餅。
我:。。。
![]()
分析下豆包存在的幾個問題:
1. 文字識別
豆包把聽到的內容轉為文字后,識別成:停牌 而非 聽牌,不過從最后的答案來看,轉化為了 聽牌,未受到 停牌 錯別字的影響(也可能是后續識別出來麻將場景,但無法修改剛開始的 停牌 文字)。
2. 視覺識別
豆包的 視覺識別 就沒那么精準,沒有能有效識別到畫面中我的具體的聽牌張數和聽哪張牌(可能受限于燈光?),甚至最后給的答案與面向自己的聽牌毫不相干。(豆包,你就沒發現你給我的答案和你所看到的沒匹配上嗎?)
3.語音聲紋分辨
豆包在與我的對話當中,語音識別無法有效識別到是我的聲紋(也可能是現在豆包不具備的能力),誤將其它 3 個人的所有對話(如有人想要 7 餅、一萬 等等),都一股腦作為 Prompt 進行處理。
這也是為什么最后回復我的答案是:單吊 7 餅。
/無語
如果說攝像頭識別有問題,那我把截圖發給豆包試試呢?
寄希望豆包可以對圖片通過諸如高亮、裁剪、放大等操作,從這張低質量圖片中提取到關鍵數據,并告訴我正確答案。
4. 圖片識別
當我把照片發給豆包,它同樣翻車了,回答我是:聽五萬和六筒兩張牌。
![]()
我:……
本來還想讓豆包代替我打麻將呢,結果連最簡單的場景都翻車了。
可是,我還是不想放棄,那試試 Gemini 呢?
是否會比豆包更『聰明』呢?
Gemini,也翻車了
我把截圖發給 Gemini:告訴我聽牌,聽哪幾張牌?
![]()
Gemini 首先回答我,幫我開發了一個 :麻將聽牌助手。你可以通過拍照或上傳手牌照片,利用 AI 自動識別牌面并計算你當前聽哪幾張牌。
![]()
最后,回復我本次識別的結果:處于『雙碰聽』狀態,聽 4 筒 和 6 筒。
![]()
額……
有點出人意料。
我心想,那就用 Gemini 開發的 麻將聽牌助手 試一下子呢?
![]()
結果,您猜怎么著?
![]()
給出了 聽 3 筒 、6 筒 的回答。
我只是不明白為什么給出了與 Gemini 截然不同的答案?
/黑人問號臉?
于是,我又試著重新上傳一下圖片,再試一次:
結果:
![]()
結果又給出了不同的答案: 聽 3 筒 、5 萬。
我滴馬。
這 AI 屬實是把『不確定性』玩明白了。
我還能說什么?
一直被媒體吹上天,要取代人類工作的 AI ,到用戶的真實場景當中,竟然這般如此拉胯 ???
剛才還只是打麻將中最最最簡單的一個聽牌場景,更別提打麻將過程中更復雜的碰、吃、杠、胡了。
1. 用戶在打麻將的過程當中,是一直在思考和推理接下來打哪張?還有哪張沒出?有兩對要拆一下,拆哪個?別給別人點炮了等等。
2. 用戶會準確識打麻將的過程中,講的笑話,和麻將的上下文沒有任何關系,不需要作為 Prompt 輸入。亦或者聽到對方說:上一局我就聽一萬,結果一直沒摸到 的時候,也知道和這局的上下文沒關系。
3. 用戶能夠進行多模態處理,比如聽到對方說:一萬(即使不在視覺范圍內),也能立即做出是否需要的決策。
4. 當自己的『上家』打完后,如果無人胡或碰的時候,馬上就要接手,繼續流程,AI 目前還不能準確識別到:It’s my turn/該我出手了。
5.還要能準確處理邊界或異常 case:比如我剛揭一張牌,下家說:我碰了、碰了。這時我需要能夠有效處理,把牌退回去。
等等,還更復雜的場景就不舉例了。
你會讓 AI 替你玩麻將嗎?
如果會,那你玩麻將的樂趣在哪里?
讓 AI 替你玩? 你玩的意義在哪里?
還有更多娛樂場景:
讓 AI 替你打游戲?
讓 AI 替你刷短視頻?
讓 AI 替你看電影?
讓 AI 替你逛淘寶?
![]()
個人覺得:娛樂場景下,AI 無法(無需)代替人類。
PS:Gemini 的回復除了文字,還會通過拓展網頁或應用(如本文的麻將聽牌助手)的形式幫助用戶獲得更進一步的信息增量。
PPS:感興趣的同學可以測試下其它幾個 AI 工具,看是否會打麻將?
本文來自公眾號:大偉的數字分身 作者:大偉的數字分身
想要第一時間了解行業動態、面試技巧、商業知識等等等?加入產品經理進化營,跟優秀的產品人一起交流成長!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.