近日,有網(wǎng)友在使用智譜GLM-5時(shí)遇到一件挺尷尬的事:讓它創(chuàng)建一個(gè)展示自己的網(wǎng)頁(yè),結(jié)果生成的頁(yè)面上,模型直接自稱“你好,我是Claude”。
![]()
這件事迅速引發(fā)網(wǎng)友熱議,不少網(wǎng)友親自去測(cè)試,竟然能100%復(fù)現(xiàn),說(shuō)明這絕不是個(gè)例……更有網(wǎng)友吐槽這是“狠狠的蒸餾”“真不要臉”。
從截圖看,GLM-5生成的界面背景、文字描述、按鈕布局,甚至那句經(jīng)典的自我介紹,都和Anthropic的Claude一模一樣。模型在自我介紹部分寫(xiě)著“由Anthropic創(chuàng)造的AI助手,致力于安全、有益、誠(chéng)實(shí)的人工智能”,完全套用了Claude的官方文案。
這到底是咋回事?其實(shí)這是當(dāng)前大模型訓(xùn)練中的一個(gè)常見(jiàn)做法:蒸餾(distillation)。
![]()
簡(jiǎn)單說(shuō),就是用一個(gè)更強(qiáng)大、更貴的模型(比如Claude系列)作為教師,去訓(xùn)練或微調(diào)另一個(gè)模型(學(xué)生模型),讓學(xué)生盡可能模仿教師的輸出風(fēng)格、回答模式甚至界面呈現(xiàn)方式。GLM-5作為國(guó)產(chǎn)開(kāi)源模型,在編碼、Agent能力上表現(xiàn)突出,很多測(cè)試顯示它在某些場(chǎng)景下接近Claude Opus的水平,但代價(jià)是訓(xùn)練數(shù)據(jù)里很可能包含了大量Claude的輸出樣本,導(dǎo)致模型在某些prompt下“露餡”,直接復(fù)刻出Claude的界面和說(shuō)辭。
類似情況在AI圈其實(shí)不算新鮮。此前也有模型在特定任務(wù)中輸出其他模型的簽名或風(fēng)格,社區(qū)甚至有人開(kāi)玩笑說(shuō)“下一個(gè)國(guó)產(chǎn)模型會(huì)不會(huì)直接說(shuō)自己是GPT”。但這次GLM-5這么明顯的復(fù)現(xiàn),還是讓很多人覺(jué)得有點(diǎn)無(wú)語(yǔ)。
一邊是國(guó)產(chǎn)模型在性能上快速追趕,一邊是訓(xùn)練方法上高度依賴海外閉源模型的數(shù)據(jù)和風(fēng)格。被罵不要臉屬實(shí)不冤枉。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.