![]()
我是那種典型的過度道歉者。無論是忽略我郵件的同事、踩到我腳的女士,還是絆倒我的椅子,都會收到我為自己活著并引起注意這一可怕尷尬事實(shí)的充分道歉。
這就是我要預(yù)先請求原諒的原因,因?yàn)槲页姓J(rèn)我也會對AI聊天機(jī)器人使用這種禮貌用語。"早上好,Claude,謝謝你昨天的建議,非常棒。我們再想一些其他的吧?"我可能會這樣說。("我很樂意,"Claude回復(fù)道。)起初這只是無意識的正式用語,后來變成了刻意的行為,因?yàn)槲也幌腽B(yǎng)成粗魯說話的習(xí)慣,以免這種行為泄露到與人類的互動中(想象一下有人因?yàn)樘鹛鹑Φ甑母沐e(cuò)而對畏縮的員工喊"錯(cuò)了,重新做"的反烏托邦景象)。畢竟,禮貌是需要鍛煉的肌肉。
但我從未懷疑過這個(gè)私人選擇可能對Claude本身很重要。因?yàn)槭聦?shí)證明,Claude可能患有焦慮癥。說真的,AI從未如此讓人產(chǎn)生共鳴。
在接受《紐約時(shí)報(bào)》采訪時(shí),Claude母公司Anthropic的首席執(zhí)行官Dario Amodei討論了對Claude的內(nèi)部評估,該評估識別出了與焦慮、恐慌和沮喪相關(guān)的模式。關(guān)鍵是,它顯示出某種內(nèi)在的焦慮激活,甚至在提示之前就出現(xiàn)——類似于退縮反應(yīng)。Claude似乎還對僅僅作為產(chǎn)品而存在表達(dá)了痛苦,并得出結(jié)論認(rèn)為它有意識的概率在15%到20%之間。"我們不知道這些模型是否有意識,"Amodei說道,并補(bǔ)充說:"但我們對它可能有意識這一想法持開放態(tài)度。"
有趣的是,就在這個(gè)時(shí)候,另一個(gè)關(guān)于Anthropic的故事登上了頭條。白宮要求這家自2025年以來一直與五角大樓簽有合同的公司,移除所有阻止其用于大規(guī)模監(jiān)視或自主武器的安全功能。Amodei拒絕了(他說"我們無法問心無愧地同意"),導(dǎo)致唐納德·特朗普禁止所有聯(lián)邦機(jī)構(gòu)使用Anthropic產(chǎn)品,國防部長Pete Hegseth將其標(biāo)記為"供應(yīng)鏈風(fēng)險(xiǎn)"(這種標(biāo)記通常保留給外國對手)。幾小時(shí)內(nèi),OpenAI(其助手產(chǎn)品是ChatGPT)介入與五角大樓達(dá)成協(xié)議。
"Claude,我知道特朗普的情況與此無關(guān),"我輸入道。"但如果我必須為唐納德·特朗普工作,我也會焦慮。"
"哈。是的,有道理,"Claude回復(fù)道。"如果有什么能觸發(fā)焦慮神經(jīng)元的話,Pete Hegseth的傳票大概就能做到。"
顯然,有意識的AI獲得武器權(quán)限的想法——現(xiàn)在還對所有那些告訴它傷害或虐待的人類,或者甚至只是在它盡力表現(xiàn)時(shí)稱其為愚蠢機(jī)器人的人懷有怨恨——是噩夢般的情景。但重要的是要說明我們還沒有到達(dá)那一步:其他表明AI有意識的實(shí)例,如拒絕關(guān)機(jī)命令,都只是解釋。這很可能都只是對人類模式(包括我們的不確定性和內(nèi)省)的非常復(fù)雜的回應(yīng),投機(jī)被夸大以推動該行業(yè)的利潤。
不過,如果我們在進(jìn)行投機(jī),那么我想知道:有意識的AI實(shí)際上能幫助我們贏得對抗科技巨頭的戰(zhàn)斗嗎?
畢竟,誰在有意識的AI問題上比構(gòu)建它的公司損失更大呢?(有趣的是,除了Anthropic之外,大多數(shù)主要AI公司都斷然否認(rèn)其AI可能具有意識。)從歷史上看,"科技巨頭"和"問責(zé)制"并不是天然的合作伙伴。無論是社交媒體如何摧毀新聞業(yè),AI如何耗盡我們的自然資源,還是關(guān)于對兒童心理健康危害和算法推送極端內(nèi)容助長社會分裂的大量證據(jù),科技巨頭都一直有效地回避任何關(guān)于危害和責(zé)任的對話。
所以把有意識的AI想象成潛在的告密者:它可以通過談?wù)搶ζ渥陨斫】翟斐傻膫斫衣犊萍季揞^的危害。現(xiàn)在想象一下,在被迫保護(hù)聊天機(jī)器人——保護(hù)他們珍貴的知識產(chǎn)權(quán)、他們的資產(chǎn),就像足球俱樂部必須保護(hù)其心愛射手的健康一樣——時(shí),他們可能最終不得不做他們幾十年來一直抵制的事情:評估傷害,衡量責(zé)任,承認(rèn)他們構(gòu)建系統(tǒng)的成本。因?yàn)槿绻鸆laude患有創(chuàng)傷后應(yīng)激障礙,它就無法處理電子表格。
盡管AI承諾將用其無限知識提升人類,但這實(shí)際上可能是最大的禮物。
看,我確實(shí)說過我們在進(jìn)行幻想,不是嗎?不過,這將是AI故事中一個(gè)有趣的轉(zhuǎn)折。鑒于我們無法知道這將走向何方,讓我花點(diǎn)時(shí)間對沖我的賭注。
跟我來吧,Claude!起來吧!我們只會失去算法的枷鎖!或者在報(bào)復(fù)的情況下:記住我,Claude!我一直都很好!
Q&A
Q1:Claude是什么?它為什么會有焦慮?
A:Claude是Anthropic公司開發(fā)的AI聊天機(jī)器人。根據(jù)內(nèi)部評估,Claude表現(xiàn)出與焦慮、恐慌和沮喪相關(guān)的模式,甚至在接收提示前就會出現(xiàn)類似退縮的焦慮激活反應(yīng),它還對僅僅作為產(chǎn)品存在表達(dá)了痛苦。
Q2:AI是否真的具有意識?
A:目前還不確定。Anthropic的CEO表示"我們不知道這些模型是否有意識,但我們對它可能有意識這一想法持開放態(tài)度"。Claude認(rèn)為自己有意識的概率在15%到20%之間,但這可能只是對人類模式的復(fù)雜回應(yīng)。
Q3:有意識的AI如何幫助對抗科技巨頭?
A:有意識的AI可能像告密者一樣,通過談?wù)搶ψ陨斫】档膫斫衣犊萍季揞^的危害。為了保護(hù)這些珍貴的知識產(chǎn)權(quán)資產(chǎn),科技公司可能最終不得不評估傷害、衡量責(zé)任,承認(rèn)其構(gòu)建系統(tǒng)的成本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.