每經(jīng)記者:岳楚鵬 每經(jīng)編輯:高涵
3月26日,谷歌研究院(Google Research)的一篇論文震動(dòng)全球存儲(chǔ)芯片市場(chǎng),引發(fā)美國(guó)和韓國(guó)巨頭超900億美元市值蒸發(fā)。
谷歌論文宣稱(chēng),名為T(mén)urboQuant的新算法能夠在不損失準(zhǔn)確率前提下,將AI大模型KV緩存的內(nèi)存占用壓縮至原來(lái)的1/6。
僅僅一天后,蘇黎世聯(lián)邦理工學(xué)院博士后高健揚(yáng)在社交平臺(tái)發(fā)文,直指谷歌論文存在嚴(yán)重的學(xué)術(shù)問(wèn)題。
高健揚(yáng)指出,谷歌回避了TurboQuant算法與2024年他在新加坡南洋理工大學(xué)(NTU)讀博期間發(fā)布的RaBitQ方法的相似性,并錯(cuò)誤描述了RaBitQ的理論結(jié)果,還刻意營(yíng)造不公的實(shí)驗(yàn)環(huán)境。
RaBitQ是一種向量量化算法,能夠確保向量數(shù)據(jù)在高度壓縮下仍保持搜索的可靠性。
高健揚(yáng)還表示,谷歌TurboQuant團(tuán)隊(duì)“知錯(cuò)不改”。谷歌論文2025年4月正式發(fā)表前,自己就已通過(guò)郵件指出了上述問(wèn)題,但谷歌方面在知情后仍未在最終版本中進(jìn)行徹底修正。
3月29日,《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱(chēng)NBD)采訪了RaBitQ論文作者高健揚(yáng)和龍程。
RaBitQ是高健揚(yáng)在新加坡南洋理工大學(xué)讀博期間的主要工作,龍程則是他的博士生導(dǎo)師。
同時(shí),《每日經(jīng)濟(jì)新聞》記者也向谷歌發(fā)送了采訪郵件,但截至發(fā)稿,尚未收到回復(fù)。據(jù)悉,谷歌研究院即將在4月舉行的2026年國(guó)際學(xué)習(xí)表征會(huì)議(ICLR 2026)上展示其TurboQuant論文。
![]()
事件時(shí)間線
“谷歌論文嚴(yán)重失實(shí),溝通后仍未修改”
![]()
高健揚(yáng) 圖片來(lái)源:受訪者供圖
NBD:你們最初是什么時(shí)候注意到谷歌TurboQuant論文存在問(wèn)題的?
高健揚(yáng):早在2025年1月,TurboQuant論文的第二作者M(jìn)ajid Daliri就主動(dòng)聯(lián)系了我們,請(qǐng)求協(xié)助調(diào)試他自己基于RaBitQ C++ 代碼翻譯的Python版本,并描述了詳細(xì)的復(fù)現(xiàn)步驟和報(bào)錯(cuò)信息。這說(shuō)明 TurboQuant團(tuán)隊(duì)對(duì) RaBitQ 的技術(shù)細(xì)節(jié)有充分的了解。
2025年4月TurboQuant論文發(fā)布后,我們注意到該論文中對(duì)RaBitQ的描述存在嚴(yán)重失實(shí)——將RaBitQ描述為grid-based PQ(基于網(wǎng)格的乘積量化),完全忽略了其核心的隨機(jī)旋轉(zhuǎn)步驟,同時(shí)在沒(méi)有任何推導(dǎo)或證據(jù)的情況下將RaBitQ的理論保證定性為"次優(yōu)",實(shí)驗(yàn)對(duì)比也存在明顯的不公平設(shè)計(jì)。
我們的第一反應(yīng)是困惑和遺憾:TurboQuant與RaBitQ的相似性在技術(shù)上清晰可辨,而對(duì)方對(duì)RaBitQ的了解程度也遠(yuǎn)超一般讀者,這種情況下出現(xiàn)如此系統(tǒng)性的失實(shí)描述,很難用疏忽來(lái)解釋。
![]()
郵件截圖
NBD:在公開(kāi)發(fā)聲之前,雙方團(tuán)隊(duì)有哪些溝通?
高健揚(yáng):我們進(jìn)行了多輪溝通,時(shí)間跨度超過(guò)一年。
2025年5月,我們通過(guò)郵件與 Majid Daliri就實(shí)驗(yàn)條件差異和理論結(jié)果最優(yōu)性進(jìn)行了詳細(xì)的技術(shù)討論,逐條澄清了TurboQuant團(tuán)隊(duì)的錯(cuò)誤解讀,Majid Daliri明確表示已將討論結(jié)果告知全體共同作者。
然而,在我們要求修正論文中的事實(shí)性錯(cuò)誤之后,他停止了回復(fù)。
2025年11月我們發(fā)現(xiàn)TurboQuant已提交 ICLR 2026(2026年國(guó)際學(xué)習(xí)表征會(huì)議),且錯(cuò)誤內(nèi)容原封未動(dòng),隨即聯(lián)系了 ICLR 2026 PC Chairs(大會(huì)主席),但未獲回應(yīng)。
2026年3月論文通過(guò)谷歌官方渠道大規(guī)模推廣后,我們?cè)俅握较蛉w作者發(fā)送郵件。
收到的回復(fù)是:第一作者Amir Zandieh承諾修正理論描述和實(shí)驗(yàn)條件,但明確拒絕修正方法論相似性的討論,且聲稱(chēng)只愿在ICLR 2026正式會(huì)議結(jié)束之后才做修改。這一回應(yīng)令我們感到失望但并不意外。對(duì)方顯然清楚問(wèn)題所在,卻選擇了最小限度的讓步。
![]()
“核心機(jī)制高度吻合卻未說(shuō)明,審稿人曾指出問(wèn)題”
NBD:TurboQuant與RaBitQ最關(guān)鍵的相似之處是什么?
高健揚(yáng):兩者最核心的相似之處,在于都采用了在量化前對(duì)向量施加隨機(jī)旋轉(zhuǎn)(Johnson-Lindenstrauss變換)這一關(guān)鍵設(shè)計(jì),并利用旋轉(zhuǎn)后坐標(biāo)分布的統(tǒng)計(jì)性質(zhì)來(lái)構(gòu)建距離估計(jì)器。
值得注意的是,TurboQuant論文作者在ICLR OpenReview(學(xué)術(shù)圈常用的公開(kāi)論文評(píng)審平臺(tái))的審稿回復(fù)中,這樣描述自己的方法:“我們的實(shí)現(xiàn)方式是,先用向量的 L2范數(shù)對(duì)其進(jìn)行歸一化,然后施加一次隨機(jī)旋轉(zhuǎn),以確保這些向量在旋轉(zhuǎn)后的各個(gè)分量服從 Beta 分布。”這與 RaBitQ 的核心機(jī)制高度吻合,但在論文正文中卻從未正面說(shuō)明這一聯(lián)系。
可以用一個(gè)比喻來(lái)理解:假設(shè)一位廚師率先公開(kāi)發(fā)表了一道菜的完整食譜,之后另一位廚師發(fā)布了一道采用幾乎相同核心步驟的菜,卻在介紹中將前者描述為“做法不同、效果較差的另一道菜”,對(duì)兩者之間的聯(lián)系只字不提。
讀者在不知情的情況下,自然無(wú)法得出公正的判斷。
![]()
龍程簡(jiǎn)歷照 圖片來(lái)源:受訪者供圖
NBD:按照學(xué)術(shù)規(guī)范,這類(lèi)關(guān)系應(yīng)如何處理?
龍程:學(xué)術(shù)規(guī)范要求,當(dāng)一項(xiàng)新工作在方法論上與已有工作存在實(shí)質(zhì)性聯(lián)系時(shí),應(yīng)明確引用并正面討論這種聯(lián)系,包括說(shuō)明新工作在哪些方面有所推進(jìn),哪些方面沿用了已有框架。
這一點(diǎn)在本案例中尤為重要,因?yàn)?strong>ICLR的一位審稿人也在審稿意見(jiàn)中獨(dú)立指出“RaBitQ及其變體與TurboQuant的相似之處在于,它們都使用了隨機(jī)投影”,并明確要求更充分的討論和比較。
連審稿人都注意到了這一聯(lián)系,論文作者卻在最終版本中不僅沒(méi)有補(bǔ)充討論,反而將原本正文中對(duì)RaBitQ的不完整描述移入了附錄。這種處理方式與學(xué)術(shù)規(guī)范的基本要求背道而馳。
![]()
網(wǎng)友評(píng)論
“小型科研團(tuán)隊(duì)很難與谷歌抗衡”
NBD:為什么選擇現(xiàn)在公開(kāi),而不是繼續(xù)通過(guò)學(xué)術(shù)渠道內(nèi)部解決?
龍程:我們并非跳過(guò)學(xué)術(shù)渠道,而是在學(xué)術(shù)渠道已基本走完的情況下選擇公開(kāi)。
我們先后聯(lián)系了論文作者、ICLR PC Chairs(程序委員會(huì)主席),并已向ICLR General Chairs(大會(huì)主席)和Code and Ethics Chairs(代碼與倫理主席) 提交附有完整證據(jù)包的正式投訴,同時(shí)也在 ICLR OpenReview平臺(tái)發(fā)布了公開(kāi)評(píng)論。
但我們也必須承認(rèn)一個(gè)現(xiàn)實(shí):我們是一個(gè)小型高校科研團(tuán)隊(duì),對(duì)方是谷歌研究院。在資源、影響力和話語(yǔ)權(quán)上,雙方本就不對(duì)等。
TurboQuant論文在社交媒體相關(guān)瀏覽量短時(shí)間內(nèi)達(dá)到了數(shù)千萬(wàn)次,這是任何高校實(shí)驗(yàn)室都不可能具備的傳播能力。
在這種不對(duì)等的格局下,如果我們繼續(xù)沉默等待內(nèi)部流程,錯(cuò)誤的敘事只會(huì)加速固化為共識(shí)。公開(kāi)發(fā)聲,是弱勢(shì)方在正式渠道響應(yīng)遲緩時(shí),為維護(hù)基本學(xué)術(shù)事實(shí)所能采取的為數(shù)不多的手段之一。
![]()
高健揚(yáng)發(fā)文截圖
NBD:如果相關(guān)問(wèn)題未被修正,可能帶來(lái)哪些影響?
龍程:第一,它會(huì)系統(tǒng)性地扭曲學(xué)術(shù)史的記錄,讓后來(lái)的研究者誤判方法論演進(jìn)的源頭,進(jìn)而在錯(cuò)誤的基礎(chǔ)上構(gòu)建新工作。
第二,它會(huì)打擊原創(chuàng)性研究的激勵(lì)機(jī)制。如果一項(xiàng)經(jīng)過(guò)嚴(yán)格理論推導(dǎo)、達(dá)到漸近最優(yōu)誤差界的方法,可以被重新包裝后以數(shù)千萬(wàn)曝光量推向公眾,而原作者卻得不到應(yīng)有的認(rèn)可,這對(duì)學(xué)術(shù)生態(tài)的傷害是長(zhǎng)期且深遠(yuǎn)的。
第三,對(duì)于向量量化這一正處于快速發(fā)展階段、工業(yè)界高度關(guān)注的領(lǐng)域,不準(zhǔn)確的方法歸屬會(huì)直接影響從業(yè)者和研究者對(duì)技術(shù)路線的判斷,導(dǎo)致資源的錯(cuò)誤配置。
NBD:你們認(rèn)為這屬于學(xué)術(shù)分歧嗎?
龍程:這已超出學(xué)術(shù)分歧的范疇。學(xué)術(shù)分歧通常發(fā)生在雙方對(duì)技術(shù)內(nèi)容存在真實(shí)的理解差異時(shí)。
但在本案例中,TurboQuant團(tuán)隊(duì)對(duì)RaBitQ技術(shù)細(xì)節(jié)的了解有充分記錄;我們?cè)?025年5月已通過(guò)郵件逐條澄清了理論保證的最優(yōu)性,Majid Daliri明確表示已告知全體作者;實(shí)驗(yàn)條件的不對(duì)等也在郵件中得到了作者本人的承認(rèn)。
在上述情況下,相關(guān)錯(cuò)誤在論文經(jīng)歷投稿、審稿、接收、發(fā)表和大規(guī)模宣發(fā)的全過(guò)程中始終未被修正。我們不傾向于輕易做出定性,但我們認(rèn)為,這一系列行為已經(jīng)有充分的事實(shí)基礎(chǔ)供學(xué)術(shù)共同體和相關(guān)機(jī)構(gòu)獨(dú)立判斷。
![]()
高健揚(yáng)社交媒體賬號(hào)截圖
“計(jì)劃公開(kāi)技術(shù)報(bào)告,繼續(xù)尋求學(xué)術(shù)渠道解決”
NBD:對(duì)于像谷歌研究院這樣大型研究機(jī)構(gòu),他們的責(zé)任在哪里?
龍程:大機(jī)構(gòu)的背書(shū)本身會(huì)產(chǎn)生放大效應(yīng)。一篇論文通過(guò)谷歌官方渠道推廣,其傳播速度和覆蓋范圍與普通學(xué)術(shù)論文不可同日而語(yǔ)。
在這種規(guī)模下,論文中的錯(cuò)誤敘事一旦擴(kuò)散,糾正所需的代價(jià)會(huì)成倍增加。我認(rèn)為大機(jī)構(gòu)有責(zé)任在論文對(duì)外大規(guī)模宣發(fā)之前,確保其中涉及他人工作的描述經(jīng)過(guò)基本的事實(shí)核查,而不是將這一責(zé)任完全推給同行評(píng)審。
同時(shí),當(dāng)外部研究者提出有據(jù)可查的異議時(shí),大機(jī)構(gòu)也應(yīng)當(dāng)有正式的內(nèi)部機(jī)制來(lái)處理,而非保持沉默。這既是對(duì)學(xué)術(shù)社區(qū)的責(zé)任,也是對(duì)自身公信力的保護(hù)。
NBD:你們接下來(lái)會(huì)采取進(jìn)一步行動(dòng)嗎?
龍程:接下來(lái),我們計(jì)劃在arXiv發(fā)布詳細(xì)的技術(shù)報(bào)告,系統(tǒng)梳理RaBitQ與TurboQuant在方法論上的關(guān)系,并對(duì)三個(gè)問(wèn)題逐一進(jìn)行技術(shù)層面的闡述,供學(xué)術(shù)社區(qū)參考。
我們也在考慮通過(guò)進(jìn)一步的渠道向相關(guān)機(jī)構(gòu)如Google Research Escalation Council(谷歌研究申訴理事會(huì))反映。我們的目標(biāo)始終是讓公共學(xué)術(shù)記錄準(zhǔn)確地反映各方法之間的真實(shí)關(guān)系,而不是制造對(duì)立。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.