![]()
萬事達(dá)卡開發(fā)了一種大型表格模型(LTM,區(qū)別于大語言模型),該模型基于交易數(shù)據(jù)而非文本或圖像進(jìn)行訓(xùn)練,專門用于解決數(shù)字支付中的安全性和真實(shí)性問題。
該公司已在數(shù)十億筆信用卡交易上訓(xùn)練了這一基礎(chǔ)模型,計(jì)劃未來擴(kuò)展至千億筆交易規(guī)模。訓(xùn)練數(shù)據(jù)集包括支付事件及相關(guān)數(shù)據(jù),如商戶位置、授權(quán)流程、欺詐事件、退單和忠誠度活動(dòng)。萬事達(dá)卡表示,在訓(xùn)練開始前已移除個(gè)人標(biāo)識符,模型專注于解析行為模式而非個(gè)體身份。
通過排除個(gè)人數(shù)據(jù),該技術(shù)降低了可能影響金融服務(wù)領(lǐng)域其他人工智能形式的隱私風(fēng)險(xiǎn)。公司在最近的博客文章中表示,盡管缺乏用戶個(gè)人信息,但數(shù)據(jù)的規(guī)模和豐富性仍能讓模型推斷出具有商業(yè)價(jià)值的模式。雖然匿名化處理移除了在風(fēng)險(xiǎn)評估中可能有用的信號,但萬事達(dá)卡堅(jiān)持認(rèn)為,使用足夠大量的行為數(shù)據(jù)可以彌補(bǔ)豐富數(shù)據(jù)的損失。
LTM架構(gòu)與大語言模型的架構(gòu)不同
LTM架構(gòu)與大語言模型不同,后者基于非結(jié)構(gòu)化輸入進(jìn)行訓(xùn)練,通過預(yù)測序列中的下一個(gè)Token來工作。萬事達(dá)卡的LTM檢查多維數(shù)據(jù)表中字段間的關(guān)系,使該技術(shù)的定義更接近純機(jī)器學(xué)習(xí)而非人工智能。
大型表格模型從原始輸入中準(zhǔn)確學(xué)習(xí)哪些關(guān)系是可預(yù)測的,因此能識別預(yù)定義規(guī)則無法捕獲的異常模式。
該公司將LTM描述為一個(gè)"洞察引擎",可用于現(xiàn)有產(chǎn)品中,增強(qiáng)現(xiàn)有工作流程。與客戶互動(dòng)的模型(通常是大語言模型)的操作風(fēng)險(xiǎn)不同于作為內(nèi)部決策一部分的模型。
LTM的技術(shù)基礎(chǔ)設(shè)施來自英偉達(dá)和Databricks,前者提供計(jì)算平臺,Databricks負(fù)責(zé)數(shù)據(jù)工程和模型開發(fā)。
網(wǎng)絡(luò)安全領(lǐng)域率先應(yīng)用
網(wǎng)絡(luò)安全是萬事達(dá)卡首個(gè)積極部署該技術(shù)的領(lǐng)域。像許多機(jī)構(gòu)一樣,萬事達(dá)卡運(yùn)營著多個(gè)檢查交易數(shù)據(jù)的欺詐檢測系統(tǒng)。這些系統(tǒng)在開始時(shí)需要人工輸入,并需要持續(xù)調(diào)整以定義可疑行為。這些可能包括交易頻率突然增加,或用戶在短時(shí)間內(nèi)在世界不同地區(qū)進(jìn)行購買。
公司表示,早期結(jié)果顯示在特定情況下相比傳統(tǒng)技術(shù)有改進(jìn)的性能。它引用了高價(jià)值、低頻率購買的例子,傳統(tǒng)模型可能將其標(biāo)記為異常,但新模型似乎能比同類模型更準(zhǔn)確地區(qū)分合法事件。
該公司計(jì)劃部署結(jié)合既定程序和新模型的混合系統(tǒng),這種謹(jǐn)慎程度反映了其運(yùn)營的監(jiān)管水平。它承認(rèn)沒有單一模型能在所有場景下都表現(xiàn)良好,因此LTM將在這一領(lǐng)域的工具中占據(jù)一席之地。
據(jù)稱該模型可以掃描忠誠度計(jì)劃活動(dòng),用于投資組合管理和內(nèi)部分析,這些領(lǐng)域都有大量結(jié)構(gòu)化數(shù)據(jù)。在當(dāng)前運(yùn)營中,公司通常為每項(xiàng)任務(wù)部署多個(gè)適配的模型,但這可能涉及多倍的訓(xùn)練成本以及驗(yàn)證和監(jiān)控努力。一個(gè)可以針對不同任務(wù)進(jìn)行微調(diào)的單一基礎(chǔ)模型可能簡化流程并降低成本。
多功能方法的風(fēng)險(xiǎn)和未來計(jì)劃
多功能LTM方法當(dāng)然存在風(fēng)險(xiǎn):廣泛部署的模型如果出現(xiàn)故障可能產(chǎn)生系統(tǒng)性后果,這在一定程度上解釋了萬事達(dá)卡將其技術(shù)與現(xiàn)有檢測系統(tǒng)結(jié)合應(yīng)用的策略,至少目前如此。
萬事達(dá)卡希望增加模型使用的數(shù)據(jù)規(guī)模和整體復(fù)雜性。它還計(jì)劃提供API訪問和SDK,讓內(nèi)部團(tuán)隊(duì)構(gòu)建新應(yīng)用。
博客文章強(qiáng)調(diào)了LTM承擔(dān)的數(shù)據(jù)責(zé)任,提到了隱私和透明度、模型可解釋性和可審計(jì)性。除了LTM運(yùn)營中涉及的任何數(shù)據(jù)實(shí)踐外,對影響信貸決策或欺詐結(jié)果的任何系統(tǒng)進(jìn)行監(jiān)管審查都是預(yù)期的。
高度結(jié)構(gòu)化的數(shù)據(jù)(相對于文本或圖像)是LTM的核心。大型表格模型可能是核心銀行和支付基礎(chǔ)設(shè)施中新一代AI系統(tǒng)的開始。迄今為止的證據(jù)仍限于供應(yīng)商報(bào)告,因此任何性能聲明不應(yīng)被視為確定性的。
對抗條件下的穩(wěn)健性、長期訓(xùn)練后成本和監(jiān)管接受度都是表格模型可能失敗或成功的問題。這些因素將決定采用的步伐和范圍,但這是萬事達(dá)卡目前下注的領(lǐng)域。
Q&A
Q1:萬事達(dá)卡的大型表格模型LTM與大語言模型有什么區(qū)別?
A:LTM基于交易數(shù)據(jù)而非文本或圖像進(jìn)行訓(xùn)練,檢查多維數(shù)據(jù)表中字段間的關(guān)系,更接近純機(jī)器學(xué)習(xí)。而大語言模型基于非結(jié)構(gòu)化輸入訓(xùn)練,通過預(yù)測序列中下一個(gè)Token工作。
Q2:萬事達(dá)卡如何保護(hù)用戶隱私?
A:萬事達(dá)卡在訓(xùn)練開始前移除了所有個(gè)人標(biāo)識符,模型專注于解析行為模式而非個(gè)體身份。通過排除個(gè)人數(shù)據(jù),該技術(shù)降低了隱私風(fēng)險(xiǎn),使用大量匿名化行為數(shù)據(jù)來補(bǔ)償豐富數(shù)據(jù)的損失。
Q3:大型表格模型在反欺詐方面有什么優(yōu)勢?
A:LTM能從原始輸入中準(zhǔn)確學(xué)習(xí)可預(yù)測關(guān)系,識別預(yù)定義規(guī)則無法捕獲的異常模式。在高價(jià)值、低頻率購買等場景中,新模型能比傳統(tǒng)模型更準(zhǔn)確地區(qū)分合法事件,減少誤報(bào)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.