聯邦學習與貝葉斯神經網絡的融合:魯棒且感知不確定性的分布式變分推理☆
Federated learning meets Bayesian neural network: Robust and uncertainty-aware distributed variational inference☆
https://www.sciencedirect.com/science/article/abs/pii/S0893608025000140?via%3Dihub
![]()
精彩片段
FedUAB 融合了模糊邏輯和貝葉斯神經網絡,減少了過擬合和模型漂移,對有限但多樣化的數據集非常有效。
創新的 BNN-FL 融合:先驗選擇、高斯權重聚合、方差控制。
FedUAB增強了服務器和客戶端模型,并增加了不確定性量化功能。
摘要
聯邦學習(FL)是分布式機器學習中用于數據隱私保護的常用框架。然而,當前的聯邦學習面臨諸多問題和挑戰,例如客戶端數據量有限以及數據異構性。這些問題導致基于客戶端訓練的模型容易出現漂移和過擬合,最終聚合模型的性能僅為次優水平。為了解決上述問題,我們提出了一種將貝葉斯神經網絡(BNN)顯式集成到聯邦學習框架中的新方法。該方法能夠顯著增強模型的魯棒性。我們將此方法稱為 FedUAB,即“具有不確定性感知 BNN 的聯邦學習”。在 FedUAB 算法中,每個聯邦學習客戶端都使用反向傳播貝葉斯算法獨立訓練一個 BNN。近似模型的權重被建模為高斯分布,這不僅緩解了過擬合問題,也更好地保障了數據隱私。此外,我們還應用了創新方法來克服貝葉斯神經網絡(BNN)和模糊邏輯(FL)融合中的其他關鍵挑戰,例如選擇最優先驗分布、聚合來自多個客戶端的高斯分布權重以及嚴格管理權重方差。在模糊邏輯環境的模擬中,FedUAB 的服務器端全局模型和客戶端個性化模型均展現出卓越的性能,優于傳統的模糊邏輯和其他貝葉斯模糊邏輯方法。此外,它還具備量化和分解不確定性的能力。我們的項目已在https://github.com/lpf111222/FedUAB/ 開源。
引言
隨著數據量激增和數據隱私問題日益凸顯,由單個服務器集中執行復雜的學習任務已變得不切實際。聯邦學習(FL)應運而生,旨在應對這些挑戰,并在隨后的幾年中不斷發展進步。聯邦學習可被視為一種特殊的客戶端訓練形式,強調利用本地數據,無需服務器端傳輸,從而確保用戶隱私得到有效保護。通過實現設備端訓練并將上傳數據限制為計算結果,可以降低敏感信息泄露的風險(Wahab et al., 2021; Yang et al., 2019)。
與集中式機器學習不同,FL客戶端用戶偏好、地理分布和數據收集方法的多樣性,必然導致客戶端訓練數據的非獨立同分布(NonIID)屬性。因此,FL領域仍面臨諸多重要挑戰。本研究重點關注以下三個問題:
客戶端漂移:客戶端特定模型與總體全局模型的偏差歸因于客戶端間數據分布的不相同和非獨立性(Du et al., 2024, Jing et al., 2023)。這種情況會導致全局模型的性能下降和準確性降低,因為局部更新可能無法有效地促進全局學習目標的實現(Zhao et al., 2018)。
客戶端過擬合:單個客戶端數據量的限制可能導致客戶端模型訓練過程中出現過擬合。在過擬合的情況下,訓練損失迅速下降,使得模型權重難以有效更新(Li & Zhan, 2021)。FL 的過擬合模型通常表現為過度自信和缺乏魯棒性,在分布外(OoD)樣本上表現不佳。
數據隱私保護:FL 通常采用添加隨機噪聲作為保護隱私的方法,例如差分隱私 (DP) (Wei 等人,2020),但對模型的權重施加隨機干擾必然會導致性能不可預測的下降 (Wang 等人,2023)。
本文從貝葉斯神經網絡(BNN)的角度探討了上述挑戰。通過利用BNN,模型的魯棒性得到增強,本文提出的綜合方法確保了BNN在模糊邏輯(FL)中的無縫應用,從而為模糊邏輯算法的發展做出了一定的貢獻。
本研究提出了一套整合并應用模糊邏輯(FL)和貝葉斯神經網絡(BNN)的綜合解決方案。BNN 與深度神經網絡(DNN)的區別在于其權重的概率分配,這與 DNN 的固定值方法截然不同。這種概率建模與神經網絡的結合產生了概率推理輸出,從而可以評估預測的不確定性。BNN 的概率推理方法也顯著增強了其在處理有限數據、噪聲和數據錯配(OoD)問題時的魯棒性(Goan & Fookes,2020)。
我們充分利用貝葉斯神經網絡(BNN)的優勢,將BNN顯式集成到模糊邏輯(FL)中,而不是像dropout等方法那樣模擬BNN的效果。這種方法旨在解決非獨立同分布(NonIID)導致的客戶端漂移和過擬合問題。通過這種方式,我們利用概率模型權重,有望增強客戶端數據隱私保護。此外,該模型還保留了BNN的不確定性量化能力。我們將此解決方案命名為FedUAB(具有不確定性感知BNN的模糊邏輯)。
然而,在模糊邏輯架構中訓練貝葉斯神經網絡(BNN)面臨諸多問題,事實上,這方面的研究相對較少。由于性能提升有限等問題,BNN目前并非研究熱點。要使其適用于分布式模糊邏輯場景,需要解決以下挑戰:
如何為訓練數據有限的 FL 客戶端設計有效的損失函數來訓練 BNN?
如何在 FL 服務器上聚合從不同客戶端接收的概率分布形式的模型權重?
最優先驗分布是什么?
我們如何在保證 FedUAB 有效性的同時,兼顧高精度和量化不確定性的能力?
本文將逐一探討上述挑戰,并展示 FedUAB 的有效性。下圖 1 展示了 FedUAB 的整體架構,其結構與傳統的模糊邏輯類似,區別在于貝葉斯神經網絡的訓練、權重聚合以及不確定性評估,而這些正是本研究的創新之處。
本研究提出的 FedUAB 將 BNN 集成到 FL 框架中,具有以下優勢和貢獻:
我們提出了一種在自由客戶端上訓練貝葉斯神經網絡(BNN)的方法。每個客戶端維護自己的BNN,每個權重均服從高斯分布。客戶端使用反向傳播貝葉斯算法訓練BNN模型,該算法通過優化稱為變分自由能的壓縮指標來更新權重。這種變分推理方法中概率采樣的隨機性也間接地保護了訓練數據的隱私。
本文基于概率融合理論,提出了一種新穎的FL權重聚合方法。該方法將多個客戶端的權重(每個權重服從高斯分布)聚合為新的全局權重,這些全局權重仍然服從高斯分布。聚合后的新權重作為初始權重和先驗信息,用于后續的FL訓練。
訓練后的 FedUAB 模型可以通過蒙特卡羅采樣獲得更高精度和量化不確定性的輸出,甚至可以將不確定性分解為偶然不確定性和認知不確定性。
實驗證實了上述 FedUAB 的優勢,并提供了量化和分解不確定性的實際例子。
本文余下部分結構如下:第 2 節回顧并總結了 BNN 及其與 FL 集成的相關工作。第 3 節結合圖 1 概述了 FedUAB。第 4 節描述了 BNN 在 FL 中的實現細節。第 5 節展示了實驗結果。最后,第 6 節總結了全文。
原文鏈接:https://www.sciencedirect.com/science/article/abs/pii/S0893608025000140?via%3Dihub
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.