目前,全球有5.37億成年人患有糖尿病,預計到2030年這一數字將增至6.43億,其中約90%為2型糖尿病。胰島素抵抗(IR)作為2型糖尿病的主要前期病變,其特征是身體組織對胰島素的作用減弱,導致胰腺β細胞需要分泌更多胰島素才能維持正常血糖。然而,目前的診斷方法——無論是高胰島素正葡萄糖鉗夾技術還是HOMA-IR計算——都因成本高昂、操作復雜或需要臨床實驗室就診而難以普及,導致大量處于早期胰島素抵抗階段的人群錯失干預良機。
谷歌公司研究部門Ahmed A. Metwally研究團隊,提出了一種利用可穿戴設備數據和常規血液生物標志物預測胰島素抵抗的創新方法。研究通過對1165名參與者的大規模遠程隊列分析,結合深度學習神經網絡,開發了多模態預測模型。該模型以HOMA-IR(穩態模型評估的胰島素抵抗指數)2.9為閾值,在結合可穿戴設備數據、人口統計學信息和常規血常規指標后,實現了0.80的AUROC(受試者工作特征曲線下面積),敏感度達76%,特異度達84%。這一成果為代謝風險的早期檢測提供了可擴展、易獲取的解決方案,有望通過及時的生活方式干預阻止2型糖尿病的進展。相關論文以“Insulin resistance prediction from wearables and routine blood biomarkers”為題,發表在Nature上。
![]()
研究團隊首先對胰島素抵抗與生活方式及血液生物標志物的關聯進行了深入分析。結果顯示,HOMA-IR與空腹血糖、BMI、糖化血紅蛋白、甘油三酯呈顯著正相關,與高密度脂蛋白膽固醇、每日步數、心率變異性呈顯著負相關(圖1c)。具體而言,靜息心率較高的人群胰島素抵抗風險更高(圖1d),而每日步數較多(圖1e)和心率變異性較高(圖1f)的人群則表現出更好的胰島素敏感性。在血液指標方面,甘油三酯水平隨胰島素抵抗程度升高而增加(圖1g),HDL膽固醇則呈現相反趨勢(圖1h),白蛋白/球蛋白比值也與胰島素敏感性正相關(圖1i)。值得注意的是,在458名肥胖參與者中,有205人存在胰島素抵抗,而在319名正常體重參與者中,僅有22人存在這一問題(圖1j)。更令人警醒的是,在972名血糖正常的參與者中,有196人已經存在胰島素抵抗,這部分人群正是2型糖尿病的高危群體(圖1k)。
![]()
圖1 | 研究設計與數據總結。a ,導致胰島素抵抗、糖尿病前期的生理因素及相關生活方式因素概覽。 b ,我們提出的預測HOMA-IR并用胰島素抵抗素養與理解智能體解讀結果的建模流程。 c ,血液生物標志物和生活方式特征(連續值)與HOMA-IR的相關性。 d-f ,按胰島素敏感性分組(胰島素敏感、受損胰島素敏感和胰島素抵抗)劃分的,與HOMA-IR高度相關的三大可穿戴特征分布:靜息心率( d )、每日步數( e )和心率變異性( f )。 g-i ,按胰島素敏感性分組劃分的,與HOMA-IR高度相關的三大血液生物標志物分布:甘油三酯( g )、高密度脂蛋白膽固醇( h )和白蛋白/球蛋白比值( i )。在箱線圖 d-i 中,中心線表示中位數,箱體邊界代表第25和75百分位數,觸須延伸至1.5倍四分位距。 j ,BMI與HOMA-IR值的散點圖,展示了較高BMI值與胰島素抵抗之間的關系。 k ,顯示胰島素抵抗狀態與糖尿病狀態各組合下參與者數量的混淆矩陣。
在模型性能評估方面,研究團隊比較了不同輸入特征組合的預測效果。僅依靠可穿戴設備和人口統計學信息,模型的R2僅為0.22(圖2b)。加入血脂 panel后,R2提升至0.31,真陽性識別從184人增加到206人,同時將將胰島素敏感者誤判為胰島素抵抗的假陽性從48人減少至34人(圖2c)。加入空腹血糖后,模型表現進一步提升至R2=0.44,真陽性達216人,假陽性降至26人(圖2d)。當同時納入可穿戴數據、人口統計學信息、空腹血糖、血脂panel和代謝panel后,模型達到最優表現,R2=0.50,真陽性達229人,假陽性僅6人(圖2e)。
![]()
圖2 | HOMA-IR預測性能(回歸)評估。a ,不同輸入特征集和模型下HOMA-IR回歸效果的比較。 b–e ,選定特征集的預測HOMA-IR值與真實HOMA-IR值的散點圖:可穿戴數據與人口統計數據( b ),可穿戴數據、人口統計數據與血脂組合( c ),可穿戴數據、人口統計數據與空腹血糖( d ),以及可穿戴數據、人口統計數據、血脂組合與代謝全套指標( e )。關注的真陽性和假陰性區域分別用淺綠色和淺棕色高亮顯示。
為了更充分地利用可穿戴設備的時間序列數據,研究團隊引入了一個基于4000萬小時傳感器數據預訓練的可穿戴基礎模型(WFM)。該模型能夠從分鐘級分辨率的數據中提取高維特征表示(圖3a)。實驗表明,結合WFM嵌入特征與人口統計學信息的模型,其AUROC達0.82,顯著優于僅使用人口統計學信息的基線模型(0.66)(圖3b)。SHAP分析進一步證實,在WFM增強的模型中,可穿戴數據的特征重要性貢獻高達82%,遠高于傳統機器學習模型的43%(圖3c),說明WFM成功捕捉了與胰島素抵抗相關的復雜生理動態變化。
![]()
圖3 | 利用可穿戴基礎模型改進可穿戴數據在胰島素抵抗預測中的應用。a ,可穿戴基礎模型預訓練與推斷組件的示意圖。 b ,量化可穿戴基礎模型在改進胰島素抵抗預測中附加價值的性能指標。 c ,針對不同實驗設置,量化可穿戴基礎模型中可穿戴嵌入特征對預測性能的相對貢獻的SHAP分析。
在獨立的驗證隊列(72名參與者)中,研究團隊進一步驗證了模型的外推能力。該隊列參與者平均年齡44.5歲,平均BMI 30.6 kg/m2,包含多樣化的種族背景(擴展數據表2)。結果顯示,整合WFM嵌入特征與人口統計學信息的模型AUROC達0.75,優于人口統計學基線模型的0.66。更為重要的是,在包含人口統計學信息、空腹血糖和血脂panel的最優模型中,額外加入WFM嵌入特征使AUROC從0.76顯著提升至0.88(圖4b),充分證明了可穿戴數據在胰島素抵抗預測中的增量價值。
![]()
圖4 | 模型在獨立驗證隊列中的表現。a ,獨立驗證隊列的研究概述。 b ,基于不同實驗設置(不使用可穿戴數據、使用聚合可穿戴數據、使用可穿戴基礎模型)的胰島素抵抗分類在獨立驗證隊列中的表現。
研究團隊還開發了一個基于大語言模型的胰島素抵抗解讀與理解代理(IR agent)。該代理采用推理與行動框架,能夠結合用戶的健康數據、調用網絡搜索和專業工具,為用戶提供個性化的代謝健康解讀(圖5a)。經五名內分泌學專家的盲法評估,相較于基礎LLM,IR agent在回答的全面性、可信度和個性化程度方面分別獲得80%、92%和73.3%的偏好率(圖5b)。在實際案例中,當用戶糖化血紅蛋白為5.1%、空腹血糖96 mg/dL看似正常時,IR agent能夠結合預測的HOMA-IR值(4.9)和BMI(39.9),準確識別出用戶的胰島素抵抗風險,并提供個性化的生活方式建議(圖5c)。專家評估顯示,IR agent的回答事實準確率達79%,安全率達96%,在HOMA-IR值的引用和解釋方面準確率分別達100%和96%。
![]()
圖5 | 胰島素抵抗智能體概述。a ,提出的胰島素抵抗智能體示意圖。 b ,由內分泌學家通過并排比較評估,我們的胰島素抵抗智能體相對于基礎模型的勝率。 c ,一個與真實研究參與者數據配對的代謝相關問題示例,以及相應的胰島素抵抗智能體輸出。
這項研究的創新之處在于首次構建了一個可部署的端到端胰島素抵抗預測框架,充分利用了可穿戴設備的持續監測能力和常規血液檢查的易獲取性。研究表明,即使是簡單的靜息心率、心率變異性和步數等指標,也能為代謝健康評估提供重要信息。研究團隊指出,雖然HOMA-IR目前因胰島素檢測的成本和物流挑戰而未被常規評估,但該模型可作為篩查工具,優先篩選出需要進一步進行臨床胰島素檢測的高危人群。未來,隨著可穿戴設備的普及和公眾對持續健康監測認知的提升,這一方法有望推廣至數百萬人群,實現代謝疾病的廣泛早期識別。研究團隊強調,對于已檢測出胰島素抵抗的個體,通過抗阻訓練、有氧運動、熱量限制飲食等生活方式干預,以及必要時的藥物干預,完全有可能逆轉胰島素抵抗,阻斷2型糖尿病的發展進程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.