網易首頁 > 網易號 > 正文申請入駐

PNAS | 南開大學邵學廣/付浩浩/蔡文生開發AI算法“追蹤”蛋白質折疊，隱藏的中間狀態無處遁形！

2026-03-07 11:32:52　來源: BioPeers

浙江舉報

分享至

蛋白質如何從一條無序的氨基酸鏈，折疊成精確的三維結構，這一直是結構生物學的核心謎題。在這個過程中，會形成一些稍縱即逝的“中間狀態”，它們如同戲劇的幕后彩排，雖不登場，卻決定了演出的成敗。捕捉這些中間態對理解蛋白質功能及相關疾病至關重要，但實驗手段難以捕獲，而分子動力學模擬雖能生成海量原子運動數據，傳統分析方法卻往往“先入為主”——先基于幾何結構猜測狀態，再分析其動力學行為。這種“狀態中心”的范式可能導致動力學信息的丟失，甚至掩蓋了真實的折疊路徑。

2026年3月6日，南開大學化學學院的邵學廣教授/付浩浩副研究員/蔡文生教授等在《美國國家科學院院刊》（PNAS）上發表了題為《基于AI的條件轉移聚類揭示蛋白質折疊中隱藏的中間狀態》的研究論文。該團隊提出了一種名為“條件轉移聚類”的全新AI框架，開創性地將分析視角從“狀態中心”轉向“動力學中心”。這意味著，他們不再預先定義狀態，而是先讓AI學習系統內在的動力學規律，再根據“動力學隔離”的原則，讓蛋白質的“狀態”本身從數據中自然浮現。

為了驗證CTC的效果，研究人員首先在具有雙勢阱（圖A）和四勢阱（圖F）的簡化模型上進行測試。對于雙勢阱系統，CTC通過分析軌跡隨時間變化的概率分布，精準地識別出每次跨越能壘的“稀有事件”，并將軌跡劃分為不同片段（圖B）。通過計算片段間的轉移概率，系統自然地聚合成了兩個符合物理直覺的狀態（圖D-E）。在四勢阱系統中，通過調整觀測時間窗口（滯后時間），CTC成功捕捉到了動力學層次：短窗口下，四個狀態清晰可辨；隨著窗口拉長，快速平衡的相鄰狀態逐漸合并，最終整個系統被視為一個整體（圖G-M），完美復現了自由能 landscape 的層級結構。

隨后，CTC被應用于DE Shaw研究所提供的12條蛋白質折疊模擬軌跡。結果顯示，在傳統認為“雙態”折疊的WW結構域中，CTC成功解析出了兩個介于折疊與去折疊之間的中間態（a1, a2）。進一步分析發現，這些中間態雖然整體結構接近天然態，但在局部環區的二面角以及非天然接觸上存在特征性差異（圖A）。對于α/β蛋白NTL9，CTC識別出的四個狀態（圖B）中，兩個中間態（b1, b3）分別表現出C端或N端螺旋的部分形成，這與文獻中報道的中間體特征高度吻合。而在更復雜的蛋白G變體中，CTC甚至區分出了13個不同的構象狀態（圖C），其中包含多個與理論計算預測完全吻合的、具有特定缺陷的“近天然態”，如螺旋不完整或β-片層錯位。

為了量化CTC的優勢，研究者將其與傳統馬爾可夫模型及深度學習VAMPnets等方法進行了對比。在2納秒的短滯后時間下，CTC在所有測試體系上都獲得了最高的“亞穩性”分數，證明其能更有效地識別短暫的中間態，減少邊界“往返”噪音的干擾。進一步的Chapman-Kolmogorov檢驗也證實，CTC構建的模型在2納秒的短時間尺度上就具備良好的馬爾可夫性，動力學自洽性優異。

CTC不僅能“定格”狀態，還能“抓拍”過渡態。在雙勢阱模型中，CTC準確定位到了勢能面上的鞍點（圖A）。在蛋白質體系中，通過分析狀態變化前后的“概率谷”區域，CTC識別出的過渡態結構（圖E-G）恰好位于自由能壘的“山脊”之上（圖B-D）。這些結構揭示了折疊過程中關鍵的成核事件，例如WW結構域中N端或C端β-片層的優先形成，為繪制完整的折疊路徑提供了關鍵坐標。

基于識別的狀態和過渡態，CTC最終繪制出定量的折疊“交通網絡圖”。對于WW結構域，一條從去折疊態直達天然態的主干道（ΔG?=19.35 kJ/mol）主導了折疊過程（圖A）。而NTL9則存在競爭路徑，通過中間態的“換乘”比直達路線更為高效（圖B）。對于蛋白G，CTC構建了包含多條路徑的網絡（圖C），并計算發現，從去折疊態出發，經由c4、c5、c9再到天然態的路徑是一系列能量障礙最低的“最優選擇”，為理解復雜蛋白質的折疊機制提供了前所未有的動態藍圖。

READING

BioPeers

歡迎關注本公眾號，所有內容歡迎點贊，推薦??，評論，轉發~

如有錯誤、遺漏、侵權或商務合作請私信小編~~

歡迎大家投稿課題組研究進展、招聘及招生宣傳~

所有文章只為科普、科研服務，無商業目的~

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.