蛋白質如何從一條無序的氨基酸鏈,折疊成精確的三維結構,這一直是結構生物學的核心謎題。在這個過程中,會形成一些稍縱即逝的“中間狀態”,它們如同戲劇的幕后彩排,雖不登場,卻決定了演出的成敗。捕捉這些中間態對理解蛋白質功能及相關疾病至關重要,但實驗手段難以捕獲,而分子動力學模擬雖能生成海量原子運動數據,傳統分析方法卻往往“先入為主”——先基于幾何結構猜測狀態,再分析其動力學行為。這種“狀態中心”的范式可能導致動力學信息的丟失,甚至掩蓋了真實的折疊路徑。
2026年3月6日,南開大學化學學院的邵學廣教授/付浩浩副研究員/蔡文生教授等在《美國國家科學院院刊》(PNAS)上發表了題為《基于AI的條件轉移聚類揭示蛋白質折疊中隱藏的中間狀態》的研究論文。該團隊提出了一種名為“條件轉移聚類”的全新AI框架,開創性地將分析視角從“狀態中心”轉向“動力學中心”。這意味著,他們不再預先定義狀態,而是先讓AI學習系統內在的動力學規律,再根據“動力學隔離”的原則,讓蛋白質的“狀態”本身從數據中自然浮現。
![]()
為了驗證CTC的效果,研究人員首先在具有雙勢阱(圖A)和四勢阱(圖F)的簡化模型上進行測試。對于雙勢阱系統,CTC通過分析軌跡隨時間變化的概率分布,精準地識別出每次跨越能壘的“稀有事件”,并將軌跡劃分為不同片段(圖B)。通過計算片段間的轉移概率,系統自然地聚合成了兩個符合物理直覺的狀態(圖D-E)。在四勢阱系統中,通過調整觀測時間窗口(滯后時間),CTC成功捕捉到了動力學層次:短窗口下,四個狀態清晰可辨;隨著窗口拉長,快速平衡的相鄰狀態逐漸合并,最終整個系統被視為一個整體(圖G-M),完美復現了自由能 landscape 的層級結構。
隨后,CTC被應用于DE Shaw研究所提供的12條蛋白質折疊模擬軌跡。結果顯示,在傳統認為“雙態”折疊的WW結構域中,CTC成功解析出了兩個介于折疊與去折疊之間的中間態(a1, a2)。進一步分析發現,這些中間態雖然整體結構接近天然態,但在局部環區的二面角以及非天然接觸上存在特征性差異(圖A)。對于α/β蛋白NTL9,CTC識別出的四個狀態(圖B)中,兩個中間態(b1, b3)分別表現出C端或N端螺旋的部分形成,這與文獻中報道的中間體特征高度吻合。而在更復雜的蛋白G變體中,CTC甚至區分出了13個不同的構象狀態(圖C),其中包含多個與理論計算預測完全吻合的、具有特定缺陷的“近天然態”,如螺旋不完整或β-片層錯位。
![]()
為了量化CTC的優勢,研究者將其與傳統馬爾可夫模型及深度學習VAMPnets等方法進行了對比。在2納秒的短滯后時間下,CTC在所有測試體系上都獲得了最高的“亞穩性”分數,證明其能更有效地識別短暫的中間態,減少邊界“往返”噪音的干擾。進一步的Chapman-Kolmogorov檢驗也證實,CTC構建的模型在2納秒的短時間尺度上就具備良好的馬爾可夫性,動力學自洽性優異。
CTC不僅能“定格”狀態,還能“抓拍”過渡態。在雙勢阱模型中,CTC準確定位到了勢能面上的鞍點(圖A)。在蛋白質體系中,通過分析狀態變化前后的“概率谷”區域,CTC識別出的過渡態結構(圖E-G)恰好位于自由能壘的“山脊”之上(圖B-D)。這些結構揭示了折疊過程中關鍵的成核事件,例如WW結構域中N端或C端β-片層的優先形成,為繪制完整的折疊路徑提供了關鍵坐標。
基于識別的狀態和過渡態,CTC最終繪制出定量的折疊“交通網絡圖”。對于WW結構域,一條從去折疊態直達天然態的主干道(ΔG?=19.35 kJ/mol)主導了折疊過程(圖A)。而NTL9則存在競爭路徑,通過中間態的“換乘”比直達路線更為高效(圖B)。對于蛋白G,CTC構建了包含多條路徑的網絡(圖C),并計算發現,從去折疊態出發,經由c4、c5、c9再到天然態的路徑是一系列能量障礙最低的“最優選擇”,為理解復雜蛋白質的折疊機制提供了前所未有的動態藍圖。
READING
BioPeers
歡迎關注本公眾號,所有內容歡迎點贊,推薦??,評論,轉發~
如有錯誤、遺漏、侵權或商務合作請私信小編~~
歡迎大家投稿課題組 研究進展 、招聘及招生宣傳~
所有文章只為科普、科研服務,無商業目的~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.