編者語:
“模型不需要理解整個(gè)結(jié)構(gòu),只需要理解局部原子環(huán)境的物理特性,EMLP能夠像DFT一樣真正描述原子間相互作用。”
01
![]()
背景介紹
催化研究領(lǐng)域,密度泛函理論(DFT)數(shù)十年來一直是揭示催化反應(yīng)微觀機(jī)理的核心工具。然而,隨著研究的深入,DFT的計(jì)算瓶頸日益凸顯,其計(jì)算成本隨體系規(guī)模呈指數(shù)級(jí)增長(zhǎng),使得研究大型復(fù)雜體系或探索動(dòng)態(tài)反應(yīng)網(wǎng)絡(luò)變得不切實(shí)際。雖然經(jīng)典力場(chǎng)方法計(jì)算成本較低,但在定量精度和普適性方面遠(yuǎn)不及量子力學(xué)方法。
![]()
圖1. 用于材料模擬的機(jī)器學(xué)習(xí)方法
神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)勢(shì)函數(shù)(MLPs)的出現(xiàn)開始緩解這一矛盾(圖1),能夠在保持DFT級(jí)精度的同時(shí)實(shí)現(xiàn)接近經(jīng)典力場(chǎng)的計(jì)算效率。但當(dāng)前的MLP方法存在一個(gè)根本性局限——它們通常“系統(tǒng)依賴”,即只能在訓(xùn)練時(shí)見過的特定結(jié)構(gòu)體系上表現(xiàn)良好。這就像是一個(gè)只會(huì)解答特定題目的學(xué)生,遇到新問題就束手無策。
2025年9月23日,上海科技大學(xué)/英國(guó)貝爾法斯特女王大學(xué)胡培君、上海科技大學(xué)謝聞博團(tuán)隊(duì)在Nature Catalysis期刊發(fā)表題為“General reactive element-based machine learning potentials for heterogeneous catalysis”的研究論文,開發(fā)了一種革命性的元素級(jí)機(jī)器學(xué)習(xí)勢(shì)函數(shù)(EMLP),通過獨(dú)特的隨機(jī)探索虛擬化學(xué)優(yōu)化(REICO)采樣策略(圖2),打破了這一局限。該方法不再依賴特定的結(jié)構(gòu)或反應(yīng)路徑,而是專注于學(xué)習(xí)元素間的基本相互作用,從而實(shí)現(xiàn)了真正的普適性和反應(yīng)性預(yù)測(cè)能力。
![]()
圖2. 圖文總覽
02
![]()
核心創(chuàng)新
1.革命性采樣策略:REICO方法
該研究提出了隨機(jī)探索虛擬化學(xué)優(yōu)化(REICO)采樣策略,徹底改變了傳統(tǒng)機(jī)器學(xué)習(xí)勢(shì)函數(shù)的訓(xùn)練數(shù)據(jù)生成方式。與傳統(tǒng)方法依賴特定表面結(jié)構(gòu)或反應(yīng)路徑不同,REICO通過完全隨機(jī)采樣來構(gòu)建訓(xùn)練數(shù)據(jù)集,生成包含隨機(jī)晶胞參數(shù)、原子數(shù)量和元素比例的虛擬化學(xué)結(jié)構(gòu)。這種方法使訓(xùn)練數(shù)據(jù)完全脫離結(jié)構(gòu)空間的限制,專注于原子間相互作用的多樣性本質(zhì)。
2.元素級(jí)機(jī)器學(xué)習(xí)勢(shì)函數(shù)(EMLP)架構(gòu)
開發(fā)了元素級(jí)機(jī)器學(xué)習(xí)勢(shì)函數(shù)(EMLP)新架構(gòu),其核心創(chuàng)新在于僅需要知道涉及元素即可構(gòu)建模型,無需任何領(lǐng)域?qū)I(yè)知識(shí)。通過多階段選擇方案,從數(shù)百萬隨機(jī)結(jié)構(gòu)中精選出最具代表性的數(shù)據(jù)點(diǎn),確保了訓(xùn)練集既包含隨機(jī)結(jié)構(gòu)的多樣性,又涵蓋穩(wěn)定結(jié)構(gòu)的合理性。
3.卓越的普適性與反應(yīng)性
EMLP展現(xiàn)了前所未有的普適性預(yù)測(cè)能力,能夠準(zhǔn)確處理訓(xùn)練時(shí)未見過的任意結(jié)構(gòu)體系。在二聚體掃描測(cè)試中,EMLP精確預(yù)測(cè)了各種元素組合的相互作用;在分子動(dòng)力學(xué)模擬中,其軌跡與DFT參考高度一致;在復(fù)雜催化反應(yīng)網(wǎng)絡(luò)中,EMLP成功預(yù)測(cè)了從簡(jiǎn)單表面到特殊表面的各種反應(yīng)能壘和焓變。
4.多相體系的統(tǒng)一描述
實(shí)現(xiàn)了固液氣多相體系的統(tǒng)一精確描述,超越了傳統(tǒng)MLP的應(yīng)用局限。研究證明EMLP不僅能準(zhǔn)確預(yù)測(cè)多相催化反應(yīng),還能可靠模擬有機(jī)化學(xué)反應(yīng)、表面動(dòng)力學(xué)和液相環(huán)境,展示了其真正的通用性和跨領(lǐng)域應(yīng)用潛力。
5.計(jì)算效率與可及性
相比傳統(tǒng)方法,REICO-EMLP框架具有顯著的計(jì)算效率優(yōu)勢(shì),僅需要約10,000個(gè)結(jié)構(gòu)/元素的訓(xùn)練數(shù)據(jù)即可達(dá)到優(yōu)異性能。這種modest的CPU和GPU需求使該方法具有廣泛的可及性,為大規(guī)模推廣應(yīng)用奠定了基礎(chǔ)。
![]()
圖3. REICO采樣、EMLP訓(xùn)練流程及應(yīng)用總結(jié)
03
![]()
圖文解析
1.開發(fā)了通用且高精度的EMLP勢(shì)函數(shù)
研究團(tuán)隊(duì)構(gòu)建了針對(duì)Pd-Ag催化劑與含C/H/O物種相互作用的Ag-Pd-C-H-O五元素EMLP。該勢(shì)函數(shù)僅基于元素信息,無需預(yù)設(shè)反應(yīng)路徑或特定結(jié)構(gòu),即能實(shí)現(xiàn)與密度泛函理論(DFT)相媲美的定量精度。測(cè)試表明,其在能量和力預(yù)測(cè)上的誤差顯著低于MACE-mp、EquiformerV2和M3GNet等現(xiàn)有主流基礎(chǔ)模型。通過與傳統(tǒng)分子動(dòng)力學(xué)(MD)采樣數(shù)據(jù)的對(duì)比,REICO生成的數(shù)據(jù)集不僅涵蓋了MD樣本的所有區(qū)域,還在能量和局部原子環(huán)境方面實(shí)現(xiàn)了顯著擴(kuò)展。這種隨機(jī)采樣方法有效避免了傳統(tǒng)方法因過度依賴穩(wěn)定金屬結(jié)構(gòu)的周期性對(duì)稱性而導(dǎo)致的過擬合問題。
![]()
圖4. 分析RECIO生成的數(shù)據(jù)集和二聚體掃描性能
2.在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異
二聚體掃描測(cè)試:對(duì)所有元素組合的二聚體相互作用預(yù)測(cè)與DFT結(jié)果高度吻合,準(zhǔn)確捕捉了短程排斥作用和原子分離時(shí)的力變化趨勢(shì)。
分子動(dòng)力學(xué)模擬:在Ag28O22和Pd34O56團(tuán)簇的MD模擬中,EMLP軌跡與DFT
大分子吸附:對(duì)包含364個(gè)原子的PTCDA分子在Ag(111)表面的弛豫,EMLP精確預(yù)測(cè)了吸附構(gòu)型和分子-表面距離。
![]()
圖5. 來自EMLP和其他基礎(chǔ)模型的MD和表面吸附結(jié)構(gòu)預(yù)測(cè)
3.在多相催化反應(yīng)預(yù)測(cè)中實(shí)現(xiàn)突破
研究系統(tǒng)評(píng)估了CO氧化、乙炔加氫、費(fèi)-托合成等多個(gè)典型催化反應(yīng)體系:
CO氧化:在多種Pd和Pd/Ag表面(包括簡(jiǎn)單晶面、孿晶界、納米棒及單原子催化劑)上,EMLP均能準(zhǔn)確預(yù)測(cè)反應(yīng)能壘和焓變。
表面覆蓋效應(yīng):成功預(yù)測(cè)了清潔Pd(111)和氫覆蓋Pd(111)表面的乙炔加氫反應(yīng)路徑,與DFT結(jié)果高度一致。
復(fù)雜反應(yīng)網(wǎng)絡(luò):對(duì)費(fèi)-托合成過程中從C1到C6的21個(gè)基元步驟,EMLP完整復(fù)現(xiàn)了DFT計(jì)算的能量曲線,過渡態(tài)搜索成功率達(dá)100%。
![]()
圖6. 各種鈀和 Pd/Ag 表面上 CO 氧化反應(yīng)的預(yù)測(cè)
![]()
圖7. 對(duì)具有覆蓋效應(yīng)的各種鈀基表面上C2H2氫化(氫原子逐步添加到C2H2中形成C2H6)的反應(yīng)預(yù)測(cè)。
![]()
圖8. 對(duì) Pd(100) 上費(fèi)托合成反應(yīng)的擴(kuò)展反應(yīng)路徑的反應(yīng)預(yù)測(cè)
4.超越多相催化的廣泛應(yīng)用能力
研究還將EMLP拓展至有機(jī)化學(xué)反應(yīng)、固-液界面和水溶液環(huán)境等多個(gè)領(lǐng)域:
有機(jī)反應(yīng)標(biāo)準(zhǔn)測(cè)試:對(duì)Baker和Chan提出的標(biāo)準(zhǔn)測(cè)試反應(yīng),EMLP預(yù)測(cè)的活化能和反應(yīng)焓與DFT值偏差僅0.1-0.2 eV。
液相環(huán)境模擬:通-過umbrella sampling獲得了Pd(111)表面CO氧化在explicit 水分子存在下的自由能剖面,與DFT結(jié)果高度一致。
溶液體系結(jié)構(gòu):對(duì)液態(tài)甲醇的徑向分布函數(shù)模擬成功復(fù)現(xiàn)了氫鍵網(wǎng)絡(luò)等關(guān)鍵結(jié)構(gòu)特征。
![]()
圖9. 跨固相、液相和氣相的附加基準(zhǔn)
04
![]()
總結(jié)
這項(xiàng)研究代表了機(jī)器學(xué)習(xí)勢(shì)函數(shù)發(fā)展的范式轉(zhuǎn)變:構(gòu)建多相催化MLP不再僅僅是一個(gè)回歸問題,而根本上是一個(gè)采樣問題。通過REICO采樣策略,研究團(tuán)隊(duì)成功地將訓(xùn)練集構(gòu)建與傳統(tǒng)的"有意義結(jié)構(gòu)"概念分離,專注于生成多樣化和代表性的局部原子環(huán)境。
EMLP 的卓越性能體現(xiàn)在: 1 )在目標(biāo)元素領(lǐng)域內(nèi)實(shí)現(xiàn)了普適性和反應(yīng)性的平衡; 2 )能夠準(zhǔn)確預(yù)測(cè)任意結(jié)構(gòu)的能量和力; 3 )在復(fù)雜催化反應(yīng)網(wǎng)絡(luò)中保持高度一致性; 4 )超越多相催化的廣泛應(yīng)用能力。
05
![]()
展望(巨人肩上前行)
1. 增加訓(xùn)練數(shù)據(jù)規(guī)模來系統(tǒng)探索和提升EMLP的潛力。
2. 將自旋態(tài)、磁性、長(zhǎng)程相互作用和外部場(chǎng)等更復(fù)雜的化學(xué)信息納入EMLP框架,拓展其應(yīng)用范圍?
3. 利用EMLP的直接反應(yīng)模擬能力,大規(guī)模研究反應(yīng)機(jī)理和動(dòng)力學(xué)。
文獻(xiàn)信息
Changxi Yang, Chenyu Wu, Wenbo Xie, Daiqian Xie & P. Hu, General reactive element-based machine learning potentials for heterogeneous catalysis, Nature Catalysis, 2025, 8, 891-904.
聲明:
1. 版權(quán):推送內(nèi)容僅供學(xué)習(xí)交流分享使用,無任何商業(yè)用途,如有侵權(quán),請(qǐng)聯(lián)系后臺(tái)刪除或修改,感謝支持。
2. 投稿:非常歡迎各位老師在公眾號(hào)上介紹課題組前沿或經(jīng)典研究成果!后臺(tái)或郵箱聯(lián)系即可!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.