編者按:模型化方法已成為早期新藥臨床試驗的主要數據分析方法,甚至是劑量選擇的標準化方法。因此,建模與模擬在藥物研發決策中必可少。但是,國內合格的定量藥理學家屈指可數,年青的同行們在建模過程中,面臨諸多挑戰。在2025年第11屆定量藥理學與新藥評價會議(ISQP)上,上海中醫藥大學鄭青山教授在主題報告中,闡述了模型評價的系統化方法及實踐難題,通過典型案例,揭示了模型評價中的深層次問題。《藥學瞭望》就報告的相關內容,與他深度對話。
《藥學瞭望》:您的選題宗旨是什么,事先有何考慮?
鄭青山教授:業內知道,FDA新指南認為,PK-PD模型化分析是早期試驗的主要設計方法和數據分析方法,也是劑量優選的標準化方法,否則結果可能不被接受。而且,不再提及基于概率的方法,改用劑量-效應關系,或者血藥暴露-效應關系(E-R)分析。因為血藥濃度比劑量要敏感得多,PK-PD的模型化分析,在小樣本量下就可評價有效性和安全性,加上多個試驗可合并或滾動分析,以及橋接和外推等手段,使得定量藥理學成為極為強大的工具。
相對來說,定量藥理學是個小眾學科,當普及性不夠時,作為一個先行者,就會鼓動更多的同行去學習和使用。到了現階段,從業人員很多,出現了新問題。例如,有的同行,可能是缺少經驗,簡單化或亂做一氣,沒有發揮模型化方法應有的作用,甚至建模數據是選擇性的,而不是FDA要求的“全部數據”。有的申辦方也有問題,在研究時間和預算上,提出一些不切實際的要求,讓人應付差事,甚至用R代碼跑一個單因素E-R回歸圖,然后下結論:沒有暴露-效應關系,用探索性結果替代研究結論。國外對此評價十分負面,一般行業內流傳,定量藥理學是生物統計學的“12倍時間量”。作為定量藥理學發展的親歷者,不知道為什么,總有一種責任感,我最近的報告都是在講存在問題,總不能誤入歧途吧,那樣的話,對學科發展不利,對國家新藥研發也是有害的。
《藥學瞭望》:為什么報告一開始就給定量藥理學做了一個理念定位:“模型引導,做多求少(Model-Guided More for Less)”,有何依據?
鄭青山教授:定量藥理學是發展中的年輕學科,國際指南尚在起草階段,對于行業以外的人,難以用一兩句話,闡明其科學內涵,主要是說不清。但有一點是肯定的,定量藥理學手段多樣,靈敏,能夠利用多源數據建模,一旦成功,通過計算機模擬,能夠洞悉數據背后的規律,可以回答諸多疑問,而不是開展額外試驗。例如,通過血藥濃度與心電圖QT間期(QTc)的建模分析,在很小的樣本量下,甚至作為首次人體試驗的加載研究,就可以判斷結果,而不必開展昂貴的完全QTc延長試驗(TQT)。
王亞寧博士曾是FDA定量藥理學部的部長,我記得他曾說過,在整個FDA監管體系中,審評員遇到證據缺失的第一反應是,增加試驗!只有定量藥理學部門,其理念是多建模,少做試驗。這就是模型引導新藥研發模式,又稱為MIDD,在FDA廣受申辦方歡迎的原因。這種理念,如何用一句話來表達,我想了很久,覺得“模型引導,做多求少”是合適的。不要忽視一句口號的作用,有一個統計學家叫Box,說了一句 “模型總是錯的,但有些是有用的”,各人理解不同,產生許多誤解。
《藥學瞭望》:您在報告提到模型評價的5個維度,或者稱為5種方法,又特別強調第1個和第5個特別重要,為什么?
鄭青山教授:在模型評價上,的確需要綜合的和系統的評估,有關5個維度,這里再重復一遍:一是統計學支撐,要求采用最簡模型,防止過擬合;二是擬合優度,應能夠解釋主要變異,且殘差無系統性結構異常,如傘形;三是模型穩健性,要通過Bootstrap法驗證數據輕微變化或擾動時,不引起參數大幅變動;四是預測可靠性,通過可視化預測檢驗,評估三個預測區間的分離度和實測線位置;五是專業合理性,要求參數和結果具有可解釋性,結果符合邏輯或機制,與外部數據保持一致性。
現在的問題主要出在第1和第5種方法。第1種是統計學問題,許多年青同行對統計學概念認識不深,在建模之前,對于關鍵變量進行暴露-效應(E-R)數據檢視時,看到P>0.05,則認為,模型不成立,不能建模,無法建模,無E-R關系,如此等等,從而放棄建模,顯然是不對的。數據檢視是個單因素分析,P>0.05只是提示,暴露變化導致的效應變化沒有統計學意義,或者說,不能解釋效應變化。但是,不代表多因素建模后的結論,即便沒有E-R關系的模型,同樣提供重要信息。
我在報告中的第1個實例,就是一個沒有E-R關系的模型(右圖),結果發現,用藥組0暴露者,與其他不同水平的暴露者,甚至高暴露者,療效一致,提示無效。而右圖中納入了安慰劑人群,反而提示有試驗質量問題,這是多么重要的信息!因此,模型化分析,不但能夠判斷藥物的有效性、安全性,還能判斷試驗質量。一些有爭議的上市藥物,有一個共同特點,就是沒有PK-PD建模與模擬。
![]()
左:暴露變化呈現一個水平效應,即無E-R 關系;右:暴露變化呈現兩個水平效應,E-R 關系存疑,需要進一步支撐。
另外,對于某個協變量模型的參數,其相對標準誤(RSE%)大于50%,表示此協變量的變化所引起的效應變化,沒有呈現統計學意義,但是不一定沒有專業意義,FDA認為可以通過模擬來確認。我國早期的定量藥理學分三大塊:藥動學,藥效學,再通過統計學將兩者關聯,而且定量藥理學家就是統計學專家。所以,定量藥理學工作者掌握統計學知識非常重要的。
《藥學瞭望》:的確如此,那么請談談第5個評價方法的重要性吧。
鄭青山教授:實際上,第5個方法是專業上的可解釋性。先說說試驗統計學的原理,在試驗設計階段,統計學人員通過隨機化方式,將各種混雜因素均衡地分配到各劑量組中,當組間出現藥效差異時,就是源自用藥的不同(或稱處理),所以隨機是統計的基石。而定量藥理學則不同,屬于事后分析,通過建模過程扣除混雜因素,然后去發現暴露水平變化是否會引起效應隨之變化,稱為E-R關系。對于較弱的E-R關系,我們總是很小心,希望在臨床終點以外,增加機制指標的模型,或者從動物實驗,或者從文獻數據獲得證據,形成證據鏈。具有證據鏈的結論,就是穩健的,也是可解釋的。
我報告中的第2個例子也是如此,從臨床數據本身看,PK-PD模型無可挑剔,模型很好地描述了數據,而且具有明確的E-R關系,很顯然,藥物是有效的。但是,與同靶點藥文獻數據所建的模型相比,安慰劑療效太好,用藥組的凈療效太低。注意,不同試驗的凈療效具有良好的可比性。由于模型結果不能被外部數據所解釋,促使申辦方檢測了留置的安慰劑患者血樣,最終發現,部分安慰劑與試驗藥搞混了。這種事件在早期試驗,已發生多起,好在沒有造成誤判。可見,模型結果的可解釋性,或者說建立證據鏈,是多少重要!
《藥學瞭望》:就第2個例子的模型來說,這是一個正確模型,還是錯誤模型?
鄭青山教授:還是回到Box那句話,“模型總是錯的,但有些是有用的”。我讀了他的傳記,發現他的真實意圖是,鼓勵建模,小心誤用。但是,用“對和錯”去評價模型,容易讓人產生誤解。我上面介紹是的2個例子,都不能用對錯去判斷。比如,第2個例子,模型建得很好,如果直接用作決策的話,則產生誤導:藥效很弱,停止開發。但是,外部數據,又讓這個模型提供了線索,否則將不會發現錯在何處。因此,我的結論是:模型無關對錯,重在提供證據。
專家簡介
鄭青山
上海中醫藥大學
博士,教授,博士生導師,上海中醫藥大學藥物臨床研究中心主任
中國藥理學會定量藥理學專業委員會主任委員
第3屆和第5屆國際定量藥理學和新藥評價會議的大會主席
第一屆中日韓定量藥理學會議(A3 Symposium)主席;9種重要期刊編委,包括中國藥理學報 (英文)、中國新藥雜志、DIA Global Forum、藥學學報、中國藥理學通報、中國臨床藥理學雜志、中國循證醫學雜志、中國臨床藥理學與治療學雜志、藥物不良反應雜志
參與起草國際指南“計算機化系統在新藥研究中的應用”。
??? 主要從事定量藥理學和臨床藥理學研究,即基于模型化與模擬化手段,定量評價中藥臨床藥效學、藥動學和復方配伍的相互作用動力學。已發表論文200余篇,SCI論文50余篇,單篇最高引用超過490次;省部級科技進步二等獎2項。與孫瑞元教授所主編的大型定量藥理學計算軟件(DAS),用戶發表應用論文引用此軟件已達16400多次。主持過國家和省部級課題多項。
添加藥學瞭望管理員
進入學術交流群
《藥學瞭望》征稿邀請
01.投稿內容
征稿內容不限于:研究進展、團隊科研成果、臨床用藥經驗分享、典型病例解讀、疾病診治經驗、人文故事等
02.聯系人
投稿 | 學術報道 | 合作
投稿聯系人:劉老師 15201320201(微信同號)
投稿郵箱:contact@siri.ntesmail.com
(來源:藥學瞭望)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.