隨著包括多種非動物方法在內的新方法學(NAMs)的出現,毒理學領域正經歷一場范式轉變。這一轉變主要源于傳統動物毒性測試在評估人類健康風險方面存在局限性,亟需尋求突破。
在過去5年中,以“NAMs”為唯一關鍵詞在PubMed上檢索,可獲得近1000篇相關文獻,數量從2020年的156篇增長至2024年的近兩倍。這些研究大多表明,NAMs有望減少對動物試驗的依賴,并可能更準確地預測化合物在人體中的反應。全球監管機構也在鼓勵在監管場景中探索使用NAMs:FDA在2025年4月發布的路線圖中明確提出,通過強調使用NAMs逐步淘汰動物測試;2022年簽署生效的《FDA現代化法案2.0》也鼓勵采用動物測試替代方法,以推進“3R原則”(替代、減少、優化)。
目前,各類NAMs已得到積極開發或評估,包括計算機模擬方法、體外測試、高通量與高內涵篩選、組學技術以及微生理系統(MPS,如器官芯片)等。盡管人們已討論過各類NAMs的相對優勢,但缺乏基于常見藥物對不同NAMs進行的公正、直接對比研究。
藥物性肝損傷(DILI)是藥物安全性的重要關注點,是導致藥物撤市和研發終止的主要原因。近50%因DILI在臨床試驗或上市后監測中失敗的藥物,其風險未被臨床前動物研究預測到。因此,DILI已成為NAMs(尤其是體外NAMs)研究最廣泛的終點之一。
鑒于目前有多種體外NAMs用于DILI預測,一個核心問題隨之產生:這些方法(無論是單獨使用還是聯合使用)是否已具備條件,可作為動物研究的可行替代方案,用于DILI評估以支持藥物研發乃至監管應用?
FDA將體外NAMs與動物模型(傳統方法)、微生理系統(MPS,目前最復雜的NAMs)進行了對比分析,同時也對不同NAMs方法進行了比較,旨在評估它們在人類DILI評估中的相對表現。
體外NAMs與動物模型的對比
為評估體外NAMs作為動物試驗替代方案的潛力,FDA將6種體外NAMs與3項基于動物數據的研究進行了對比。
主要對比了預測人類DILI的表現,結果如下圖所示。體外NAMs的準確性介于54%至93%之間,而動物試驗的準確性僅為37%至44%。初看之下,體外NAMs的表現通常優于動物模型,這與此前多項研究結論一致。
![]()
以上數據有一定局限性,主要體現在共同藥物數量有限。體外NAMs與動物研究之間的對比僅涉及少量共同藥物,有時甚至不足5種,這可能導致兩者可比性評估出現偏差。
為實現客觀比較,FDA完全基于體外NAMs與動物測試之間的共同藥物進行分析。FDA主要參考了Fourches等人的研究,該研究同時提供了嚙齒類(大鼠、小鼠、豚鼠)和非嚙齒類(犬、猴、豬)動物數據。為與監管毒理學中常用的主要動物模型保持一致,FDA聚焦于嚙齒類動物數據。
如下表所示,僅2種體外NAMs(HepG2_Pfizer和Spheroids_AZ)的準確性與動物模型相當或更高,其余4種表現更差。體外NAMs與動物模型在DILI分類上的一致性差異顯著,介于18%至66%之間。需注意的是,這些發現受限于體外NAMs與動物研究之間重疊化合物數量有限。
![]()
值得注意的是,HepG2_Pfizer和Spheroids_AZ均采用多參數進行DILI分類,前者采用HCS細胞參數、細胞核計數、DNA含量、鈣(含量/水平)、線粒體膜電位、質膜通透性等參數,后者采用細胞毒性IC50、BSEP、THP1、Glu、cLogP、Cmax等參數。這些多參數方法在預測人DILI結果時,表現與動物評估相當甚至更優。可能的解釋是:DILI是一種多因素疾病,準確評估需依賴能適當涵蓋多種潛在機制的方法。這也暗示了單獨使用單終點檢測評估復雜毒性的局限性,單終點檢測可能僅與特定DILI機制相關,無法識別由其他途徑引起的損傷,導致評估藥物整體DILI風險的預測能力下降。例如,聚焦線粒體毒性的檢測可為識別通過線粒體功能障礙引發肝損傷的藥物提供有價值信息,但無法準確分類通過膽汁酸穩態紊亂導致DILI的藥物。
因此,有研究認為,針對特定機制的NAMs應聯合使用以實現全面的DILI評估。這些多參數方法整合了線粒體功能障礙、細胞活力、氧化應激等多種機制終點,從而廣泛覆蓋了導致DILI的通路。在此背景下,基于多參數的檢測(如可捕捉這些多種機制終點的“細胞繪畫(cell painting)”技術)有望成為有效的DILI體外NAMs。
假陰性率與假陽性率的對比及應用啟示
為了解NAMs在藥物研發中的應用價值,比較了體外NAMs與動物模型的假陰性率(FNR)和假陽性率(FPR)。FNR指人類DILI陽性藥物被模型錯誤預測為陰性的比例。FPR指人類DILI陰性藥物被模型錯誤預測為陽性的比例。這兩個指標對藥物候選物的篩選決策至關重要,高假陰性率可能因推進失敗候選物而增加成本;高假陽性率則可能導致潛在候選藥物的錯失。
結果很有意思,體外NAMs的假陰性率普遍高于動物模型。動物模型的假陽性率則始終高于所有體外NAMs。如果企業優先目標是減少后期研發失敗,避免高成本付出,動物模型可能更有效,因為它“寧可錯殺,絕不放過”。若目標是避免過早淘汰有潛力的候選物,體外NAMs可能是更好的選擇。
微生理系統(MPS)與體外NAMs的比較
MPS試圖模擬肝臟等人體器官的結構和功能,為研究藥物效應提供具有生理相關性的平臺。包括肝芯片技術在內的近期研究均顯示了MPS在DILI評估中的潛力,但在DILI預測方面,其相較于體外NAMs的比較優勢仍不明確。
Ewart等人的研究是目前公開可得的最大規模MPS-DILI研究(以下簡稱“MPS_Emulate”)。FDA將6種體外NAMs與該研究進行了對比。通過對具體藥物預測情況的分析,發現了以下關鍵結果:
托卡朋與曲格列酮:MPS_Emulate和大多數體外NAMs(6種檢測中的5種)均正確將其預測為DILI陽性。托卡朋曾用作帕金森病的輔助治療藥物,后因肝毒性被撤市。
左氧氟沙星:包括MPS_Emulate在內的大多數NAMs均一致將其錯誤分類。左氧氟沙星是一種氟喹諾酮類抗生素,可通過特發性方式引起肝損傷。盡管并非所有體外NAMs都分析了該藥物,但納入分析的NAMs(包括MPS_Emulate)均對其做出了錯誤預測。
希美加群:MPS_Emulate正確將其預測為DILI陽性,但大多數體外NAMs未能做到。希美加群是一種口服直接凝血酶抑制劑,因肝毒性被撤市。6種體外NAMs中有4種分析了該藥物,其中3種對其做出了錯誤分類。
他克林:大多數體外NAMs正確將其預測為DILI陽性,但MPS_Emulate未能做到。他克林是首個獲FDA批準的阿爾茨海默病治療藥物,因肝損傷風險過高而停用。5種分析了該藥物的體外NAMs中,有4種正確將其識別為DILI陽性,而MPS_Emulate則預測失誤。
MPS通常被視為更先進的NAMs形式,FDA原本期望通過分析揭示其相較于傳統體外NAMs的潛在優勢。然而,由于MPS_Emulate模型中測試的化合物和藥物與體外NAMs的重疊數量有限,目前的數據尚無法有效評估MPS與體外NAMs在何種情況下更適合評估DILI風險。
FDA推測,沒有任何一種NAMs能在所有藥物的DILI預測中表現最優,這也強調了在藥物安全性評估中采用互補方法以提升預測性能的重要性。
體外NAMs之間的兩兩比較
為明確體外NAMs在測試藥物的重疊數量及DILI分類一致性方面的異同,FDA對其進行了兩兩比較,結果如下圖所示。
![]()
不同檢測之間的共同測試藥物數量差異顯著:多數情況下不足50種,僅Spheroids_AZ研究與Spheroids_Genentech研究的共同藥物達到77種。不同實驗室間測試藥物的重疊數量有限,為得出具有統計顯著性的結論帶來挑戰。實踐中,此類比較通常需要至少50個配對樣本才能獲得可靠估計。
此外,DILI分類標準不一,一致性差異顯著。體外NAMs之間的DILI分類一致率(即兩種研究在所有共同評估藥物中分類結果相同的比例)差異較大,介于21%至92%之間。
另外,易致DILI的治療類別未得到充分覆蓋。研究表明,DILI在某些治療類別中高發,如心血管系統藥物、全身用抗感染藥、抗腫瘤藥及免疫調節劑、肌肉骨骼系統藥物和神經系統藥物。因此,用于DILI評估的NAMs應充分覆蓋這些易致DILI類別中的藥物。FDA對每種檢測所分析的治療類別進行了檢查,發現這六種檢測對上述五類藥物的覆蓋并不均衡。
總之,不同體外NAMs的藥物數據集重疊量小、缺乏藥物對評估以及易致DILI治療類別覆蓋不足,限制了FDA得出“哪種NAMs在預測DILI方面最可靠、最有效,從而可作為藥物研發中動物測試的穩健替代方案”的明確結論。DILI評估用NAMs的開發還需要更全面、系統的數據積累、覆蓋。
DILIference:一份推動DILI NAMs發展的基準清單
對文獻數據的分析表明,盡管NAMs在DILI評估中展現出潛力,但在確定可作為動物模型替代品、用于預測人類DILI的可靠方法方面,仍存在重大挑戰。一個關鍵局限性在于缺乏標準化的參考藥物清單,而這對于確保評估的無偏性至關重要。Baudy等人提出了一份包含20種化合物的清單,作為肝臟微生理系統(MPS)的基準;而Segavia-Zafra等人則推薦了20種對照化合物(10種DILI陽性、10種DILI陰性)用于臨床前DILI評估。通過FDA的分析,FDA推薦了一份規模更大的清單作為NAMs的基準,將其命名為“DILIference”。
詳見:www.drugdiscoverytoday.com
DILIference清單的特點包括:1)包含大量藥物,以確保統計相關性;2)覆蓋了DILI問題較為突出的主要治療領域;3)包含化學結構相似但DILI特征不同的藥物對,以評估NAMs的分辨能力。DILIference不僅能評估不同NAMs之間的整體差異,還能評估它們對細微但關鍵變化的敏感性,最終提升其在預測人類DILI結果方面的實用性。
具體而言,DILIference包含107種獨特藥物,其中包括89種單一藥物和14種藥物對,這些藥物均從17篇文獻中篩選而來。這些藥物的DILI分類是基于對美國FDA標簽文件的詳細分析確定的。
最后
NAMs因其在減少動物使用方面的潛力而受到廣泛推崇,并可能對未來的監管應用產生重大影響。鑒于已研究和發表的NAMs數量眾多且仍在不斷增加,明確其在實際應用中的可靠性,尤其是確定哪些模型最適合監管用途,已成為迫切需求。FDA通過回顧性分析發現:1)在預測人類DILI方面,并非所有NAMs的表現都與動物模型相當,這凸顯了將臨床前策略與藥物開發流程目標相結合的重要性。多參數NAMs可能比單參數方法更能模擬動物模型,這表明通過細胞繪畫等多參數方法,或結合具有機制特異性的NAMs來捕捉DILI機制的復雜性,可能會更好地解決DILI評估問題;2)與MPS的比較,因共有藥物數量有限,難以對它們的相對性能得出結論。未來應通過測試足夠數量的共有藥物,針對具體應用場景開展進一步研究;3)體外NAMs之間的兩兩比較,因所測試藥物的重疊度存在顯著差異(通常少于50種藥物),影響了結果的統計穩健性。這種差異凸顯了對標準化藥物清單(如DILIference)的迫切需求,以便促進NAMs之間的交叉評估,并確保比較結果的一致性和可靠性。
DILIference有潛力解決本研究中提出的關鍵問題,并推動NAMs融入藥物開發過程中的DILI評估,這與3R原則(替代、減少、優化動物實驗)相符。該藥物清單涵蓋了5個DILI高發治療類別、化學結構相似但DILI特征不同的藥物對,以及已知存在性別差異的藥物,可作為DILI評估中方法探索和驗證的參考標準,從而為NAMs的研發提供支持。
引自: New approach methodologies (NAMs) for drug-induced liver injury (DILI): Where are we now?
藥理毒理開發1-7群已滿,想進8群的加微信,備注姓名+企業名稱+專長領域。比如王**+A企業+注冊或毒理。名額有限,已經在1-7群的朋友就不要跨群了。
另外,新建了GLP毒理專題負責人交流群,只有同時滿足GLP機構+專題負責人兩個條件的,方可入群。目前不到300人,還有名額。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.