![]()
認知神經科學前沿文獻分享
![]()
基本信息
Title:Reliable research in the social and behavioural and sciences
發表時間:2026-04-01
發表期刊:Nature
影響因子:48.5
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
引言
在既有的學術評價體系中,頂級期刊的發表往往被視為對研究結論真理性的權威背書。然而,2026年4月1日,《自然》(Nature)同期發表的系列研究(共發表4篇,3篇針對社會與行為科學,1篇為優秀生示例),通過對社會與行為科學(Social and Behavioural Sciences, SBS)領域的大規模系統性審計,對這一默認前提提出了挑戰
![]()
可重復性危機
科學研究的第一道基石在于可重復性(Reproducibility),即基于原作者提供的原始數據與分析代碼,能否復現原報告中的統計結果![]()
一項針對600篇社會科學論文的基礎審計顯示,僅有24%的作者在發表時主動公開了數據與代碼[1]。當數據和代碼均可得時,精確復現率達77.2%;若僅有數據,該比例降至43.2%;而需要從源頭重建數據時,精確復現率僅為11.0%
![]()
Fig. 1 | Data and code availability by year of publication.
這一現狀揭示了一個嚴峻的問題:當前社會與行為科學研究面臨的首要障礙,并非理論上的證偽,而是因資料不完整導致的不可驗證性或驗證難度較大等問題
![]()
同一份數據分析出不同結論?
![]()
倘若數據不可獲取是基礎設施層面的缺陷,那么另一項研究則揭示了方法論邏輯層面的不確定性。研究者通過組織一項大規模的多團隊協作實驗,針對100項研究,為每項研究匹配了至少5名獨立分析師,并要求他們基于完全相同的原始數據進行分析。結果顯示,僅有34%的研究在不同分析師的統計操作下得出一致結論(Cohen’s d 在原研究的 ±0.05范圍內)[2]
![]()
Fig. 2 | Analytical robustness of the statistical results
在504次獨立重分析中,74%得出了與原研究一致的結論,24%得到無效或不確定結果,2%則給出相反方向;如果把“所有重分析者都與原研究同結論”視為穩健,只有34%的研究達標
該現象指向了“分析師自由度”(Analyst degrees of freedom)的影響。在心理學與腦科學的數據處理過程中,從異常值剔除的閾值設定到統計模型的具體選擇,每一個微觀決策均可能引發結論方向的改變,從統計學意義上的顯著效應轉變為無效應。這表明,相當一部分已發表的科學發現,可能高度依賴于特定的數據分析路徑,其客觀穩健性有待進一步驗證
![]()
跨數據復現性堪憂
![]()
對研究結論最嚴格的檢驗來自可復制性(Replicability,感覺復現性翻譯可能更合適),即采用與原研究相同的方法在新的被試群體中再次測量同一效應。在對274項研究進行的獨立重復實驗中,整體成功率約為55.1%[3]。此外,即便是在成功獲得復制的研究中,新實驗觀測到的效應量(Effect Size)中位數也僅為原始研究報告的一半左右(由0.25降至0.10),當然作者在討論部分明確指出:單次復現失敗不等于原研究一定錯誤,單次復現成功也不等于原解釋一定成立
![]()
Fig. 1 | Replication success rates across 13 binary assessments for papers.
這一數據表明,部分曾引起廣泛關注的心理學效應,在更廣泛的群體驗證中,其實際強度可能較為微弱,難以脫離特定的初始實驗情境。
![]()
理想狀態是什么樣?
![]()
在此次大規模評估中,經濟學與政治學領域表現出顯著優于平均水平的可靠性。研究表明,這兩個學科的計算可再現性超過85%,且在變換統計模型的穩健性檢驗中,72%的結論依然保持成立[4]
究其原因,關鍵在于制度化的政策約束。眾多頂尖的經濟學期刊長期執行強制性的數據與代碼共享政策。當透明度成為發表的前提條件,而非僅憑研究者個人意愿的道德選項時,研究成果的可靠性便獲得了顯著的提升。這一經驗為正在應對可重復性挑戰的心理學及神經科學領域提供了可借鑒的實踐路徑
![]()
以后怎么辦?
上述四項發表于 Nature 的研究并非旨在否定社會與行為科學的價值,而是通過這種系統性的“自我審視”推動科研范式的變革。對于心理學、認知神經科學及相關領域的研究者而言,未來的實踐方向或可關注以下三個維度:
- 從個體分析向多中心協作驗證轉型
。鑒于單一分析路徑可能隱含系統性偏差,未來的研究應鼓勵“多分析師驗證”機制。說白了,試了哪些方法得到什么結果應該通通報道,而不是只盯著有意思的陽性結果報道
第二,推行強制性的數據共享與預注冊制度。借鑒經濟學領域的成功經驗,將原始數據、分析代碼及研究計劃的預注冊(Pre-registration)由可選項轉變為投稿的必要前提,以此從制度層面減少為迎合特定結果而反復調試數據(P-hacking)的空間
第三,重實效應的實際解釋力。在統計推斷中,應避免對P值的過度依賴,轉而審慎評估效應量的實際大小與置信區間。若一項發現的效應僅在實驗室嚴格控制的條件下微弱存在,其在解釋人類認知與行為普遍規律時的外部效度則需重新考量
科學的進步不僅依賴于新發現的提出,更植根于其嚴格的自我糾正機制。《自然》這一系列研究雖然展現了當前研究實踐中存在的問題,但也為構建更為透明、穩健的知識體系提供了清晰的演進路徑
那么回到本次推送的標題,這四篇文章同時發布,三篇直指社會、行為科學存在的問題,一篇高度贊揚經濟學與政治學的相對優勢,雖說存在定量的分析和研究,用詞非常嚴謹客觀,但到底算不算炮轟?大家自行判斷
插一句,我的研究屬于社會與行為科學范疇。既看到學科存在的一些問題,也真心希望它越來越好,所以忍不住多說了幾句。正所謂愛之深責之切,若有不當之處,還請大家多多包涵,也歡迎一起討論!
![]()
參考文獻
[1] Nature. Investigating the reproducibility of the social and behavioural sciences. Nature, 2026.
[2] Nature. Investigating the analytical robustness of the social and behavioural sciences. Nature, 2026.
[3] Nature. Investigating the replicability of the social and behavioural sciences. Nature, 2026.
[4] Nature. Reproducibility and robustness of economics and political science research. Nature, 2026.
分享人:天天
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認知神經科學的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進群,歡迎你的到來
一鍵關注,點亮星標 ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.