![]()
系列簡介
這是我們一系列原創(chuàng)技術貼,從易到難,每天學習一點。所有內(nèi)容均為疾控數(shù)據(jù)分析、科研論文相關,或者說很多和現(xiàn)在的熱門監(jiān)測預警相關,所以我們這個系列就叫“監(jiān)測預警基礎”。
今天是第8節(jié),今天專門講一種方法,學會了前面的之后這一節(jié)也很簡單。
每天早上,當你打開疫情監(jiān)測系統(tǒng),一個數(shù)字讓你心頭一緊:昨日流感病例報告數(shù)達到537例。
這是否意味著疫情暴發(fā)?該不該啟動應急響應?
你面對的終極問題是:537例,究竟算不算異常高?
在疾控預警工作中,這個問題的答案,往往不是來自某個固定閾值,而是來自我們今天要講的主角——移動百分位數(shù)。
![]()
在早期預警系統(tǒng)中,我們常設定這樣的規(guī)則:當流感病例報告超過300例時,發(fā)布預警,這個300就是一條“固定紅線”。
它的弊端顯而易見——不能適應變化:不能適應季節(jié)的變化,夏季冬季流感病例報告差異太大了,一個固定線不能滿足冬夏同時使用,其次隨著疫苗接種普及、人群免疫水平變化,疾病的基線本身就在緩慢變化,這個固定紅線也是不能適應這種變化的。
因此,我們需要一條能“隨季節(jié)起伏、隨趨勢浮動”的“動態(tài)紅線”。
移動百分位數(shù)的核心思想不是回答“是否超過多少例”,而是回答“是否超過了歷史上95%的同期情況”。
比如上面的例子,就不是問昨天流感病例數(shù)是不是超過300例,而是問昨天流感病例報告數(shù)在過去5年同期±2天的數(shù)據(jù)中,能排進最高的5%嗎?如果是,那很可能意味著不尋常的事情正在發(fā)生。
![]()
計算其實非常簡單,你會移動平均的計算就會移動百分位數(shù)的計算,只不過把求平均值的函數(shù)變?yōu)榍蟀俜治粩?shù)的函數(shù)percentile。
函數(shù)為PERCENTILE(數(shù)據(jù)集,百分點值), 它的第二參數(shù),是一個介于0和1之間的小數(shù),包含0和1,比如0.9就意味著是90%分位數(shù),這樣我們可以輕松得到這組數(shù)據(jù)的第90%百分位數(shù),0.95就是95%分位數(shù)。
![]()
比如上表數(shù)據(jù),
移動平均回答的是平均水平 是多少?——第5-8周平均23.8例,目的是描述中心趨勢,了解基線水平,
移動百分位數(shù)回答的是異常高的標準是多少?——第90百分位=28.8例,目的是設定預警閾值,判斷是否異常。
在預警系統(tǒng)中:移動平均告訴我們“正常情況”,移動百分位數(shù)告訴我們“異常標準”。
![]()
優(yōu)勢1:自適應季節(jié)變化:這是它最強大的特性以第90百分位為例,閾值自動隨季節(jié)浮動。1月第90百分位 = 6.2% ,流感高發(fā)季,閾值自動升高;7月第90百分位 = 1.8% # 流感低發(fā)季,閾值自動降低。
優(yōu)勢2:對異常值穩(wěn)健假設一起聚集性疫情病例數(shù)比較多,導致某周數(shù)據(jù)異常高,移動平均從20+飆升至50+,數(shù)據(jù)被異常值嚴重扭曲,接下來幾周閾值虛高。而移動百分位數(shù)(第90百分位)雖然也升高,但程度有限,且很快恢復正常。
在疾病監(jiān)測預警中,我們不希望一次暴發(fā)拉高后續(xù)數(shù)周的預警標準,導致真正的二次暴發(fā)被掩蓋,移動百分位數(shù)在這方面穩(wěn)健得多。
優(yōu)勢3:統(tǒng)計意義明確超過第95百分位數(shù)可以理解為“這種情況在歷史上只出現(xiàn)過5%的次數(shù),這個解釋清晰、直觀、有統(tǒng)計學基礎,讓預警決策:
可量化:明確假陽性率(如設為第95百分位,假陽性率理論約5%)
可溝通:向領導匯報時可以說“這種情況百年一遇”
可調(diào)整:根據(jù)響應能力調(diào)整百分位(資源充足用第90位,緊張用第97.5位)
優(yōu)勢4:無需假設分布很多統(tǒng)計方法假設數(shù)據(jù)服從正態(tài)分布,但疾病數(shù)據(jù)常是偏態(tài)的,多數(shù)時間低水平散發(fā),偶爾暴發(fā)形成“長尾”。
移動百分位數(shù)是非參數(shù)方法,不關心數(shù)據(jù)分布形狀,直接從歷史數(shù)據(jù)中“讀取”閾值,特別適合疾病數(shù)據(jù)的特性。
![]()
中國傳染病自動預警系統(tǒng)采用移動百分位數(shù)法作為核心算法之一,其設計精妙之處在于以下工作步驟:
計算當前周(C)的預警閾值:
第一步:取過去3年同期數(shù)據(jù):同周往前:C3, C8, C13 (去年、前年、大前年同周),同時前后擴展:C3的前2周后2周、C8的前2周后2周、C13的前2周后2周。
第二步:這樣共得到:3年×5周=15個歷史數(shù)據(jù)。
第三步:計算這15個值的第P百分位,如P95或者P90。
第四步:比較大小,如果當前值 > 第P百分位就代表觸發(fā)預警。
![]()
移動百分位數(shù)法之所以成為現(xiàn)代預警系統(tǒng)的核心,不是因為它最復雜,而是因為它在簡單性、適應性、穩(wěn)健性之間找到了最佳平衡。
它不試圖預測未來——那是更復雜模型的任務。它只專注回答一個公共衛(wèi)生中最關鍵的問題:“現(xiàn)在發(fā)生的事,是不是不尋常?”
當系統(tǒng)提示“當前值已超過歷史95百分位”時,它其實在說:“根據(jù)過去五年的經(jīng)驗,這么高的情況很少見。
建議你放下手頭不太急的工作,過來看一看。
在疾控工作中,這種基于數(shù)據(jù)、量化風險、及時提醒的能力,正是科學防控的基石。
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權聯(lián)系刪除
?版權聲明 | 部分信息和圖片來自公開網(wǎng)絡
轉(zhuǎn)載請注明
再次轉(zhuǎn)載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業(yè)者運營
重點關注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個人理解所學,不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
轉(zhuǎn)發(fā),點贊,在看,安排一下?8
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.