![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第14節,上一節的內容學完之后這節課的內容就是水到渠成,我們一步步講講如何做圓形分布,包教包會!
好的,我們繼續上一節的內容
舉例,我們有這樣一份6年的監測數據,我們知道每一年每個月的病例數。
![]()
第1步:數據轉換
將法定報告傳染病的發病時間轉換為角度。比較簡單粗糙的方式就是按照一年為360天計算,1個月按照30天計算。1個月相當于3°,每個月的中值折算成度可得到相應的角度。即1月份為15、2月份為45、3月為105這樣,其實公式就是15+30*月份。
如果比較精細一些,就需要考慮大小月和閏年,一年并不是360天而是365天,一天也并不1°,而是360/365°,所以各月的月的中值度數就應該按照下面這樣計算。
1月=31/2 *(360/365)
2月=1月月中值度數+(31/2+28/2)*(360/365)
3月=2月月中值度數+(28/2+31/2)*(360/365)
4月=3月月中值度數+(31/2+30/2)*(360/365)
也就是說 本月月中值度數θ=上月月中值度數+(上月天數/2+本月天數/2)*這一年1天代表的度數也就是360/365,舉例數據計算如下:
![]()
第2步:計算每月月中值度數的正弦值和余弦值。
這是圓形分布計算的核心。
我們有了每個月的月中值角度(θ),現在要計算這個角度在X軸(余弦cos)和Y軸(正弦sin)上的投影分量,這樣我們就可以用向量加法來求平均方向了。
正弦值 (sin):=SIN(RADIANS(θ值))(Excel三角函數用弧度,所以RADIANS函數的目的就是將角度轉弧度)
余弦值 (cos):=COS(RADIANS(θ值))
![]()
第3步:求sin和cos的均值
實質上可以理解為加權平均向量,采用excel中的函數SUMPRODUCT,這個函數的的意義就是在給定的幾組數組中將數組間對應的元素相乘并返回乘積之和。相當于每個月的病例數乘以當月正弦值,目的就是病例數多的月份,其方向應該對平均方向的貢獻更大,所以要“加權”,然后除以病例總數。
隨后算出的平均sin值-0.19就相當于所有數據點在Y軸(正弦)方向的平均投影長度。平均cos值-0.39就相當于所有數據點在X軸(余弦)方向的平均投影長度。
![]()
第4步:計算平均角度
首先計算tan值,它=平均sin/平均cos, 然后通過正切值反推平均向量的角度。但要注意,因為正切函數的周期是180°,直接反算會無法確定角度所在的象限,需要根據sin和cos的正負號來判斷。
這一步利用的是excel中的反正切函數,函數公式為=DEGREES(ATAN(正切值))",計算出反正切值。
其中函數ATAN的意義為返回反正切值,返回的角度值將以弧度表示,,DEGREES函數的意義為將弧度轉換為角度。
然后根據sin和cos的正負值判斷所在象限,最終確定角度。比如本例子中sin和cos均為負值,推算在第三象限,所以平均角度25.71+180,最終角度為205.71,最終平均角度計算原則如下。
![]()
![]()
第5步:計算集中趨勢指標r和離散趨勢指標S角離差
集中趨勢指標r計算公式如下,
![]()
也就是平均sin的平方+平均cos的平方再開根號。
![]()
離散趨勢指標計算公式如下,
![]()
excel中的操作如下:
![]()
第6步:計算高峰日和高峰期開始結束時間
這一步其實就是利用上面的平均角度和角標準差,分別計算出高峰期是哪一天以及高峰期開始的日期和結束的日期。
使用的日期公式為使用=DATE(年份, 1, 天數)。例如,2010年第223天是=DATE(2010,1,223)。
![]()
第7步:顯著性檢驗
檢驗計算出的高峰期是不是由于偶然因素造成的,如果檢驗不顯著,即使算出了一個高峰日,也可能沒有實際意義。瑞利檢驗(Rayleigh's test)是圓形分布最常用的檢驗方法,計算公式如下。
![]()
這樣就計算出了檢驗統計量Z值,現在需要求P值,瑞利檢驗P值可以用≈
exp(-Z)進行計算,EXP是指數函數(Exponential function),表示自然常數e的冪運算。
也可以簡單理解Z0.05=2.9957,所以可以說算出來的Z值>2.9957,就可以說有統計學意義,表示平均角存在。
![]()
重要注意事項
第一,適用前提:該方法主要適用于呈現單峰分布的季節性數據。對于一年有雙峰(如春、秋兩季高峰)的疾病,需考慮對數據分層后再分別分析。
第二,r值解讀:r值無單位,其大小僅表示集中程度。需結合Rayleigh's檢驗的P值判斷其是否顯著。
第三,結果可視化:強烈建議繪制圓形直方圖或玫瑰圖,可以直觀展示數據在圓周上的分布,高峰方向一目了然。
總結
圓形分布法以其獨特的“圓形思維”,完美解決了時間周期性的分析難題。它不再將1月和12月武斷地割裂,而是尊重了季節循環的本質。通過一場生動的“時間拔河比賽”,它將抽象的日期轉化為直觀的方向和力度,最終告訴我們:疾病在何時集中爆發,以及這種爆發的勢頭有多強勁。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.