![]()
系列簡(jiǎn)介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點(diǎn)。所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說(shuō)很多和現(xiàn)在的熱門(mén)監(jiān)測(cè)預(yù)警相關(guān),所以我們這個(gè)系列就叫“監(jiān)測(cè)預(yù)警基礎(chǔ)”。
今天是第14節(jié),上一節(jié)的內(nèi)容學(xué)完之后這節(jié)課的內(nèi)容就是水到渠成,我們一步步講講如何做圓形分布,包教包會(huì)!
好的,我們繼續(xù)上一節(jié)的內(nèi)容
舉例,我們有這樣一份6年的監(jiān)測(cè)數(shù)據(jù),我們知道每一年每個(gè)月的病例數(shù)。
![]()
第1步:數(shù)據(jù)轉(zhuǎn)換
將法定報(bào)告?zhèn)魅静〉陌l(fā)病時(shí)間轉(zhuǎn)換為角度。比較簡(jiǎn)單粗糙的方式就是按照一年為360天計(jì)算,1個(gè)月按照30天計(jì)算。1個(gè)月相當(dāng)于3°,每個(gè)月的中值折算成度可得到相應(yīng)的角度。即1月份為15、2月份為45、3月為105這樣,其實(shí)公式就是15+30*月份。
如果比較精細(xì)一些,就需要考慮大小月和閏年,一年并不是360天而是365天,一天也并不1°,而是360/365°,所以各月的月的中值度數(shù)就應(yīng)該按照下面這樣計(jì)算。
1月=31/2 *(360/365)
2月=1月月中值度數(shù)+(31/2+28/2)*(360/365)
3月=2月月中值度數(shù)+(28/2+31/2)*(360/365)
4月=3月月中值度數(shù)+(31/2+30/2)*(360/365)
也就是說(shuō) 本月月中值度數(shù)θ=上月月中值度數(shù)+(上月天數(shù)/2+本月天數(shù)/2)*這一年1天代表的度數(shù)也就是360/365,舉例數(shù)據(jù)計(jì)算如下:
![]()
第2步:計(jì)算每月月中值度數(shù)的正弦值和余弦值。
這是圓形分布計(jì)算的核心。
我們有了每個(gè)月的月中值角度(θ),現(xiàn)在要計(jì)算這個(gè)角度在X軸(余弦cos)和Y軸(正弦sin)上的投影分量,這樣我們就可以用向量加法來(lái)求平均方向了。
正弦值 (sin):=SIN(RADIANS(θ值))(Excel三角函數(shù)用弧度,所以RADIANS函數(shù)的目的就是將角度轉(zhuǎn)弧度)
余弦值 (cos):=COS(RADIANS(θ值))
![]()
第3步:求sin和cos的均值
實(shí)質(zhì)上可以理解為加權(quán)平均向量,采用excel中的函數(shù)SUMPRODUCT,這個(gè)函數(shù)的的意義就是在給定的幾組數(shù)組中將數(shù)組間對(duì)應(yīng)的元素相乘并返回乘積之和。相當(dāng)于每個(gè)月的病例數(shù)乘以當(dāng)月正弦值,目的就是病例數(shù)多的月份,其方向應(yīng)該對(duì)平均方向的貢獻(xiàn)更大,所以要“加權(quán)”,然后除以病例總數(shù)。
隨后算出的平均sin值-0.19就相當(dāng)于所有數(shù)據(jù)點(diǎn)在Y軸(正弦)方向的平均投影長(zhǎng)度。平均cos值-0.39就相當(dāng)于所有數(shù)據(jù)點(diǎn)在X軸(余弦)方向的平均投影長(zhǎng)度。
![]()
第4步:計(jì)算平均角度
首先計(jì)算tan值,它=平均sin/平均cos, 然后通過(guò)正切值反推平均向量的角度。但要注意,因?yàn)檎泻瘮?shù)的周期是180°,直接反算會(huì)無(wú)法確定角度所在的象限,需要根據(jù)sin和cos的正負(fù)號(hào)來(lái)判斷。
這一步利用的是excel中的反正切函數(shù),函數(shù)公式為=DEGREES(ATAN(正切值))",計(jì)算出反正切值。
其中函數(shù)ATAN的意義為返回反正切值,返回的角度值將以弧度表示,,DEGREES函數(shù)的意義為將弧度轉(zhuǎn)換為角度。
然后根據(jù)sin和cos的正負(fù)值判斷所在象限,最終確定角度。比如本例子中sin和cos均為負(fù)值,推算在第三象限,所以平均角度25.71+180,最終角度為205.71,最終平均角度計(jì)算原則如下。
![]()
![]()
第5步:計(jì)算集中趨勢(shì)指標(biāo)r和離散趨勢(shì)指標(biāo)S角離差
集中趨勢(shì)指標(biāo)r計(jì)算公式如下,
![]()
也就是平均sin的平方+平均cos的平方再開(kāi)根號(hào)。
![]()
離散趨勢(shì)指標(biāo)計(jì)算公式如下,
![]()
excel中的操作如下:
![]()
第6步:計(jì)算高峰日和高峰期開(kāi)始結(jié)束時(shí)間
這一步其實(shí)就是利用上面的平均角度和角標(biāo)準(zhǔn)差,分別計(jì)算出高峰期是哪一天以及高峰期開(kāi)始的日期和結(jié)束的日期。
使用的日期公式為使用=DATE(年份, 1, 天數(shù))。例如,2010年第223天是=DATE(2010,1,223)。
![]()
第7步:顯著性檢驗(yàn)
檢驗(yàn)計(jì)算出的高峰期是不是由于偶然因素造成的,如果檢驗(yàn)不顯著,即使算出了一個(gè)高峰日,也可能沒(méi)有實(shí)際意義。瑞利檢驗(yàn)(Rayleigh's test)是圓形分布最常用的檢驗(yàn)方法,計(jì)算公式如下。
![]()
這樣就計(jì)算出了檢驗(yàn)統(tǒng)計(jì)量Z值,現(xiàn)在需要求P值,瑞利檢驗(yàn)P值可以用≈
exp(-Z)進(jìn)行計(jì)算,EXP是指數(shù)函數(shù)(Exponential function),表示自然常數(shù)e的冪運(yùn)算。
也可以簡(jiǎn)單理解Z0.05=2.9957,所以可以說(shuō)算出來(lái)的Z值>2.9957,就可以說(shuō)有統(tǒng)計(jì)學(xué)意義,表示平均角存在。
![]()
重要注意事項(xiàng)
第一,適用前提:該方法主要適用于呈現(xiàn)單峰分布的季節(jié)性數(shù)據(jù)。對(duì)于一年有雙峰(如春、秋兩季高峰)的疾病,需考慮對(duì)數(shù)據(jù)分層后再分別分析。
第二,r值解讀:r值無(wú)單位,其大小僅表示集中程度。需結(jié)合Rayleigh's檢驗(yàn)的P值判斷其是否顯著。
第三,結(jié)果可視化:強(qiáng)烈建議繪制圓形直方圖或玫瑰圖,可以直觀展示數(shù)據(jù)在圓周上的分布,高峰方向一目了然。
總結(jié)
圓形分布法以其獨(dú)特的“圓形思維”,完美解決了時(shí)間周期性的分析難題。它不再將1月和12月武斷地割裂,而是尊重了季節(jié)循環(huán)的本質(zhì)。通過(guò)一場(chǎng)生動(dòng)的“時(shí)間拔河比賽”,它將抽象的日期轉(zhuǎn)化為直觀的方向和力度,最終告訴我們:疾病在何時(shí)集中爆發(fā),以及這種爆發(fā)的勢(shì)頭有多強(qiáng)勁。
![]()
![]()
編輯:普通疾控人 | 審核:詩(shī)酒趁年華
文章來(lái)源 | 原創(chuàng)
說(shuō)明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來(lái)自公開(kāi)網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營(yíng)
重點(diǎn)關(guān)注國(guó)內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說(shuō)明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.