![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第23節,也是Serfling回歸的最后一節,我們講講調整Serfling回歸的具體操作。
好的,一切準備就緒,我們現在直接開始 調整Serfling回歸模型具體操作演示。
其實現在很簡單了,前面 Serfling回歸模型如何具體操作我們已經會了,上一節我們也把調整Serfling回歸的步驟講清楚了,現在操作就是手到擒來。
第1步,計算部分自變量
![]()
計算公式和前面Serfling回歸的一模一樣,我們就不贅述了,計算完成之后進行回歸分析。
第2步,回歸分析,得出預測病例數
![]()
使用軟件開展回歸分析,這個時候就可以得出預測病例數以及相應參數,這個時候得出R2為0.67。
第3步,計算第二輪回歸的因變量
![]()
如果實際病例數大于第一輪預測的病例數,就去除這個數據,只保留實際病例數小于第一輪預測的病例數的值作為第二輪的因變量Y。
第4步,再次進行第二輪回歸
![]()
使用軟件開展第二輪回歸分析,以保留的實際病例數小于第一輪預測的病例數的值作為第二輪的因變量Y,自變量不變,進行第二輪回歸。
這個時候就可以得出第二輪回歸的預測病例數以及相應參數,這個時候得出R2為0.88,明顯比第一輪回歸的要大,這個時候就需要第三輪回歸。
第5步,計算第三輪回歸的因變量
![]()
第三輪回歸的因變量計算的時候還是比較,但是比較的對象不是預測值,我認識預測值的95%置信區間上限。
如果實際病例數大于第二輪預測的病例數的95%置信區間上限,就去除這個數據,只保留實際病例數小于第二輪預測的病例數的95%置信區間上限的值作為因變量Y。
第6步,進行第三輪回歸
使用軟件開展第3輪回歸分析,這個時候就可以得出第3輪回歸的預測病例數以及相應參數,這個時候得出R2為0.80,明顯比第2輪回歸的要小,這個時候就不再繼續進行回歸分析,而是以第二輪回歸為準。
相當于就是最終取R2值最大的一次回歸對應的擬合曲線及95%CI的上限作為最終的基線病例數及流行閾值。至此,我們回歸的參數都有了,擬合曲線及95%CI的上限也有了,就可以計算超額發病數。將時間軸拉長進行計算,然后我們就可以進行預測接下來時間的病例數了。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.