網易首頁 > 網易號 > 正文申請入駐

監測預警基礎36-移動流行區間大白話理解+R語言實操→徹底理解吃透MEM

2026-06-29 08:44:44　來源: CDC疾控人

陜西舉報

分享至

系列簡介

這是我們一系列原創技術貼，從易到難，每天學習一點。所有內容均為疾控數據分析、科研論文相關，或者說很多和現在的熱門監測預警相關，所以我們這個系列就叫“監測預警基礎”。

今天是第36節，之前我們其實就介紹過移動流行區間法，→

通過這3篇其實基本把移動流行區間法的內容將差不多了，應部分粉絲要求，我們今天再用大白話把整個步驟和關鍵點講一下，另外，我們之前雖然那已經介紹的很詳細了，但是并沒有介紹MEM的R語言操作，我們今天把R代碼補上。

怎么說呢，這一篇的內容比較長，但是收藏這一篇，好好理解，基本上所有關于MEM的內容你就都清楚了！

當然我也相信，除非確有需要，很多人不會看完這篇內容的，有點長（哈哈哈）

之前咱們分三期講了移動流行區間法（MEM）：從核心原理、Excel 手算拆解到閾值計算公式。

不少同行私信留言，希望把整套流程的實際應用，用大白話串一遍，另外關于R的操作也希望講一講。

今天，我們就解決MEM的所有問題！

咱們疾控日常做預警，最常用的就是移動百分位數法 —— 拍定一個 P75、P90 作為閾值，超過就報警。

但這個方法有個繞不開的問題：你沒法說清這個閾值準不準，沒有統一的 “標尺” 去驗證漏報了多少、誤報了多少。

MEM 最大的價值，就是解決了這個問題。但這里必須先糾正一個容易誤解的說法：MEM 并不是能識別出 “真正的、客觀的流行期”。

它的核心邏輯是：先定一套統一的劃分規則，用這套規則給所有歷史年份分別劃出流行期 / 非流行期，把這個劃分結果作為方法內部的參照基準（俗稱 “金標準”）；再基于非流行期的數據算出預警閾值；最后拿閾值和基準比對，算出靈敏度、特異度，量化告訴你 “這個預警線，漏報率多少、誤報率多少”。

簡單說：傳統方法是 “我定個線，報警就完事了”；MEM 是 “我先定一把統一的標尺，再算預警線，還能量化證明這條線有多準”，這也是它被 WHO 推薦、越來越多用于手足口、流感預警的核心原因。

實際操作中，我們通常需要 5-10 年的歷史監測數據，用發病數或發病率都可以，兩者各有優勢。完整操作步驟可以總結為 4 步：

第 1 步：單年數據只能劃流行期，選不出參數
如果只有 1 年的數據，我們確實可以用任意一個 δ 值 + MAP 算法，給這一年劃出流行期和非流行期，這個也就是我們說的金標準。
但核心問題是：你沒有任何依據判斷這個 δ 選得合不合理—— 沒有多年數據做對比，就不知道哪個 δ 對應的預警效果最好。

這就是我們需要 5-10 年多年數據的根本原因：只有多年數據才能驗證參數的好壞，篩選出適配本地流行特征的最優 δ。

第 2 步：遍歷 δ，用回代法初選最優參數
整理好 10 年數據后，第一步是批量篩選最優 δ（我們記為 δ?），對應 R 里的roc.analysis函數。
具體邏輯：我們遍歷幾十個候選 δ 值，對每一個 δ，都統一做三件事：
第一，劃金標準：用這個 δ，給每一年分別劃出各自的流行期 / 非流行期（每年的金標準是獨立的，但劃分規則完全統一）；
第二，算統一閾值：把 10 年所有數據放在一起，算出1 個全局統一的流行閾值—— 這個閾值的計算里，包含了所有年份的數據；
第三，合并算總賬：把 10 年所有周的結果全部混在一起統計，用這個統一閾值和每年的金標準逐一比對，把 10 年的真陽性、假陽性全部累加，算出整體的靈敏度、特異度、約登指數等一套總指標。也就是說我們遍歷的每一個δ都有一套指標。然后，我們選約登指數最高的那個 δ，作為初選的最優 δ?。這一步叫回代法。特點是計算速度快，適合批量篩參數，但結果偏樂觀 —— 因為被檢驗的年份本身參與了閾值計算，相當于 “自己出卷自己考”。
第 3 步：留一交叉驗證，檢驗真實預警能力
選出最優 δ?之后，我們用留一交叉驗證法，檢驗這個參數在真實預警場景下的實際效果，對應 R 里的memgoodness函數，方法選cross
具體邏輯：10 年數據循環跑 10 輪，每一輪都嚴格遵循 “訓練集、測試集分離” 的原則：
第一，單獨拎出 1 年作為測試年，這一年的數據全程不參與閾值計算；第二，用剩下 9 年的數據，以 δ?為參數，按 MEM 規則算出一個獨立的流行閾值；第三，用這個完全不含測試年信息的閾值，去判定測試年每周是流行還是非流行；第四，測試年自身的金標準，同樣用 δ?+MAP 算法劃分，兩者比對，算出這一年專屬的靈敏度、特異度、約登指數。

10 年全部跑完，就能得到每一年單獨的預警效果。這一步的核心原則是：被檢驗的年份，絕對不參與閾值計算，100% 模擬 “用歷史數據預警未來” 的真實工作場景，結果最貼近實戰、最可信。

這個交叉驗證有什么用呀？

它的核心作用是給這個 δ 的模型做性能鑒定、查邊界、找短板。很多人會誤以為 “交叉驗證是為了再選一次最優 δ”，這是典型的誤解。行業通用的流程永遠是：回代法初選參數，交叉驗證評價效果，不會用交叉驗證反過來推翻初選的 δ。

第 4 步：計算最終閾值，落地預警與年度復盤
確認模型效果符合預期后，我們用全部 10 年歷史數據 + 最優 δ?，計算出最終的流行閾值、中 / 高 / 超高流行強度閾值，這套閾值就可以直接用于下一年的日常監測預警。

等新的一年結束后，我們也可以用 δ?+MAP 算法劃出這一年的金標準流行期，復盤當年預警的實際靈敏度、約登指數，再把這一年的數據加入基線，更新下一年的閾值，形成閉環。

第一步：拆分流行季節 —— 給模型 “單峰” 數據
MEM 有個硬性前提：一個流行季節里，只能有一個連續的流行高峰。咱們常見的手足口病、部分地區流感，一年都是雙峰（夏季主高峰、秋季次高峰），如果直接把全年數據扔進去，模型只會認出最高的那個峰，次高峰直接被忽略，算出來的閾值會嚴重偏高。
所以第一步永遠是先拆數據：

看多年平均發病曲線，找到兩個高峰之間的低谷；
把一年拆成兩個獨立的流行季節（比如夏季流行季、秋季流行季）；
后續所有計算，都分開做、各算各的閾值。

就像考試分科復習一樣，語文和數學不能放一張卷子里評分，分開算才準。

第二步：定 δ 參數，劃出統一規則下的 “參照基準”

這是 MEM 最核心的一步，也是很多疑問的起點。

先搞懂 δ 是什么？

δ 就是一把 “尺子的松緊度”，用來控制流行期的長短。它的底層邏輯叫最大累計發病占比法（MAP），大白話講就是：在一個流行季節里，從峰值開始往前后擴連續的周數，每多擴一周，這些周的發病數占整個流行季總發病的比例就會漲一點；當漲幅第一次小于 δ 的時候，就停下來，這一段連續的周數，就是當年的流行期。

δ 越小，尺子越松，流行期劃得越長；
δ 越大，尺子越緊，流行期劃得越短。

有兩個必須明確的關鍵點
第一，規則統一，結果不統一：所有年份用的是同一個 δ 值、同一套 MAP 算法，這是標準統一的核心；但因為每年發病曲線的形狀、峰值、升降速度都不一樣，所以每一年劃出來的流行期起止周、持續長度都是不同的，每年有自己的基準區間。
第二，單年數據選不出最優 δ：只用 1 年數據，隨便給一個 δ，都能劃出當年的流行期；但你沒法判斷這個 δ 劃得好不好、合不合理，因為沒有外部參照。δ 的優劣，必須通過 “預警閾值的準確性” 來衡量，而預警效果的驗證，必須靠多年數據才能實現。
劃出來的這個流行期，就是后面所有計算的參照基準：算閾值要靠它拆分流行前期，驗證效果要靠它當 “標準答案”。
第三步：算流行閾值 —— 找到 “預警啟動線”
基準劃好了，接下來就算咱們最關心的預警閾值，也就是 “超過這個數，就判定進入流行期” 的那條線。

MEM 標準算法是：從所有歷史年份的「流行前期」（流行期開始之前的那段時間）里，一共挑 30 個發病最高的周，算它們算術均數的單側 95% 置信區間上限，這個上限就是流行閾值。

大白話翻譯一下：找歷史上 “非流行階段里發病最高的那些值”，再往上留一點余量（95% CI 上限），得到一條線。正常非流行期，發病幾乎不會超過這條線；一旦超過了，就大概率是真的要進入流行期了，可以啟動預警。

這條線，就是咱們日常監測里最常用的 “預警啟動閾值”。

第四步：算強度分級閾值 —— 把流行分輕重

光知道 “進入流行了” 還不夠，疾控防控是分級響應的，所以 MEM 還能算出三級強度閾值：中流行、高流行、超高流行。

算法邏輯和流行閾值類似，只是數據源換了：從所有歷史年份的「流行期」里，挑 30 個發病最高的周，算它們幾何均數的單側置信區間上限：

40% CI 上限 → 中流行強度閾值
90% CI 上限 → 高流行強度閾值
95% CI 上限 → 超高流行強度閾值

這樣一來，從基線到超高流行，一共 5 個等級，對應不同的防控響應級別，完全貼合咱們分級處置的工作需求。

第五步：參數篩選與效果驗證 —— 回代初選，交叉終檢

這一步是 MEM 的靈魂，也是大家疑問最多的地方。咱們分兩部分講透。

①回代法：快速批量篩參數
你之前用roc.analysis跑出來的每個 δ 一行的結果，就是回代法。
它的計算邏輯（以某一個 δ 為例）

用這個 δ，給所有年份分別劃出流行期（基準）；
把所有年份的數據湊在一起，只算出 1 個統一的流行閾值—— 注意，這里面包含了每一年的數據；
把所有年份的所有周合并在一起算總賬：用這個統一閾值逐周判定流行 / 非流行，和各自年份的基準比對，把 10 年的真陽性、假陽性全部加起來，算出一套總的靈敏度、特異度、約登指數。

為什么每個 δ 只有一套結果？
不是不能算分年的，是完全沒必要。回代法的唯一使命，就是快速對比不同 δ 的整體好壞，幫你縮小參數范圍。它本身就是 “全量數據一起建模、一起檢驗”，本質是 “自己考自己”，就算拆成分年的，也還是每年自己考自己，沒有額外的學術價值。所以 mem 包直接做了合并輸出，每個 δ 對應一行總結果，方便你一眼挑出約登指數最高的候選參數。
特點

計算速度快，適合遍歷幾十個 δ 值；
結果偏樂觀、偏高，因為被檢驗的年份本身參與了閾值計算，相當于 “考前見過原題”；
只能用于初選參數，絕對不能當作最終的模型效能寫進論文。

② 交叉驗證：嚴謹檢驗真實能力

你用memgoodness(method="cross")跑出來的分年結果，就是留一交叉驗證，這是學術論文里唯一認可的效能評價口徑。

它的計算邏輯（10 年數據為例）循環跑 10 輪，每一輪都嚴格獨立：

拿出其中 1 年當 “測試年”，這一年的數據完全不參與閾值計算；
用剩下 9 年的數據，以選定的 δ，按 MEM 規則算出一個流行閾值；
用這個完全獨立的閾值，去判斷測試年每周是流行還是非流行；
和「測試年用同一個 δ 劃出的流行期（基準）」比對，算出這一年專屬的靈敏度、特異度、約登指數。

10 年輪流當一次 “測試年”，最終就得到了每年一套的驗證結果。

這個時候每年都要一套結果，為什么每年各有一套結果？

因為每一年用的閾值都不一樣 —— 驗證 2016 年的閾值里沒有 2016 年數據，驗證 2017 年的閾值里沒有 2017 年數據，10 年對應 10 個不同的閾值、10 次獨立的驗證。它天然就是分年的，因為每一年都是一次完整的 “模擬真實預警”：站在去年年底，用歷史數據算閾值，預判今年的流行情況，完全還原真實工作場景。

特點

結果更保守、更真實，代表模型在未知年份的實際預警能力；
可以看到每年的效果差異，能分析異常年份對模型的影響；
是所有 MEM 類論文通用的效能評價標準。

第六步：落地應用 —— 用歷史閾值預警未來

前面所有步驟都走完，得到一套穩定的閾值，就可以落地用了。真實工作里邏輯非常簡單：

用截至目前所有的歷史數據，算出最終的流行閾值和三級強度閾值；
新的流行季到來后，每周拿到發病數據，和這四條線比對；
對應到哪個等級，就啟動相應級別的防控響應。

這就是 MEM 從歷史數據到一線預警的完整閉環。

1. 別把 “金標準” 當絕對真實的流行期

MEM 的流行期是用統一算法定義出來的參照基準，不是客觀上天然存在的 “標準答案”。它的價值是保證評判規則統一，讓閾值的效果可量化、可對比，不用糾結它是不是 “真正的流行期”。

2. 別混淆回代擬合和交叉驗證

拿回代的靈敏度去寫論文、吹模型效果，是新手最容易犯的錯。記住：回代只是選參數的工具，只有交叉驗證的結果，才能代表模型的真實預警能力。

3. 異常年份別硬塞進基線

比如新冠疫情這幾年，手足口、流感的流行規律完全變了，硬塞進基線里，會把閾值帶偏。可以剔除異常年份單獨建模，再和全數據模型對比，選效果更好的。

4. 別直接照搬外地的 δ 和閾值

不同省份、不同人群的發病水平差很多，δ=2.8 是歐洲流感的經驗值，不是通用金標準。一定要用本地的歷史數據，篩選適合本地的最優 δ，計算本地的閾值。

5. 別把 “流行期劃分” 和 “閾值預警” 混為一談

基準流行期是用 δ+MAP 回顧性劃出來的，是標尺；流行閾值是用來前瞻性預警的工具。不是 “超過閾值就是流行期”，而是 “超過閾值，我們預警認為進入流行期”，對不對要靠基準來驗證。

說實話，我們前面講的太細了，講了太多了，但是我個人感覺講清楚了。

如果你不是實際應用遇到問題，我相信很多人是不會看到這的，如果你看到這，請給我留個言吧！

接下來是R代碼操作，其實也很簡單，

數據整理工作我們就不在R里面進行了，假設你現在有10年的數據，已經整理成下面這樣了，每一行代表每一周的病例數。

R代碼及步驟如下，很簡單的一套代碼

#結束，以上閾值用于新的一年驗證就行，畫圖手動畫圖就行

參考文獻和書籍：

[1]楊鵬, 王小莉. [M]傳染病預測預警技術及實踐案例分析.[M] 人民衛生出版社: 267-275.

[2] 楊筱婷，王龍, 等. 基于移動流行區間法的甘肅省手足口病流行閾值估計及強度分級研究[J]. 疾病監測, 2025, 40(7): 876-882.

編輯：普通疾控人 | 審核：詩酒趁年華

文章來源 | 原創

說明 | 轉載只為分享，如有侵權聯系刪除

轉載請注明

再次轉載請注明出處

科普健康 | 宣傳疾控

本號為多位疾控機構從業者運營

重點關注國內外健康事件

致力于疾控科普

在做好科普服務大眾的同時

做好疾控機構的宣傳

讓更多的人了解疾控，擁抱健康

歡迎加「小編」微信(cdcjkr126com)

本文具體說明

本文為原創內容，文章為個人理解所學，不涉及疫情信息及內部保密數據，發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處，歡迎聯系小編修改、刪除。

更多精彩視頻，盡在“CDC疾控人”視頻號

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.