網易首頁 > 網易號 > 正文申請入駐

一場千萬網友的賽博涂鴉，藏著預測系統崩潰的密碼

2026-04-08 11:01:00　來源: 返樸

北京舉報

分享至

金融市場暴跌，生態系統失衡……如果一個系統即將崩潰，它會提前“露出馬腳”嗎？在混亂的數據中，我們能否提前捕捉到那些細微但關鍵的信號？近期，研究人員通過網絡論壇的一項在線“畫圖游戲”，引入可解釋的機器學習框架，試圖預測何時“風險降至”，并且希望解釋機器學習背后的“黑箱”。

撰文 | 郭瑞東

一個愚人節游戲成為大型社會實驗

要論愚人節互聯網公司玩出的花活，Reddit搞的r/place值得一說。他們給出一塊100萬像素的空白巨大畫布，每個用戶每5分鐘會得到一個機會，可以在上面更改一個像素的顏色（圖1）。由于有時間限制，即使是畫出一個10*10像素的圖畫，也需要500分鐘，可這8個多小時中，說不定會有別的搗蛋者修改你圖畫中的像素——要想在r/place中畫出圖案，唯一的辦法是團隊合作。

從2017年的第一次活動，到2022年，畫布規模已擴展到400萬像素，顏色也增加到32種。在2022年活動開始的三天半的時間里，有1040萬參與者共同完成了約1.6億次像素修改。網友們自發組織，在畫布創作了約 10,900 個作品。從游戲角色到國家旗幟，從動漫人物到藝術二創，每個作品背后都是一個有組織的在線社區。

圖1 圖像產生過程丨圖源：參考文獻[3]

這項千萬人參與的社會實驗，為人類集體行為的研究提供了素材。當社區A精心繪制的《星球大戰》海報突然被社區B用純色塊覆蓋時，一個臨界轉變（critical transition）就發生了（圖2C），而研究者想要研究的就是這樣的臨界轉變點。在經濟學中，臨界轉變可能表現為市場突然崩盤，在電力系統中則可能體現為局部故障迅速級聯擴展，最終導致大范圍停電。如能成功地檢測臨界轉變的早期跡象，可以使相關人員做好準備，減輕甚至避免此類轉變。

圖2 畫布的演化及找到的臨界轉變點丨圖源：參考文獻[1]

r/place游戲意外地為科學家提供了一個前所未有的機會：同時觀察由具有反身性的個體組成的數千個子系統（每個作品）的臨界轉變。在現實中，我們幾乎無法同時觀察數千個市場，看它們何時突然崩盤，但在r/place中，數據結果是公開、精確且高分辨率的。r/place的實驗記錄相當于給研究者提供了“上帝視角”的實時數據庫，構圖的更新迭代就是微型社會的集體行為縮影，為研究人類社會的臨界轉變提供可控的實驗場景。

用可解釋機器學習預測人類行為

傳統上對臨界轉變的研究，多聚焦在地質、氣候及生態等不包含人與人群相互影響的系統中。這些系統在臨界轉變發生之前，描述系統狀態統計量的方差和自相關性會顯著增加。這種被稱為臨界慢化（critical slowing down）的現象，曾被視為臨界轉變的普適性前兆信號，當系統面對外界擾動的恢復速率顯著降低時，系統的波動和耦合增加，預示著臨界點即將到來。

但人類社會中，這套預測方法失效了。就拿r/place來說，有組織攻擊是“突發沖擊”，不是逐步累積的；另一方面，轉變可能是因為防御方主動撤退，并非系統失穩。

既然人類行為的復雜性超出了單一理論的解釋范圍，那預測的時候，就需要直接從數據中挖掘模式。2026年1月2日，普林斯頓大學的一個團隊在《美國科學院院刊》（PNAS）上發表了這項社會實驗的研究[1]。研究者開發了一套基于可解釋機器學習的預警系統，試圖從r/place所反映的真實環境學習臨界轉變的數據模式，最終該模型實現了以極高成功率完成對2023年r/place臨界轉變的預測。

研究者首先定義了何時能視作畫面出現臨界轉變（圖3A）：先用過去3小時內，每個像素出現時間最長的顏色作為圖像穩定狀態（稱為參考圖像）；若當前圖像與參考圖像的像素差異比例超過35%（體現實質性改變，而非小修小補），且是過去3小時平均值的6倍以上（體現突然性），則將該圖像視作發生了臨界轉變。

然后，他們從r/place像素變換的時間序列數據中，手動構建出19個特征，涵蓋圖像動態（偏離度、熵）、用戶行為（修改次數、新用戶比例）、攻防博弈（攻擊強度、恢復率）、歷史記憶（過去7小時加權平均），這些特征相當于機器學習算法的數字感官（圖3B）。

圖3 該研究的數據處理流程包括定義臨界轉變，篩選輸入數據，訓練決策樹模型，預測臨界轉變及使用SHAP為預測給出解釋。丨圖源：參考文獻[1]

接下來，研究人員開始構建機器學習模型，其預測目標并非簡單判斷是否將要發生臨界轉變，而是預測距離下一次臨界轉變還剩多少時間（圖3D），這種設計將使預測準確性（即預測值和真實值的差異）更容易評估。

最后研究者通過可解釋機器學習，對模型納入的特征按照其對預測結果的重要性進行打分，以找出哪些因素能夠預測臨界轉變的發生（圖3E）。

模型訓練好后，預測結果顯示：距離臨界點越近，其預測準確性越高。在20分鐘預警窗口下，誤報率僅3.6%，而該模型最遠可以提前6小時給出預測，這是傳統方法難以實現的（圖4）。研究者使用2022年數據訓練的模型，直接用于2023年實驗，模型性能僅輕微下降，這一結果證明該模型捕捉到人類協作的通用規律。

圖4：模型的預測準確性對比丨圖源：參考文獻[1]

促成臨界轉變的6種特征模式

本研究最大的特點是達成了模型“可解釋”。機器學習常被詬病為“黑箱”。但該研究中，每次預測中哪些特征的貢獻最大，可通過SHAP進行評估。SHAP值來源于博弈論，通過考察如果加入這個特征，預測準確性會增加多少，以評估新加入特征對預測的重要性。通過SHAP值，能夠將抽象的機器學習預測“翻譯”成了人類可讀的定性預警規則或“行為模式”。

r/place上大部分圖案的臨界轉變，對應的都是社區之間的攻防戰——防守方試圖在畫面上維持某個圖案，而攻擊方想讓圖案消失。研究者通過對預測過程中關鍵變量（SHAP值大）的變化趨勢進行分析，結合自身對r/place這個游戲的了解，將轉變前發生的變化分為6類。這6類模式可以對應現實人類社群的行為模式，可能會在金融市場、生態系統等具有現實影響的環境中呈現。因此，這項研究可以為現實情況的臨界轉變提供預警參考。

圖5：6類成功預測臨界轉變對應的特征丨圖源：參考文獻[1]

第一類是傳統上的強烈臨界慢化（圖5A）。該場景下，決定預測準確性的關鍵特征是瞬時圖像與上一時刻的差異比例。當該特征值（即圖像瞬時變化劇烈程度）處于極高百分位（>95%）時，此時它成為最強的預警信號。在轉變前極短時間（20分鐘內），作品圖像的內部波動性達到頂峰，像素顏色在極短時間內頻繁、大幅變化，原本維持圖標的社群開始無法維持穩定圖像。這表明防御方已完全喪失對圖像的控制力，攻擊方的每一次修改都有效，系統處于崩潰邊緣。該結果符合經典理論中的臨界慢化，如同湖泊在富營養化臨界點前，浮游植物生物量出現極端劇烈的日波動；或金融市場在崩盤前出現極端高頻的交易波動。

第二類機器學習提取出的行為模式稱為攻擊力主導（圖5B），其關鍵特征是圖像被攻擊性修改的比例，即改成非參考色的比例。這一特征的異常升高，意味著臨界轉變前夕，對該圖像的修改絕大多數是“攻擊”（改變顏色），而非“防御”（恢復原色），攻擊方形成了壓倒性的力量優勢。而防御社區要么因用戶數不足或意愿低下無心干預，要么反擊無效。這種模式在現實中也存在，比如外來入侵物種的繁殖速率遠高于本地物種的恢復速率，導致系統結構被快速重塑。

第三類模式是溫和的臨界加速（圖5C），其特征是上一時刻被攻擊像素在本時刻恢復的比例。當這一比例處于中等偏高值時，其對預測臨界轉變重要性最高，而比例過低和過高時，該指標的重要性下降。這是一個有趣的發現，對應的情景是在攻擊初期，防御社區反應迅速、動員充分（被修改的像素很快恢復）。從表面看這是趨于穩定的跡象，但模型將其識別為預警信號，可能是因為這種“高強度防御”恰恰是攻擊已形成一定規模，迫使防御方進入總動員的標志，是沖突升級的體現。類似的情形也出現在電力系統中。當局部線路負荷過高時，調度系統可以通過快速重分配負荷或頻繁啟用備用線路來維持整體穩定。雖然系統仍保持正常運行，但這種高強度調度往往意味著系統已經處于緊張狀態，一旦新的擾動出現，更容易觸發級聯故障。

第四類臨界轉變特征模式是“創新真空”（Lack of in-group innovation，圖5D），對應的特征是當前處于非參考顏色（即被攻擊狀態）的像素，自被攻擊以來平均已經過去了多長時間。當該值非常高時，即像素長時間處于被攻擊狀態而未被恢復，其對應的平均SHAP值急劇升高，成為強烈的預警信號。這意味著，被攻擊的像素“賴著不走”的時間越長，機器學習模型就越確信一個致命的轉變即將發生。

創新真空模式反映的是臨界點出現之前，防御方只會進行最低限度的、機械的“修復”工作——即把被改色的像素填回原來的“參考顏色”。他們沒有意愿或沒有想象力去“創新”。在一個動態對抗環境中，靜止就是倒退。當攻擊方不斷嘗試新顏色、新圖案、新戰術時，一個只會機械回填的防御方必然會被拖垮。攻擊方可以輕易地通過持續施壓，耗盡防御方的熱情和資源，最終完成圖像的全面替換。對應到商業世界中，就是一家公司面對市場顛覆（“攻擊”），如果只會機械地維護舊產品線（“回填”），而沒有研發新產品、新商業模式（“創新”）。r/place中的攻擊間距就相當于“市場份額丟失后多久能奪回”，時間越長，破產風險越高。

第五種模式的關鍵指標是冗余修改比例（圖5E），即用戶將像素改成本來就有的顏色。冗余修改比例越高，SHAP值越高（越安全）。這意味著低冗余修改才是預警信號。冗余修改率高通常被認為是“噪聲”或“無意義行為”（比如用戶為了掛名而重復修改）。但模型發現，在穩定作品中，這種“無意義”行為反而存在，且其高比例是穩定的標志。

對此一個合理的解釋是，在一個組織良好的社區中，存在大量“儀式性”或“鞏固性”的修改。成員們通過重復修改關鍵像素（如Logo的輪廓）來宣示主權，以此強化集體認同，維持存在感。這是一種低成本、高頻率的協作信號。當這種信號消失時，意味著社區成員不再進行這種象征性協作，要么是心灰意冷，要么是組織瓦解，集體行動能力喪失——這是社區凝聚力崩潰的早期指標。就像一個活躍的在線論壇，不僅要看發帖量，還要看“灌水”帖、表情包大戰、版聊等“無意義”互動是否頻繁。這些“噪音”的消失，往往是社區活力衰竭的先兆。

最后一個能預測臨界點的特征，是衡量圖標中顏色分布的隨機性/復雜性的熵變低（圖5F），即顏色分布越簡單、越有序、越單調，預警信號越強。這是由于簡單圖像（如純色塊、幾何圖形、文字）結構冗余度低。特別是對于簡單圖像，一個關鍵像素被攻陷，可能迅速引發連鎖反應，導致圖像整體結構崩塌。而復雜圖像（如有細節的繪畫、照片）具有高維度的結構冗余。局部受損不影響整體辨識度，防御方有更多時間和空間進行局部修復而不影響全局。

此外，復雜圖像通常意味著更高的社區投入和更強的身份認同，其防御意愿和資源投入也更持久。在協作創作的過程中，用戶之間產生的是“欽佩”。這種情感模式驅動的是良性嫉妒（benign envy）或直接的共情與合作，它激勵人們學習、參與和貢獻，而非退縮或攻擊。復雜性降低在現實中的對應是，物種單一的人工林比物種復雜的天然林更容易遭受病蟲害的毀滅性打擊；產業結構單一的國家更容易受到外部環境的影響。

人群行為與物理或生態系統不同，社會系統的預警信號深深植根于人類行為與組織動力學。上述6種模式揭示了為何只使用傳統的臨界慢化無法預測人類行為。例如前述對冗余修改比例的解讀是典型的社會學洞察，在物理系統中基本沒有意義；而第四類創新真空涉及“創新”這一意向性概念。這些分析意味著對社會系統的預警，必須納入“社會資本”“集體認同”“組織韌性”等維度。

黑天鵝事件

人類社會的復雜性，決定了不是每一次臨界轉變都能提前預警。預測算法的性能高度依賴于每個作品獨特的社區動態和歷史，該研究中有27%的臨界轉變完全無法預測。

圖6A中對應的是近乎完美的預測，該圖原本是一個相對復雜、有辨識度的標志性圖案，像某大學橄欖球隊的隊徽。這樣的圖案背后，可能有一個組織有序、有明確身份認同的社區在持續維護，讓畫面最終呈現這個圖案。到了臨界轉變時，圖案被大量單一顏色的像素塊覆蓋，圖像變得混亂，這背后可能是對手球隊社區試圖“攻擊”，想讓這個圖案在畫布上消失。這個作品可能經歷了一個典型的“臨界慢化”過程：在攻擊初期，防御社區反應迅速，但隨著攻擊持續，系統恢復力下降。因為這是一個有組織、有穩定狀態的社區作品，因此算法能夠在相當長的時間內準確預測，預測值和實際值相差不多。

圖6：不同圖案的預測準確性

但在圖6B中，預測值在時間軸上劇烈振蕩，上下波動極大，完全沒有隨著真實臨界轉變的發生時間臨近而收斂。這表明算法完全無法判斷該作品何時會轉變，其預測毫無規律可循。對此，研究人員猜測“圖案1886”背后的社區缺少組織，從不同時間點的快照可以看出這個圖案一直在變動，沒有清晰的“被攻擊-防御”模式；或者始終處于一種高頻率、低強度的像素修改狀態。而真正這個圖案消失的，是一次偶然卻有組織的大規模外部攻擊，可能是一個大型社區看上了這塊畫布，想用這塊畫布來創作自己的圖案。該事件在歷史數據中沒有可學習的先驗模式，屬于真正的“黑天鵝”事件，因此預測算法失靈了。

圖6C中的圖源于音樂專輯，可能由某個音樂愛好者小圈子維護。發生臨界轉變前，畫面長期保持穩定，僅有極微小的修改。這一狀態表明該作品長期被忽視，預測模型給出該圖案距離臨界點發生始終有幾個小時，然而轉變可能發生得非常突然，例如被一個大型社區用純色塊瞬間覆蓋。該圖的轉變可能由外部投機攻擊（opportunistic attack）引發：攻擊者發現了一個無人防守的“空地”，其成功與否并不取決于創作作品的社群本身的“健康指標”，而取決于攻擊者的外部決策和資源投入，這導致模型無法從該作品自身歷史中進行預測。

預測失敗的案例，再次說明社會系統的臨界轉變是異質的，其預警信號也是多元的，并非所有臨界轉變都可預警。任何預警系統都必須正視這種異質性。在包含人類行為的系統中，“可預測性”不僅僅取決于模型本身的復雜度，更在于社區是否形成了可識別的、有規律的動態模式。如果社群行為本身是完全隨機，不可預測的，那么從系統數據中預測未來將變成本質上不可能的任務。預警系統永遠有漏報，管理者必須接受這種不確定性。

小結

r/place像是一面數字哈哈鏡，放大了驅動人類社會走到今天的最原始的動力，例如創造、防御、攻擊、倦怠等，這些因素在現實生活中都有體現。PNAS發表的這項研究表明，使用可解釋機器學習識別早期預警信號數據驅動方法可以補充或輔助傳統理論框架，也為未來在其他領域的應用探索奠定了方法基礎。

從方法論來看，該文指出機器學習確實能學到了真實、可理解的模式，而非僅僅是數據中的虛假相關（過擬合）。SHAP可解釋性揭示的模式與領域專家（熟悉r/place的社區動態）的直覺是吻合的（如簡單圖案易被攻破、社區無組織則圖案脆弱）。人類研究者通過結合領域常識，能將機器學習可解釋性分析的結果轉化為科學理解。這項研究不僅論證了“機器學習預測得準”，更進一步回答了“為什么準？背后發生了什么？”，從而增進了對r/place背后社群動力學的科學理解。

基于r/place的數據，對人類行為的研究還有不少，比如文獻[3]關注畫面創作過程，該研究發現畫面生成過程中既有自上而下的控制，也存在自下而上的涌現。這項研究告訴讀者，r/place游戲不止是社群之間的攻防戰，還包括了創意，協作。為什么有的團隊能夠通過協作，在r/place上繪出圖案，而有的社群卻沒有成功——群體協作的動力學，或許也可以通過類似的方式進行研究。

參考文獻

[1]Falmagne, G., Stephenson, A. B., & Levin, S. A. (2026). Interpretable early warnings using machine learning in an online game-experiment. Proceedings of the National Academy of Sciences, 123(1), e2503493122. https://doi.org/10.1073/pnas.2503493122

[2]DIGITAL MANDALAS: COMMUNICATION AND AUTHENTIC HUMAN INTERACTION IN REDDITS R/PLACE PLATFORM. (2022). Issues In Information Systems. https://doi.org/10.48009/3_iis_2022_102

[3]van den Hoven, E., & van der Berg, B. (2021). A comparison of happiness and exhilaration: An experience sampling study. Computers in Human Behavior, 121, 106809. https://doi.org/10.1016/j.chb.2021.106809

特別提示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“，可查閱不同主題系列科普文章。

2.『返樸』提供按月檢索文章功能。關注公眾號，回復四位數組成的年份+月份，如“1903”，可獲取2019年3月的文章索引，以此類推。

版權說明：歡迎個人轉發，任何形式的媒體或機構未經授權，不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯系后臺。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.