??一張體積僅1.6MB的GIF表情包(圖一),在開源社區平臺Discourse上被使用246173次后,竟生成了377GB的冗余備份數據,并因突破Linux ext4文件系統的硬鏈接數量65000上限而導致備份機制失效。
這張表情包出自經典美劇《老友記》第九季第20集,畫面中詹妮弗·安妮斯頓飾演的瑞秋聽聞樓頂派對消息后的歡呼場景。由于其生動傳神的表達效果,該表情包在Discourse托管的一個社區中被反復使用,累計調用次數超過24萬次。
問題根源在于Discourse的“安全上傳”機制設計。當文件在不同安全場景間轉移時——例如從私信轉發至公開帖子——系統會生成一個帶有隨機SHA1加密值的新副本。盡管文件內容完全一致,Discourse仍將其視為獨立的新文件處理。這意味著一張熱門圖片在帖子、轉發、私信中不斷傳播時,每次都會觸發新副本的生成。
ext4作為Linux最通用的文件系統,雖然支持最大16TB的單個文件和1EB的文件系統容量,但每個文件最多僅允許65000個硬鏈接。面對24萬次的重復使用情況,Discourse的去重方案無法將所有副本鏈接到單一原始文件。在達到硬鏈接上限后,系統被迫額外進行了約18.1萬次備份下載,最終形成377GB的冗余數據,備份機制因此失效。
這一故障的諷刺之處在于:拖垮系統的并非龐大的備份文件體積,而是瘋狂的硬鏈接數量。1.6MB的原始文件在極端使用場景下,通過文件系統的鏈接限制間接造成了數百GB的存儲浪費。
Discourse最終采用的解決方案保持了硬鏈接的核心思路,但增加了對文件系統限制的適配:當系統返回“鏈接數過多(EMLINK)”錯誤時,自動在本地復制一份相應文件,并將新文件設為“主文件”,以此為基準繼續創建硬鏈接,直至再次觸及鏈接上限。這種分層鏈接策略適用于所有文件系統,無需額外配置,在無法更改底層文件系統的前提下被視為可接受的折中方案。
插播一條活動預告
4月24日(周五)09:30 至 12:30
OSC源創會 × FAIR plus 2026
【具身智能工程化實戰沙龍】
中國半個具身圈都來了
查看圖二免費報名
深圳福田會展中心9號館4號會議室
聚焦具身智能從技術研發到工程落地的核心痛點
現場還能體驗模力方舟“口袋龍蝦”PocketClaw
?一線項目復盤
失敗案例拆解
AI硬件資源對接
免費報名 oschina.net/event/8598188
#OSC源創會 #FAIRplus2026 #具身智能 #AI沙龍 #機器人 #深大計算機 #具身智能機器人 #ai #深大 #深圳大學 #深圳技術活動 #AI機器人 #深圳機器人 #世界模型 #人在環
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.