網易首頁 > 網易號 > 正文申請入駐

Meta 重構 PB 級高可靠數據攝取架構

2026-06-07 10:20:17　來源: InfoQ

北京舉報

分享至

作者｜ Renato Losio

譯者｜明知山

Meta 的工程團隊最近介紹了 Meta 如何對一個數據攝取平臺進行遷移，以提高可靠性和運營效率，該平臺每天傳輸數 PB 量級的 MySQL 社交圖譜數據。團隊使用了反向影子和持續校驗和監控等技術，確保在遷移過程中實現零停機。

Meta 運營著全球最大的 MySQL 集群之一，其數據攝取平臺為數據分析、報表生成、機器學習和內部產品開發工作負載提供支撐。Meta 最近進行了架構重構，用集中式、自管理的數據倉庫服務取代了由各個業務團隊獨立維護的數據流轉管道。

通過這次遷移，Meta 用集中式托管系統替代了分散的、由各管道各自運維的基礎設施，通過分階段遷移、自動化驗證、回滾控制和兼容層，在不中斷下游分析和機器學習工作負載的情況下，完成了數千條數據攝取管道的遷移。

在超大規模分布式系統部署場景下，Meta 將數據攝取作業的遷移劃分為三個階段：影子階段，使用生產數據對新系統進行驗證；反向影子階段，將生產權限切換至新系統并保留回滾能力；清理階段，待一致性與性能檢測通過后，下線原有數據管道。Meta 軟件工程師 Zihao Tao 及其工程團隊成員解釋道：

我們持續監控生產作業與影子作業之間的行數及校驗和異常。一旦出現數據不匹配，我們會快速排查原因，將修復方案部署至預生產環境，再驗證問題是否已解決。與此同時，我們還會統計影子作業的計算與存儲資源占用，確保生產環境在繼續推進前資源充足。

來源：Meta 工程博客

在完成整個數據攝取工作負載的遷移并淘汰舊系統后，團隊總結了這次大規模基礎設施轉型過程中遇到的挑戰：

要實現無縫遷移，我們必須高效跟蹤數千項作業的全遷移周期，并搭建可靠的發布與回滾機制，應對遷移過程中可能出現的各種問題。

每個遷移作業在上線前都必須經過嚴格的正確性和性能檢查，比較新舊系統之間的行數和校驗和，監控延遲和資源使用是否出現退化，并對依賴方使用的關鍵表增加額外的規范。團隊解釋道：

我們的舊系統和新數據攝取系統都使用變更數據捕獲（CDC）來將增量數據攝取到目標表。每個數據攝取作業都有自己的內部表用于源數據庫的全量轉儲，一張用于捕獲源數據庫變更的內部表和數據消費方使用的目標表。作業相關的所有實體信息，包括表名與表結構，都由集中管理服務統一存儲和維護。

來源：Meta 工程博客

Syed Moeen Kazmi 評論道：

以 Meta 的業務體量來看，數據攝取遷移并非簡單的系統升級，而是對核心業務進行的高難度改造。挑戰不只在于數據遷移本身，更要保障數據一致性、實現零停機。

由于 CDC 架構需要依靠成本較高的全量快照完成初始加載與故障修復恢復，Meta 將非必要影子作業的創建延后至數據質量問題解決完畢。這避免了重復執行大規模全量轉儲，大幅提升了遷移效率。團隊還在遷移初期復用舊系統的快照分區，以此降低基礎設施的運行負載。

查看英文原文：

https://www.infoq.com/news/2026/05/meta-cdc-migration/

聲明：本文由 InfoQ 翻譯，未經許可禁止轉載。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

首個三模式大語言模型：4倍token吞吐量，長文本秒級時代要來了？

機器之心Pro 2026-05-22 14:21:21
0 跟貼 0
NEWTON:等物理涌現到請牛頓進工具箱，Agent 驅動視頻生成新范式

機器之心Pro 2026-06-11 20:50:32
0 跟貼 0

不用向量數據庫，Agent也能會搜索：給它一個grep就夠了？

機器之心Pro 2026-06-11 17:06:46
0 跟貼 0

Kimi最強編程模型來了：Token消耗直降30%，過度思考有救了，附一手實測

智東西 2026-06-13 01:07:25
2 跟貼 2
微信AI不打算接管一切

華爾街見聞官方 2026-06-11 16:33:03
1 跟貼 1

eICU 數據提取太耗時？這套零代碼方案更高效

醫咖會 2026-06-08 18:38:08
0 跟貼 0

EmbodiChain開源，用100%生成式數據自動訓練具身智能模型

機器之心Pro 2026-01-20 15:49:43
0 跟貼 0
小學生畫了撇胡子騙過AI年齡驗證，硅谷工程師沉默了

機器之心Pro 2026-05-31 14:27:31
0 跟貼 0

AI的盡頭是電力，電力的答案為什么指向“物理AI”？

DeepTech深科技 2026-04-03 13:18:27
0 跟貼 0
谷歌聯合眼鏡品牌推出Gemini智能眼鏡今秋上市直面Meta雷朋競品

93913虛擬現實 2026-06-11 10:37:53
2 跟貼 2
300萬對樣本、200萬對實拍：深度估計的數據荒，終于被打破

機器之心Pro 2026-03-31 11:08:33
0 跟貼 0
《華爾街日報》觀點｜美國疾控中心埃博拉限制措施中的邏輯缺陷

一半杯 2026-06-12 09:11:59
0 跟貼 0
VL-LN Bench：模擬「邊走邊問找具體目標」的真實導航場景

機器之心Pro 2026-02-02 17:10:55
0 跟貼 0
1美元弄個美國號，旅行者的短信轟炸機來了

算力游俠 2026-06-12 01:53:22
0 跟貼 0
Meta欲聯手白宮對抗中國，中方三重技術防御體系已全面形成

感謝過往 2026-06-12 09:14:59
0 跟貼 0
留學生回國點外賣時懵了，曾經的外賣軟件怎么不見了

財經時間官方 2026-06-12 23:18:13
0 跟貼 0
師傅在河里打撈廢鐵，結果吸到了鋼架構柱子上，技術不到位

鳥姐談笑 2026-06-12 09:53:41
0 跟貼 0
剛剛，人類歷史上首位萬億美元富豪誕生！

每日經濟新聞 2026-06-12 22:32:06
3741 跟貼 3741
系統設計課：叩開頂尖科技公司面試大門的關鍵一步

摸魚算法 2026-06-12 04:01:55
0 跟貼 0
Anthropic警告的遞歸AI，田淵棟新公司剛剛走出了「第一步」

機器之心Pro 2026-06-12 11:50:41
10 跟貼 10
微軟不敢給員工用的AI，轉頭賣給你！法務卡住最強Claude

新智元 2026-06-13 00:19:46
0 跟貼 0
具身智能數據基建升級！神經腕帶+全景頭環，補全物理操作信號

新智元 2026-06-12 10:10:12
1 跟貼 1
技術部十人集體辭職，主管看著價值三十億數據庫，瞬間懵了

小秋情感說 2026-06-12 20:58:29
0 跟貼 0
財政緊張山西原平仍斥資近億元在偏遠深山建景觀小鎮

上觀新聞 2026-06-13 07:56:33
188 跟貼 188
高鐵行李架現白色寵物蛇列車長僅用塑料袋徒手拿捏

極目新聞 2026-06-12 10:06:52
1332 跟貼 1332
梁文鋒向左，楊植麟向右

虎嗅APP 2026-06-13 02:52:07
3 跟貼 3
算法背后的牧羊人：數智時代從“算力調度”到“人心喚醒”的領導力躍遷

經濟觀察報 2026-06-12 09:06:30
0 跟貼 0
三天修復最危險漏洞：美國聯邦機構迎來史上最嚴補丁令

字節漫游指南 2026-06-12 01:53:57
0 跟貼 0
美擬撤走北約歐洲防務三分之一戰機

界面新聞 2026-06-12 13:06:43
1771 跟貼 1771
男子在濟南曲水亭街用魚鏢彈弓捕魚射中后拽著線將魚撈出大明湖派出所：已介入調查正依法處理

閃電新聞 2026-06-12 17:17:30
34 跟貼 34
“AI定義汽車：先有AI，再有車”——賽豆科技物理AI元年下的造車邏輯重構

每日經濟新聞 2026-06-11 18:26:08
0 跟貼 0
育碧、微軟XBOX、Meta等裁員潮持續來襲，AI改變了裁員規則

游戲頭條 2026-06-11 17:06:47
1 跟貼 1
"中醫匠人"賣課號稱"行走的CT" 自稱學技術可掙錢改命

新京報 2026-06-12 11:56:14
1461 跟貼 1461
公開征求意見！廣州擬繼續在全市所有道路禁止機動車鳴喇叭

南方都市報 2026-06-12 19:04:34
302 跟貼 302
“張雪機車”獲得WSBK艾米利亞-羅馬涅站桿位賽第三名

極目新聞 2026-06-12 23:00:07
237 跟貼 237
涵公子駕道|全新理想L8靜態品鑒：“原生大五座”的空間重構

科技犬建哥 2026-06-12 11:35:45
3 跟貼 3
牛盲軟件之360

阿彪動畫 2026-06-12 11:27:00
0 跟貼 0
鬧心！奧迪純電SUV，提車三天“故障頻發”！上海車主7個月報修10次，結果更鬧心

新民晚報 2026-06-12 19:26:49
440 跟貼 440
5個月神話破滅！Donut Lab固態電池被實錘造假背后：從未實際生產過電池電芯，固態電池產業化仍需五到十年

每日經濟新聞 2026-06-11 16:39:10
268 跟貼 268
海光信息在漢披露：國產CPU處理器性能已比肩英特爾

支點財經 2026-06-11 21:27:18
174 跟貼 174

手機 / 數碼

房產 / 家居

Meta 重構 PB 級高可靠數據攝取架構

剛剛，人類歷史上首位萬億美元富豪誕生！

47歲泰國長公主去世 70多歲泰王現繼承危機

47歲泰國長公主去世 70多歲泰王現繼承危機

歐洲恐韓？肉德維德？

一天4個瓜，肖戰熱巴最意外

梁文鋒向左，楊植麟向右

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

這個夏天，在鄭州這些地方可以看“海”

俗話說興趣就要從小開始培養！

海南最賺錢行業曝光！最快4年半，海口全款買三房！

砸了640億，再賠160億！沙特“The Line”項目徹底涼了？

三星官網公布Galaxy A27 5G手機參數，搭載驍龍6 Gen 3芯片

標配激光雷達/雙動力可選昊鉑S600限時售17.99萬起