无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

科學通報 | 終結“數據孤島”: AlphaEarth重構地球智能數據底座

0
分享至

1972年Landsat衛星的成功發射, 標志著地球科學數據的獲取進入了以衛星遙感為核心、持續、系統化的地球觀測系統新時代. 此后數十年, Sentinel和MODIS等新一代遙感衛星投入使用, 地球大數據得到了前所未有的擴張, 為理解地球系統提供了豐富資料 [1] . 與此同時, ERA5再分析、GRACE重力觀測與高分辨地形數據等信息, 以及諸如地理文本這類非結構化數據, 共同構成了高度異質的多模態數據體系, 標志著地球系統科學邁入了“PB級數據時代” [2] . 然而, 隨著數據量的不斷增加,數據分散、數據管理、多源和多模態數據融合使用等方面的問題日益突出, 制約了地球大數據在大尺度、自動化與智能化分析中的應用 [3] , 因此, 發展能夠在多模態數據條件下有效緩解標注依賴、并支持數據之間高效組織與融合利用的基礎模型體系, 已成為迫切需求 [ 4 , 5 ] .

為應對上述挑戰, 地球系統基礎模型相繼涌現, 代表性工作包括面向大氣與氣候的Aurora [6] 與FourCastNet [7] , 以及面向地表觀測的SatMAE [8] 與Prithvi [9] , 前者通過學習天氣或氣候狀態的時空演化規律實現高效預測, 后者在多源遙感觀測數據上學習具有通用性的特征表示, 并通過下游任務微調服務于多種地學應用. 2025年7月, Google DeepMind訓練了AlphaEarth Foundations模型 [10] , 區別于上述模型, AlphaEarth通過“嵌入場”(embedding field)將衛星影像、環境數據、文本信息等異質數據共同壓縮到一個 10?m 分辨率、64維的潛在空間, 這種嵌入式表示方法打破了地學長期存在的“數據孤島”現象, 實現了跨模態、跨時空的數據統一建模, 從根本上重構了地球觀測信息的組織方式, 為地球智能提供了全新的“數據底座”.

AlphaEarth的架構定義了一條明確且有約束的信息通路, 這條通路描述了從多源觀測輸入到嵌入場生成的完整過程, 如 圖1 所示. 輸入階段將Sentinel-2、Landsat、Sentinel-1、PALSAR-2、GEDI、ERA5-Land、GRACE、GLO-30等數據源按真實時間戳被組織為支持期(support period)內的序列, 并以 1.28?km×1.28?km 為基本采樣塊. 隨后, 各類數據源經由其特定的前置編碼器被映射至共享的潛空間(latent space), 以確保不同模態能夠在特征域中進行交互; 同時, 時間信息被顯式編碼為正弦時間碼, 以增強模型對時序連續性的表達能力. 經過預處理的多源特征進入“空間-時間-精度編碼器”, 該模塊以重復的塊結構單元同時捕獲空間精細信息與跨空間、跨時間的長程依賴, 隨后被輸入到摘要器(summarizer). 摘要器針對給定的有效期(valid period), 先在每個 10?m×10?m 網格的局部L×L鄰域內融合特征, 再引入變分瓶頸實現降維, 同時估計出馮·米塞斯–費希爾(von Mises–Fisher)分布的參數, 最終得到64維的單位嵌入向量, 在 10?m×10?m 的空間分辨率上產生穩定的、濃縮了時空信息的表示. 這些嵌入向量和元數據被輸入一組解碼器, 隱式地重構各類源的觀測, 因而能夠為任意指定時間點生成空間連續的重建.


圖 1 AlphaEarth Foundations總體架構圖. 來源于文獻[10]

訓練過程采用多目標損失函數的組合, 如 式(1) 所示 [10] . 第一項為重建損失, 通過誤差函數 fi 度量預測值 y i ′ " role="presentation" mpa-font-style="mnwvqerea2y">y′i 與真值 yi 之間的誤差, 其中分類任務的 fi 為交叉熵損失, 回歸任務 fi 為L1損失, wi 為數據權重. 第二項通過計算嵌入向量 ui 及其隨機旋轉后的向量 u i ′ " role="presentation" mpa-font-style="mnwvqere1n9x">u′i 之間的差異, 確保所有嵌入向量在特征空間中保持足夠的區分度, 防止嵌入向量發生聚集或坍縮. 第三項引入教師-學生(teacher–student)策略, u 為教師嵌入, u s 為學生嵌入, 結合輸入丟棄機制來提高對觀測稀疏性與傳感器缺失的魯棒性. 第四項采用對比學習機制, 將教師嵌入與文本描述向量 ut 進行對齊, 使教師嵌入能夠有效吸收文本中蘊含的語義知識. 最后通過不同權重 a 、 b 、 c 、 d 將四項損失組合得到AlphaEarth模型訓練的損失函數.


AlphaEarth通過最小化 式(1) 所定義的聯合損失函數進行訓練, 并在分類、回歸與變化檢測等下游任務上開展了系統評估. 在300個樣本試驗規模場景下, AlphaEarth總體平均降低了約23.9%的誤差. 在10個樣本試驗中, AlphaEarth平均降低了約10.4%的誤差; 在1個樣本試驗中, AlphaEarth平均降低了約4.18%的誤差. 與此同時, AlphaEarth已經成功應用于空氣質量預測 [11] 、地下水氟化物濃度預測 [12] 、貧困區制圖等任務 [13] .

AlphaEarth在多個任務上展現出的高精度與強泛化能力, 證明了以統一時空嵌入為核心的表征范式可行性. 它通過在10 m分辨率上提供全球連續、可比較、跨模態的一致表征, 使研究者能夠在缺乏高質量地面標注、觀測不完整的情形下依然獲得穩定推斷結果, 從而緩解長期阻礙地球系統研究的“標注瓶頸”問題. 并且AlphaEarth的成功說明了地球系統過程的諸多關鍵信息(如地表結構、植被狀況、土地利用等)可以在統一潛在空間中被表示和共享, 這為跨圈層耦合研究、時空連續過程重建和全球尺度比較研究提供了前所未有的技術基礎, 也為構建真正意義上的“地球觀測基礎層”提供了可行路徑. 換言之, AlphaEarth的貢獻不僅是提高了若干分類任務的精度, 更是為地球系統科學提供了一套新的表征數據, 使研究者得以在更低數據成本下進行更大尺度、更高一致性的科學推斷.

然而, 地球系統的復雜性遠非單一模型可承載, AlphaEarth的意義更像是在漫長探索道路上的一個里程碑, 它所真正指向的是一系列更基礎的問題: 地球觀測是否需要一種新的數據組織方式? 是否需要一種能夠跨時間、跨空間、跨圈層理解地球過程的通用表征結構? 以及地球系統科學是否正在從“任務驅動的遙感”邁向“表征驅動的地球科學”? 如今, 人工智能地球科學正身處在數據鴻溝、尺度鴻溝與標注鴻溝的困境當中, 如何打破長期存在的“數據孤島”, 重建關于地球的“共同語言”, 是構建下一代智能地球數據底座的關鍵方向.


參考文獻

[1] Guo H, Liang D. The origin and research progress of Big Earth Data (in Chinese) . Chin Sci Bull , 2024 , 69: 58 -67

[2] Yang Y P, Jiang H, Sun J L. Practice of scientific data sharing: a case study of the national Earth system science data center (in Chinese). J Geo-Inf Sci, 2020, 22: 1358–1369 [楊雅萍, 姜侯, 孫九林. 科學數據共享實踐: 以國家地球系統科學數據中心為例. 地球信息科學學報, 2020, 22: 1358–1369].

[3] Guo H, Wang L, Liang D. Big Earth Data from space: a new engine for Earth science . Sci Bull , 2016 , 61: 505 -513

[4] Bauer P, Stevens B, Hazeleger W. A digital twin of Earth for the green transition . Nat Clim Chang , 2021 , 11: 80 -83

[5] Vance T C, Huang T, Butler K A. Big data in Earth science: emerging practice and promise . Science , 2024 , 383: eadh9607

[6] Bodnar C, Bruinsma W P, Lucic A, et al. A foundation model for the Earth system . Nature , 2025 , 641: 1180 -1187

[7] Pathak J, Subramanian S, Harrington P, et al. Fourcastnet: a global data-driven high-resolution weather model using adaptive Fourier neural operators.

[8] Cong Y Z, Khanna S, Meng C L, et al. Satmae: pre-training transformers for temporal and multi-spectral satellite imagery. Adv Neural Inf Process, 2022, 35: 197–211.

[9] Szwarcman D, Roy S, Fraccaro P, et al. Prithvi-eo-2.0: a versatile multi-temporal foundation model for Earth observation applications.

[10] Brown C F, Kazmierski M R, Pasquarella V J, et al. Alphaearth foundations: an embedding field model for accurate and efficient global mapping from sparse label data.

[11] Alvarez C I, Ulloa Vaca C A, Echeverria Llumipanta N A. Machine learning for urban air quality prediction using Google AlphaEarth foundations satellite embeddings: a case study of quito, ecuador . Remote Sens , 2025 , 17: 3472

[12] Wei Y, Zhong R, Yang Y. Groundwater fluoride prediction for sustainable water management: a comparative evaluation of machine learning approaches enhanced by satellite embeddings . Sustainability , 2025 , 17: 8505

[13] Pettersson M B, Daoud A. Leveraging compact satellite embeddings and graph neural networks for large-scale poverty mapping.

《科學通報》是中國科學院主管、中國科學院和國家自然科學基金委員會共同主辦的綜合性中文學術期刊,致力于快速報道自然科學各學科基礎理論和應用研究的最新研究動態、消息、進展, 點評研究動態和學科發展趨勢。

  • 旬刊,每10天出版1期;

  • 欄目:進展、評述、快訊、論文、觀點、科技前沿、科學訪談、亮點述評、悅讀科學等;

  • 中國科學院文獻情報中心分區表綜合性大類1區TOP期刊;

  • 中國科技期刊卓越行動計劃領軍期刊;

  • 《中國科技論文與引文數據庫》和《中國科學引文數據庫》的源期刊,同時被EI、ESCI和Scopus等收錄;

  • 期刊官網:http://csb.scichina.com.

轉載、投稿請留言

| 關注科學通報 | 了解科學前沿

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“沒人說得清底部在哪里” 金價跌破900大關 記者實探:有門店一天回收超1公斤黃金

“沒人說得清底部在哪里” 金價跌破900大關 記者實探:有門店一天回收超1公斤黃金

封面新聞
2026-06-11 21:35:05
兩年凈虧超34億元!昔日手機巨頭,被掛牌轉讓股權!深圳知名企業公告

兩年凈虧超34億元!昔日手機巨頭,被掛牌轉讓股權!深圳知名企業公告

南方都市報
2026-06-11 22:25:57
謝娜跨界圈錢越演越烈!官媒點名怒批,句句說到心坎,過審也得涼

謝娜跨界圈錢越演越烈!官媒點名怒批,句句說到心坎,過審也得涼

娛說瑜悅
2026-06-10 20:29:46
編制外崗也要管!“當時不懂,就和朋友玩了”,女生政審被刷不服

編制外崗也要管!“當時不懂,就和朋友玩了”,女生政審被刷不服

蝴蝶花雨話教育
2026-06-03 00:05:13
采訪了100個出軌后回歸家庭的女人,她們幾乎都說了同樣一句話

采訪了100個出軌后回歸家庭的女人,她們幾乎都說了同樣一句話

千秋文化
2026-06-11 18:14:56
太排面了!全紅嬋家徹底火了!送走跳水冠軍,又迎來擊劍冠軍

太排面了!全紅嬋家徹底火了!送走跳水冠軍,又迎來擊劍冠軍

喜歡歷史的阿繁
2026-06-12 00:53:02
調查發現:老年人若經常吃香蕉,用不了多久,身體或迎來3大改變

調查發現:老年人若經常吃香蕉,用不了多久,身體或迎來3大改變

芹姐說生活
2026-05-15 15:06:08
中國股市唯一賺錢最快路徑:持有一只股,保留30%倉位,長期做T!

中國股市唯一賺錢最快路徑:持有一只股,保留30%倉位,長期做T!

股經縱橫談
2026-06-11 20:11:15
福克斯錯誤選擇引熱議:一人毀掉勝利 無愧布朗愛將 馬刺隊史最差

福克斯錯誤選擇引熱議:一人毀掉勝利 無愧布朗愛將 馬刺隊史最差

顏小白的籃球夢
2026-06-11 12:39:28
國際乒聯終身主席怒了!樊振東打不打奧運會?應該我們自己說了算

國際乒聯終身主席怒了!樊振東打不打奧運會?應該我們自己說了算

夢史
2026-01-19 14:16:23
“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

“機密”文件竟在微信群中傳播!查明:檔案局服務人員發現涉密文件與兒子工作有關,遂拍照發家庭群,已被辭退;相關負責人被黨內嚴重警告

揚子晚報
2026-06-03 07:37:03
老胡這次徹底刷新了壞的下限!

老胡這次徹底刷新了壞的下限!

胖胖說他不胖
2026-06-08 11:50:14
國防部一聲驚雷炸響南海!憋了整整55年的中業島這口氣,該出了

國防部一聲驚雷炸響南海!憋了整整55年的中業島這口氣,該出了

世界地緣觀察
2026-06-08 09:18:00
孫穎莎考研清華爆火!面試征服眾教授,實力打破學歷偏見

孫穎莎考研清華爆火!面試征服眾教授,實力打破學歷偏見

羅納爾說個球
2026-06-10 20:07:20
母子定律,準到驚人

母子定律,準到驚人

心理觀察局
2026-06-10 07:00:08
泰國世界杯轉播方案公布:免費看一場,其余賽事需購買5999泰銖套餐

泰國世界杯轉播方案公布:免費看一場,其余賽事需購買5999泰銖套餐

曼谷陳大叔
2026-06-11 19:41:16
英超官方:第23輪阿森納2比3曼聯當選賽季最佳比賽

英超官方:第23輪阿森納2比3曼聯當選賽季最佳比賽

懂球帝
2026-06-11 20:36:25
每次牛市破滅后,總有一批藍籌悄悄創新高

每次牛市破滅后,總有一批藍籌悄悄創新高

雪球
2026-06-09 21:02:33
外交部:在全球范圍大肆公然搞間諜活動和情報搜集的,恰恰是美國自己

外交部:在全球范圍大肆公然搞間諜活動和情報搜集的,恰恰是美國自己

環球網資訊
2026-06-11 16:12:51
一鯨落萬物生?中國科學家挖出一座千萬頭鯨的530萬年大墳場

一鯨落萬物生?中國科學家挖出一座千萬頭鯨的530萬年大墳場

三農老歷
2026-06-11 19:47:07
2026-06-12 04:19:00
科學通報 incentive-icons
科學通報
科學通報微信公眾號
1368文章數 2020關注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

頭條要聞

中方對菲國防部長特奧多羅及其親屬實施制裁

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財經要聞

干細胞生意:17萬一針的希望

汽車要聞

傳祺向往M8 PHEV L/E8 PHEV上市 限時落地價16.84萬起

態度原創

數碼
本地
教育
親子
公開課

數碼要聞

傳聞稱蘋果首款觸控屏 MacBook 已“100% 確認”

本地新聞

世界杯還沒開始,蘇超已經火到爆梗

教育要聞

我的私藏備課工具書!!!

親子要聞

歷經兩年治療,無精子癥患者家庭在滬迎健康寶寶

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版