![]()
當下,AI幾乎無處不在——無論是你打字時被數字"助手"不斷打斷,還是想買一臺不需要聯網的冰箱卻發現難覓蹤影。面對這股浪潮,你或許會忍不住發問:我們究竟是站在了一場技術飛躍的門檻上,還是只是在為一堆泡沫搖旗吶喊?
那么,AI在天氣預報和氣候建模領域日益廣泛的應用,又該如何看待?
今年年初,一件事讓這場討論開局不利——美國國家氣象局某辦公室發布了一張預報地圖,圖上出現了幾個莫名其妙的愛達荷州城市名稱,比如"Whata Bod"和"Orangeotild"。好在這只是用于社交媒體的AI生成圖片,并非真正的預報模型。氣象學家和氣候科學家目前還沒有被大語言模型的提示詞工程師所取代。
但AI確實已經以機器學習的形式進入了這些領域。研究人員對這些技術已有多年的深入研究,其優勢與局限也相對清晰。值得注意的是,天氣預報模型與氣候模擬模型在AI技術的應用方式上有所不同,這背后自有其合理邏輯。
在這些模型中,"AI"指的就是機器學習。無需深入其眾多技術變體的細節,其核心思路其實很簡單:讓計算機從數據中發現規律。
將數據擬合成一條趨勢直線——即線性回歸——是識別規律的最基礎方法。當然,我們也可以用更復雜的曲線和方程來進行回歸分析。機器學習真正的魅力(以及潛在的風險)在于:算法能夠處理遠比人工更高維度的復雜性,挖掘出那些我們憑直覺難以察覺的關聯關系。
機器學習的起點是從零開始訓練模型。首先為模型確定一個結構——比如神經網絡——其中包含大量可獨立調節的參數,用于精細控制算法行為。隨后,模型會被輸入海量帶標注的樣本數據,例如數千張按物種分類的鳥類照片。模型通過反復迭代,找到最優參數組合,從而將圖像內容與正確的物種標簽對應起來。
這其中存在一些顯而易見的局限。這套算法無法識別訓練數據中從未出現過的物種,也無法處理與訓練樣本差異過大的亞群體。訓練數據的質量同樣至關重要——如果我們只用松樹上的山雀照片來訓練模型,它可能會把松針也納入"山雀特征"的定義之中。
此外,如果不投入大量額外工作,我們往往無法得知模型是如何得出結論的。其內部機制大多數時候都是一個"黑盒"。
不過,機器學習的優勢也是實實在在的。機器學習算法往往能超越我們精心設計的人工算法——至少在計算效率上如此,有時在精度上也不例外。關鍵在于是否使用得當,一旦方法失當,其局限性便會暴露無遺。
在天氣預報模型中,機器學習的應用方式與鳥類識別并無太大差異,只是模型所訓練的是兩組相鄰時間點的氣象數據。由于無需在每個地點求解大量物理方程,這類模型的運行速度遠超傳統氣象模型。
谷歌、英偉達、華為、微軟等多家公司已陸續開發出初代機器學習天氣模型——有些還與獨立學術機構合作完成——其預報效果可與現有模型相媲美。隨著研究人員逐步摸清這些模型的優勢與短板,多個主要天氣預報中心也開始著手自主研發。
歐洲中期天氣預報中心(ECMWF)于2025年2月正式投入使用其首個基于機器學習的模型,并與其長期運行的綜合預報系統(IFS)并行運作。
這一名為AIFS的模型以再分析數據集為基礎進行訓練。所謂再分析數據集,是通過整合所有可用的氣象觀測數據,在缺乏實測的區域補全一幅物理上自洽的全球氣象圖景。這一關鍵工具極大簡化了機器學習的任務:基于過去的氣象快照,預測下一個時間節點(六小時后)的全球氣象狀態。
Q&A
Q1:機器學習在天氣預報模型中是如何工作的?
A:天氣預報中的機器學習模型,通過學習兩組相鄰時間點的氣象數據來訓練,使其能夠預測下一個時間節點的天氣狀況。由于不需要在每個地點求解大量物理方程,這類模型運行速度遠快于傳統氣象模型。目前谷歌、英偉達、華為、微軟等公司均已開發出相關模型,歐洲中期天氣預報中心也于2025年2月正式啟用了自研的AIFS機器學習模型。
Q2:機器學習算法有哪些主要局限性?
A:機器學習算法存在幾個明顯局限:首先,模型無法識別訓練數據中從未出現過的類別或差異過大的子群體;其次,訓練數據的質量直接影響模型效果,偏差數據會導致錯誤的特征關聯;此外,模型內部的決策機制通常是"黑盒",在不投入大量額外工作的情況下,很難解釋模型為何給出某個特定結論。
Q3:ECMWF的AIFS模型是用什么數據訓練的?
A:AIFS模型使用"再分析數據集"進行訓練。再分析數據集是通過整合所有可用的氣象觀測數據,在沒有實測數據的區域補全一幅物理上自洽的全球氣象圖景所構建的數據集。這種數據處理方式大大簡化了機器學習的任務,讓模型能夠基于歷史氣象快照,有效預測六小時后的全球氣象狀態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.