關聯(lián)比賽:??2022江蘇氣象AI算法挑戰(zhàn)賽-AI助力強對流天氣預報
2022江蘇氣象AI算法挑戰(zhàn)賽亞軍比賽攻略_DontMind隊
成員介紹

一、賽題分析
本次比賽主要是針對大風/雷達回波/降水的短臨預報,屬于典型的時空序列預測問題,此類問題可以從分類和回歸預測兩個角度來解決。
按照各氣象要素閾值區(qū)間進行分類,可以轉化為分類預測問題;
從回歸預測的角度又分為單變量回歸預測和多變量回歸預測。
由于大風和降水預測很難轉換為分類預測問題,而且我們經(jīng)過大量的模型試驗表明,多變量回歸預測很難同時達到最優(yōu),且很難超越單變量回歸預測。因此,我們最終采用了單變量回歸預測思路,并利用過去一小時數(shù)據(jù)預測未來兩小時各氣象要素的時空演變。以下將圍繞我們決賽最終采用的模型和策略進行介紹

二、總體設計思路

三、數(shù)據(jù)預處理
數(shù)據(jù)清洗:去除雷達回波低值偽影以及異常降水值。樣本重采樣和降采樣:由于數(shù)據(jù)分布不平衡問題,根據(jù)各要素閾值區(qū)間分布情況對樣本進行重采樣和降采樣,以平衡不同強度樣本占比。數(shù)據(jù)集調整:由于所給的數(shù)據(jù)集中相鄰個例僅相差一幀,重復率過高,因此我們將臨近個例的間隔調整為5幀,降低樣本重疊率,提升模型訓練穩(wěn)定性。

四、模型選擇與優(yōu)化
風速預測——SEResNet

雷達回波預測模型——TrajGRU

降水預測模型:雙模型融合
模型一:U2Net

模型二:PhyDNet

雙模型融合:兩個模型預測結果取平均
五、損失函數(shù)

針對不同模型,設計不同損失函數(shù),由于本賽題預測對象均有嚴重不平衡問題,因此針對MSE和MAE類型損失函數(shù)需要給與相應權重設置。而DiceLoss本身僅針對目標區(qū)域計算損失,因此無需再給定權重。此外,針對降水,加入了60/90/120min的累計降水的損失作為正則項。
六、性能提升策略
Two-stage優(yōu)化:凍結模型部分層,調整損失函數(shù)權重,調低學習率,進行模型參數(shù)微調,提高強回波/降水的預測技能評分
模型集成:針對降水預測,融合U2Net與PhyDNet預測,提升模型泛化能力和穩(wěn)定性
偏差訂正:考慮了預測能力的時間衰減和閾值的影響,對模型預測進行偏差訂正,提高強回波/降水的預測技能評分

七、官方個例真實性
風速預測


雷達回波


降水預測




八、總結
樣本不平衡:樣本重采樣+損失加權和正則/類別不平衡損失+Two-stage優(yōu)化減輕類別極度不平衡導致的強回波/降水難預測問題
模型性能及穩(wěn)定性:多模型集成進一步提高降水的整體預報技能評分及模型的穩(wěn)定性
后處理方法:引入模型預測偏差訂正后處理方法提高強回波/降水預報技能評分

本次比賽我們初賽和復賽均為第二,其中復賽實時評測階段22天大部分時段取得前6成績,其中10天取得第1,模型總體表現(xiàn)較為穩(wěn)定