本文摘要:摘要:雷達回波外推方法已廣泛應用于短時強降水臨近預報中。針對傳統(tǒng)雷達回波外推方法未充分利用海量歷史氣象數(shù)據(jù)從而導致預報準確度不高的問題,提出了一個基于動態(tài)概率卷積神經(jīng)網(wǎng)絡(dynamicprobabilityconvolutionalneuralnetwork,DPCNN)的雷達回波外推模
摘要:雷達回波外推方法已廣泛應用于短時強降水臨近預報中。針對傳統(tǒng)雷達回波外推方法未充分利用海量歷史氣象數(shù)據(jù)從而導致預報準確度不高的問題,提出了一個基于動態(tài)概率卷積神經(jīng)網(wǎng)絡(dynamicprobabilityconvolutionalneuralnetwork,DPCNN)的雷達回波外推模型。該模型在卷積神經(jīng)網(wǎng)絡的基礎上增加動態(tài)概率計算層,對不同的雷達回波輸入序列計算對應的概率卷積核,并用于后續(xù)的外推計算中,使得網(wǎng)絡在預測階段仍然能夠根據(jù)不同的輸入序列作出相應的概率調(diào)整,從而增強了外推結(jié)果與已知序列的關聯(lián)。經(jīng)某局部地區(qū)短時強降水外推實驗,從外推圖像、SCI指數(shù)、FAR指數(shù)、POD指數(shù)四個方面驗證了該模型的有效性。
關鍵詞:動態(tài)概率;雷達回波外推;深度學習;卷積神經(jīng)網(wǎng)絡
0引言
隨著社會發(fā)展,氣象與日常生活的關聯(lián)度在不斷上升,極端天氣帶來的航班取消、動車晚點等交通中斷問題對于經(jīng)濟的影響也日益突出,因此對降水類型、天氣系統(tǒng)內(nèi)部潛在關系的研究成為熱點[1~4]。在眾多氣象災害中,強對流天氣帶來的降水因為具有發(fā)生突然、發(fā)展迅速、破壞性強等特征而受到氣象部門高度重視[5~7]。對短時臨近降水預報的工作主要是指,根據(jù)雷達回波圖、雨量統(tǒng)計數(shù)據(jù)等其他觀測數(shù)據(jù)對某一地區(qū)的降雨強度進行短時間(如0-2小時)的預報。目前利用雷達回波圖進行外推,已成為短時臨近降水預報的一種重要技術(shù)手段[8~10]。
在此類雷達回波外推的相關方法中,已投入實際業(yè)務的主要有光流法[11,12]、質(zhì)心跟蹤法(Centroid)、交叉相關法(COTREC)[13,14]等。上述方法各有不足,光流法將光流場的估計和雷達回波外推分為兩個步驟,而非端到端的過程,這將引入額外誤差[15];質(zhì)心跟蹤法通過閾值來識別風暴單體,因而最佳使用場景是風暴單體的跟蹤,而非對短時臨近降水回波未來演變趨勢預測[16];交叉相關法假設回波演變是線性的,并基于此假設根據(jù)若干歷史時刻的回波特征來外推下一個時刻的回波分布,然而在實際情況下,回波演變往往是復雜的非線性演變。
針對上述雷達回波外推方法存在的問題,本文修改了傳統(tǒng)卷積神經(jīng)網(wǎng)絡結(jié)構(gòu),提出了一種基于動態(tài)概率卷積神經(jīng)網(wǎng)絡(DPCNN)模型。該模型通過學習歷史雷達回波圖序列中回波空間分布和強度演變規(guī)律,從而實現(xiàn)對雷達回波圖像的外推。DPCNN在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(CNN)上增加了動態(tài)概率計算層,為已知序列計算對應的概率卷積核,使得網(wǎng)絡在預測階段能夠根據(jù)不同輸入序列作出相應概率調(diào)整,從而使網(wǎng)絡能為不同的輸入序列“定制”相應的網(wǎng)絡狀態(tài),這使網(wǎng)絡更具靈活性。
1DPCNN外推過程
DPCNN外推的整體過程包括數(shù)據(jù)預處理過程和模型外推過程。數(shù)據(jù)預處理過程最終輸出灰度CAPPI雷達回波圖;在外推過程中,訓練好的DPCNN模型將會根據(jù)輸入的灰度雷達回波圖序列,動態(tài)計算出對應概率卷積核,并利用其進行外推得到雷達回波外推圖序列。DPCNN外推全過程各具體操作步驟將在本文后續(xù)章節(jié)中給出。
2數(shù)據(jù)集構(gòu)造與預處理
本文采用某地區(qū)2015年1月至2017年12月份CINRADSA型多普勒天氣雷達資料作為原始數(shù)據(jù)集。該數(shù)據(jù)集中均為等高平面位置顯示產(chǎn)品(ConstantAltitudePlanPositionIndicator,CAPPI)的雷達回波圖像。其中2015年至2016年的雷達回波圖像作為訓練數(shù)據(jù)集,2017年作為測試數(shù)據(jù)集。
高平面位置顯示產(chǎn)品雷達回波圖像的例圖所示,原始CAPPI雷達回波數(shù)據(jù)為三通道圖像,當中包含地理背景信息(如海洋、陸地)和色譜卡信息(如文字)會對神經(jīng)網(wǎng)絡訓練過程造成干擾,因此需要對原始數(shù)據(jù)集的圖片進行切割、雷達回波圖語義信息提取、背景地理信息去除等相關預處理工作。為預處理后的灰度CAPPI雷達回波圖。等高平面位置顯示產(chǎn)品雷達回波圖像的預處理流程圖。原始雷達回波圖為例,首先從右側(cè)色譜卡中獲取相關的雷達回波強度對應色譜卡RGB值,對色譜卡進行裁剪,只保留回波數(shù)據(jù)部分,得到左側(cè)規(guī)格為480480的三通道雷達回波數(shù)據(jù)彩圖。利用原始雷達回波圖中的地界、河流等信息,標記并制作出對應的掩模矩陣,為后續(xù)的插值提供依據(jù)。
結(jié)合雷達回波數(shù)據(jù)彩圖以及已知的色譜卡信息,對雷達回波部分進行提取。然后對提取得到的彩色雷達回波數(shù)據(jù)進行灰度值映射,得到對應的雷達回波灰度圖。由于原始雷達回波數(shù)據(jù)中存在著省界、雷達半徑輔助圈等信息,此時得到的灰度圖存在明顯的被分割現(xiàn)象,因此需要插值。將雷達回波灰度圖結(jié)合前面步驟所得的掩模矩陣,利用IIR濾波器的方法實現(xiàn)插值。由于DPCNN所使用的訓練數(shù)據(jù)為圖片序列,在上述預處理后,需要對去除背景信息的灰度CAPPI雷達回波圖進行序列構(gòu)造。序列構(gòu)造方法:按時間順序,窗口長度為15幀進行滑動采樣并構(gòu)造樣本,其中每一幀表示一張去除背景信息的灰度CAPPI雷達回波圖。
一個訓練或測試樣本可劃分為輸入部分和標簽部分,其中輸入部分為5幀,標簽部分為10幀,可進一步表示為:x,x,x,x,x,y,y,...,y123451210。其中,x,x,x,x,x12345為輸入部分,y,y,...,y1210為標簽部分。由于多普勒雷達完成一次掃描所需時間恒定為6min,因此樣本中各幀之間的時間間隔為6min。上述每一幀雷達回波圖像分辨率均為480480。
3動態(tài)概率卷積神經(jīng)網(wǎng)絡
DPCNNCNN是深度學習領域的重要分支。由于CNN及其變種網(wǎng)絡能有效提取圖像中的邊緣、細節(jié)等語義信息,因而被廣泛應用在計算機圖像處理領域,近年來得到了廣泛重視和研究[17~19]。傳統(tǒng)的CNN是一種多層次架構(gòu)的神經(jīng)網(wǎng)絡,其低層部分一般由卷積層和池化層交替組成,卷積層中的卷積核是圖像特征提取的關鍵結(jié)構(gòu);高層部分一般為全連接層或全局平均池化層[20]。輸出層的激活函數(shù)可以根據(jù)不同的任務進行選擇:如回歸任務可采用Sigmoid激活函數(shù),分類任務可以采用Softmax激活函數(shù)等。 由于臨近時間段的雷達回波圖中回波塊像素所在位置和亮度值具有較強的相關性,且卷積神經(jīng)網(wǎng)絡具有較好的建模能力,本文提出了一種基于動態(tài)概率卷積神經(jīng)網(wǎng)絡模型(DPCNN)。
該網(wǎng)絡增加了動態(tài)概率生成層(DynamicProbabilityGenerateLayer,DPGL)和動態(tài)概率計算層(DynamicProbabilityComputeLayer,DPCL)。DPCL中的卷積核由DPGL生成,并對不同輸入序列,DPGL能夠產(chǎn)生不同的概率卷積核和特征圖序列,使得訓練好的網(wǎng)絡在預測階段能夠根據(jù)不同輸入序列作出動態(tài)的概率狀態(tài)演變。其中,DPGL為雙輸出神經(jīng)網(wǎng)絡,用于計算概率卷積核和提取歷史雷達回波序列的特征圖。DPCL將DPGL生成的概率卷積核和提取得到的特征圖進行一系列的卷積計算操作后得到最終的外推結(jié)果。
3.1動態(tài)概率生成層
DPGLDPGL為DPCNN模型的輸入部分,DPGL對輸入的雷達回波序列經(jīng)過一系列卷積層處理后,輸出雷達回波序列對應的特征圖序列以及概率卷積核。結(jié)構(gòu)上,DPGL的低層部分包含3個卷積層Conv1、Conv2、和Conv3;中層部分有兩個分支,第一個分支包含了3個轉(zhuǎn)置卷積層TransConv1、TransConv2、TransConv3以及1個卷積層Conv5,該分支最終輸出10480480特征圖序列;在第二個分支包含了1個卷積層Conv4和1個Softmax運算層,最終輸出1077的概率卷積核Kernel。
4實驗結(jié)果與分析
實驗運行在3.60GHz的CPU、內(nèi)存8GB的PC上。模型對于卷積層的初始化方法采用Xavier[22]方法,偏置項的初始化值為0向量。在優(yōu)化器選擇上采用Adam優(yōu)化的方法,起始學習速率設置為0.0001,并且設置學習速率衰減機制,每隔10000次迭代,學習速率衰減至原來的70%。網(wǎng)絡訓練采用mini-batch訓練的方案,每一批數(shù)據(jù)大小batch-size為4個樣本,最大迭代次數(shù)為60000次。
5結(jié)束語
本文詳細介紹了卷積神經(jīng)網(wǎng)絡的變種模型DPCNN,并且以該模型為基礎,與傳統(tǒng)的CNN模型、COTREC方法和Centroid方法進行對比,得出如下的結(jié)論:a)從外推結(jié)果的可視化圖像上看,DPCNN模型和CNN網(wǎng)絡的外推結(jié)果均存在一定的“模糊化”現(xiàn)象,但盡管如此,從外推結(jié)果中離散云團的外觀形態(tài)和回波強度細節(jié)上看,相比于傳統(tǒng)的CNN模型,DPCNN模型更能保留離散云團的細節(jié)和回波強度的分布位置,因此外推的結(jié)果比傳統(tǒng)的CNN要更加接近實際觀測的結(jié)果。b)在CSI、FAR、POD三個氣象領域常用分析指標上看,相比于COTREC方法、傳統(tǒng)的CNN方法和Centroid方法,DPCNN模型在CSI和POD的20dBZ、30dBZ、50dBZ三個閾值上均取得更好的效果。
在FAR指標上,DPCNN模型在20dBZ時取得較好的效果,而在30dBZ時取得的效果不如COTREC方法和Centroid方法,在50dBZ時不如COTREC方法。分析其原因為,回波的強度和覆蓋的范圍往往是反比的,這意味著回波強度越大,對應的像素點就越少,同時,由于神經(jīng)網(wǎng)絡在進行外推時存在“模糊化”的問題,因此這將導致nS相對變小,而nF,nM相對變大,從而導致FAR會變大,而POD會變小。c)對于DPCNN模型而言,CSI在不同閾值強度下,總體演變趨勢都會隨著外推的預報時效而下降。
計算機職稱論文投稿刊物:《計算機應用研究雜志》(ApplicationResearchofComputers)創(chuàng)刊于2003年,經(jīng)國家新聞出版總署和國家科學技術(shù)部正式批準,由中華人民共和國衛(wèi)生部主管,中國醫(yī)學基金會主辦的國家及全國性學術(shù)類綜合醫(yī)學期刊。本刊為月刊,主編:劉營。國際標準刊號:ISSN1001-3695,國內(nèi)統(tǒng)一刊號:CN51-1196/TP,國內(nèi)郵發(fā)代號:62-68,國外發(fā)行代號:MO4408,國外總發(fā)行:中國國際圖書貿(mào)易總公司,國內(nèi)總發(fā)行:成都市郵政局,每月1日出版。
同時,在相同預報時效的前提下,隨著閾值強度的增強,CSI系數(shù)會隨之下降,并且閾值強度越大下降越明顯。因此,DPCNN模型作為一種神經(jīng)網(wǎng)絡模型,在雷達回波外推上存在可改進的地方:①該模型在FAR指標上隨著回波強度閾值的增加而增加,并且增加的速度相對明顯,今后可以考慮為損失函數(shù)引入隨回波強度變化的權(quán)重,加強神經(jīng)網(wǎng)絡對回波強度較大的位置的敏感度,從而提高模型對于強回波區(qū)域的預報能力。②DPCNN模型在外推輸出時存在一定程度的“模糊化”現(xiàn)象,因此,下一步研究工作可以嘗試對網(wǎng)絡的結(jié)構(gòu)進行進一步的改良和優(yōu)化,使得外推可視化結(jié)果的細節(jié)更加豐富。
參考文獻:
[1]滕少華,唐海濤,張巍,等.混合PNN和RBF多神經(jīng)網(wǎng)絡模型的局域降雨類型識別及雨量預測[J].小型微型計算機系統(tǒng),2016,37(11):2571-2576.(TengShaohua,TangHaitao,ZhangWei,etal.IdentifyingLocalRainfallTypeandForecastingRainfallQuantityBasedonMixedMultiplePNNandRBFNeuralNetworkModels[J].JournalofChineseComputerSystems,2016,37(11):2571-2576.)
[2]滕少華,樊繼慧,陳瀟,等.SVM多分類器協(xié)同挖掘局域氣象數(shù)據(jù)[J].廣西大學學報,2014,39(5):1131-1137.(TengShaohua,FanJihui,ChenXiao,etal.ApplicationofSVM-basedmulti-classifiersinminingcooperativelylocalareameteorologicaldata[J].JournalofGuangxiUniversity,2014,39(5):1131-1137.)
[3]王劍輝,梁路,王彪.基于分支限界的不平衡氣象數(shù)據(jù)晴雨分析[J].計算機應用研究,2016,33(6):1648-1652.(WangJianhui,LiangLu,WangBiao.Analysisofimbalancedweatherdatabasedonbranch-andboundapproach[J].ApplicationResearchofComputers,2016,33(6):1648-1652.)
[4]蔣林利,吳建生,丁立新.基于二分搜索密度峰算法的RBFNN在月降水預報中的應用[J].計算機應用研究,2019,36(2):362-366.(JiangLinli,WuJiansheng,DingLixin.ApplicationofRBFNNbasedonTSDPCAinmonthlyrunoffforecasting[J].ApplicationResearchofComputers,2019,36(2):362-366.)
作者:吳卓升1,張巍1†,林艷2,滕少華1
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///dzlw/26370.html