本文摘要:摘要智慧氣象和精準農(nóng)業(yè)結(jié)合下的現(xiàn)代農(nóng)業(yè)氣象工作意味著對包含遙感影像在內(nèi)的大型農(nóng)業(yè)和氣象數(shù)據(jù)高時效性的分析與處理,機器學習技術(shù)是當代自然科學研究和技術(shù)發(fā)展的主流技術(shù),亦是現(xiàn)代農(nóng)業(yè)氣象科研和業(yè)務(wù)發(fā)展的重要工具。該文系統(tǒng)論述了機器學習技術(shù)的主要
摘要智慧氣象和精準農(nóng)業(yè)結(jié)合下的現(xiàn)代農(nóng)業(yè)氣象工作意味著對包含遙感影像在內(nèi)的大型農(nóng)業(yè)和氣象數(shù)據(jù)高時效性的分析與處理,機器學習技術(shù)是當代自然科學研究和技術(shù)發(fā)展的主流技術(shù),亦是現(xiàn)代農(nóng)業(yè)氣象科研和業(yè)務(wù)發(fā)展的重要工具。該文系統(tǒng)論述了機器學習技術(shù)的主要方法及其在現(xiàn)代農(nóng)業(yè)氣象中的主要應(yīng)用方向,比較了不同方法在農(nóng)業(yè)氣象不同領(lǐng)域應(yīng)用的情況,側(cè)重介紹了基于深度學習技術(shù)的成果和近年來的最新研究進展。傳統(tǒng)淺層機器學習技術(shù)中,以支持向量機和人工神經(jīng)網(wǎng)絡(luò)應(yīng)用最為廣泛且效果最為理想。近年來,隨機森林和梯度提升機等決策樹集成方法普遍取得優(yōu)于核方法的精度,深度學習技術(shù)則在某些任務(wù)中取得更優(yōu)于集成學習的精度。未來,有待檢驗機器學習技術(shù)特別是深度學習技術(shù)在更多農(nóng)業(yè)氣象問題上的適用性和先進性,更好地迎接現(xiàn)代農(nóng)業(yè)氣象發(fā)展的新挑戰(zhàn)與新機遇。
關(guān)鍵詞:機器學習;深度學習;農(nóng)業(yè)氣象;農(nóng)業(yè)遙感
引言
農(nóng)業(yè)在全球經(jīng)濟中發(fā)揮著基礎(chǔ)性且至關(guān)重要的作用,國家和地區(qū)農(nóng)業(yè)生產(chǎn)力高低直接影響其工業(yè)化程度與經(jīng)濟水平,落后的農(nóng)業(yè)技術(shù)會帶來饑餓、貧窮與社會發(fā)展的滯后[1]。到2050年,全球?qū)⑿略?0億左右人口[2],加之氣候變化對農(nóng)業(yè)生產(chǎn)的影響[3],使得消除饑餓和保障糧食安全成為當今世界可持續(xù)發(fā)展的重要議題[4],農(nóng)業(yè)技術(shù)的進步可有力應(yīng)對該挑戰(zhàn)[5]。精準農(nóng)業(yè)被列為農(nóng)業(yè)領(lǐng)域的十大發(fā)展之一[6],其特點是應(yīng)用密集的數(shù)據(jù)———以遙感技術(shù)[7]和無線傳感器技術(shù)[8]為主要手段采集信息并進行時空處理,提高農(nóng)業(yè)生產(chǎn)效率、作物產(chǎn)量和環(huán)境質(zhì)量。農(nóng)業(yè)氣象學是研究農(nóng)業(yè)生產(chǎn)與氣象條件之間相互關(guān)系及其規(guī)律的科學,以促進農(nóng)業(yè)生產(chǎn)為主旨,圍繞現(xiàn)代氣象與現(xiàn)代農(nóng)業(yè)的智慧化進程也在不斷進行著自身的科學創(chuàng)新,智慧氣象和精準農(nóng)業(yè)結(jié)合下的現(xiàn)代農(nóng)業(yè)氣象工作意味著對納入遙感可視化數(shù)據(jù)在內(nèi)的大型農(nóng)業(yè)和氣象數(shù)據(jù)高時效性的分析與處理[9],機器學習(machinelearning,ML)技術(shù)對其發(fā)展有很大的助力。
農(nóng)業(yè)論文投稿刊物:《現(xiàn)代農(nóng)業(yè)科學》本刊內(nèi)容分為三部分,第一部分是農(nóng)業(yè)科學,相關(guān)欄目設(shè)置有:畜牧獸醫(yī)、生物技術(shù)、資源與環(huán)境、園林科學、食品加工、水產(chǎn)養(yǎng)殖、植物保護、生態(tài)農(nóng)業(yè);第二部分是農(nóng)業(yè)教育教學,相關(guān)欄目設(shè)置有:教育教學管理、教育發(fā)展研究、高校領(lǐng)導論壇、比較教育、學生工作;第三部分是三農(nóng)問題研究。
ML是圖像處理和大數(shù)據(jù)分析不可或缺的技術(shù),廣泛應(yīng)用于醫(yī)學、藥學、經(jīng)濟學、生物學、水文學、農(nóng)業(yè)氣象學等諸多科學領(lǐng)域[1013]。深度學習(deeplearning,DL)和淺層學習中的梯度提升機(gradientboostingmachine,GBM)是當前最受矚目的兩項ML技術(shù),其中DL結(jié)構(gòu)中最著名的卷積神經(jīng)網(wǎng)絡(luò)(convolutionneuralnetwork,CNN)自2012年起已成為計算機視覺任務(wù)的首選解決方案[14],F(xiàn)代農(nóng)業(yè)氣象研究不僅涉及大量氣象數(shù)據(jù)、土壤數(shù)據(jù)、作物觀測數(shù)據(jù),也涉及到農(nóng)業(yè)遙感中采集自地面、無人機、衛(wèi)星的海量影像數(shù)據(jù),DL技術(shù)的特點及其在機器視覺領(lǐng)域的優(yōu)勢使其在現(xiàn)代農(nóng)業(yè)氣象工作中具有很大的應(yīng)用潛力[15]。本文對ML技術(shù)的主要方法及其在現(xiàn)代農(nóng)業(yè)氣象中尤其是涉及農(nóng)業(yè)遙感的應(yīng)用進行系統(tǒng)性介紹。由于所涉及的文獻眾多,側(cè)重列舉代表性文獻,對其研究成果進行概要介紹,且重點列舉出DL技術(shù)的應(yīng)用實例,旨在推動ML技術(shù)特別是DL技術(shù)在現(xiàn)代農(nóng)業(yè)氣象科研與業(yè)務(wù)中的深入應(yīng)用。
1ML技術(shù)概述
ML技術(shù)蓬勃發(fā)展于20世紀90年代,是人工智能(artificialintelligence,AI)中最受歡迎和最成功的子領(lǐng)域。ArthurSamuel將ML定義為一門不需要通過外部程序指令而讓計算機具有自我學習能力的學科。在傳統(tǒng)編程中,人類輸入規(guī)則和需要規(guī)則處理的數(shù)據(jù),計算機輸出答案;而在ML技術(shù)中,人類輸入數(shù)據(jù)和期望從數(shù)據(jù)中得到的答案,計算機通過訓練找到數(shù)據(jù)和答案間的統(tǒng)計結(jié)構(gòu)、輸出規(guī)則,并將這些規(guī)則應(yīng)用于該任務(wù)的新數(shù)據(jù)進而生成答案[14]。
ML技術(shù)與經(jīng)典統(tǒng)計分析的一項重要區(qū)別是ML技術(shù)傾向于處理大型、復雜的數(shù)據(jù)集,以及沒有已知算法可解決的問題。將ML技術(shù)用于大數(shù)據(jù)挖掘可以適應(yīng)新的數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中隱含的模式,減少人工分析工作量,更好地處理解并解決傳統(tǒng)方法難以應(yīng)對的復雜問題[16]。ML技術(shù)是一個日益龐大的家族,其包含的眾多算法與模型可根據(jù)不同標準進行歸類。其中一種廣泛使用的分類方法是根據(jù)訓練過程中得到的監(jiān)督的數(shù)量和類型,將其分為監(jiān)督學習、非監(jiān)督學習、半監(jiān)督學習和強化學習[16]。
在監(jiān)督學習中,需要人工為訓練數(shù)據(jù)加標簽(即明確的屬性標識),其代表性方法包括線性回歸(linearregression)、邏輯回歸(logisticregression)、樸素貝葉斯(navebayes)、高斯判別(gaussiandiscriminantanalysis,GDA)、支持向量機(supportvectormachine,SVM)、神經(jīng)網(wǎng)絡(luò)(neuralnetwork,NN)、K最鄰近法(KNearestneighbor,KNN)、決策樹(decisiontrees,DTs)、隨機森林(randomforest,RF)和梯度提升機等;在非監(jiān)督學習中,訓練數(shù)據(jù)則不加標簽,其主要方法包括以期望最大化算法(expectationmaximization)、分層聚類分析(hierarchicalclusteranalysis,HCA)、K均值法(Kmeans)為代表的聚類方法,以主成分分析(principalcomponentanalysis,PCA)和局部線性嵌入算法(locallylinearembedding,LLE)為代表的降維算法,以及Apriori,F(xiàn)PGrowth,Eclat等關(guān)聯(lián)規(guī)則學習算法;在半監(jiān)督學習中,僅需為少量訓練數(shù)據(jù)加標簽,或為訓練數(shù)據(jù)加不確定性標簽,其重要方法包括拉普拉斯支持向量機(laplacianSVM)、協(xié)同過濾算法(collaborativefiltering),以及貝葉斯網(wǎng)絡(luò)(bayesiannetwork)、馬爾科夫隨機場(markovrandomfiled)等概率圖模型;在強化學習中,不需要預先給定訓練數(shù)據(jù),而是通過接收環(huán)境對動作的反饋獲得學習信息,代表性算法包括策略梯度(policygradient,PG)、Q學習(Qlearning)、深度Q網(wǎng)絡(luò)(deepQnetwork)、Sarsa算法等[1720]。
DL技術(shù)是ML技術(shù)的一個子領(lǐng)域,代表著一類思想,即以多層結(jié)構(gòu)從數(shù)據(jù)中學習表示(representation),其結(jié)構(gòu)通常包含數(shù)十個乃至上百個連續(xù)的表示層。DL技術(shù)起源于神經(jīng)網(wǎng)絡(luò),在神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上增加了層級,可自動提取復雜特征,近年來,DL技術(shù)以其更高精度和更優(yōu)性能,在諸多應(yīng)用領(lǐng)域已經(jīng)取代了以往支持向量機和集成學習的領(lǐng)先地位[14]。
DL技術(shù)較經(jīng)典ML技術(shù)的優(yōu)勢主要體現(xiàn)在以下幾方面:①DL技術(shù)完全自動化了淺層ML技術(shù)的關(guān)鍵步驟———特征工程,對使用者更為簡單、友好;②DL技術(shù)具有深層非線性網(wǎng)絡(luò)結(jié)構(gòu),采用遞增的、逐層的方式開發(fā)愈加復雜的特征,具有更強的學習能力,有助于解決淺層ML技術(shù)難以解決的復雜問題,并可進行遷移學習;③DL技術(shù)可以一次性學習所有特征,并持續(xù)在線學習,具有實時運算能力[2123]。DL的基本模型包括卷積神經(jīng)網(wǎng)絡(luò)、深度信念網(wǎng)絡(luò)(deepbeliefnetwork,DBN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(reccurentneuralnetwork,RNN)、深度自動編碼器(deepautoencoder,DA)、遞歸神經(jīng)網(wǎng)絡(luò)(recursiveneuralnetwork,RNN)等。
2ML技術(shù)在農(nóng)業(yè)氣象工作中的應(yīng)用
2.1制圖與區(qū)劃
土地覆蓋與作物類型圖是農(nóng)業(yè)氣象工作的重要基礎(chǔ)數(shù)據(jù)之一。過去的十幾年中,隨著遙感數(shù)據(jù)時空分辨率不斷提高,以及大量豐富的免費數(shù)據(jù)源向公眾開放,將遙感影像用于土地覆蓋與作物類型分類制圖方面的研究呈指數(shù)增長,ML技術(shù)中多種經(jīng)典算法、模型已成功應(yīng)用于該類任務(wù)[2426],根據(jù)Yu等[27]的統(tǒng)計,最大似然分類法使用頻率最高,相關(guān)文獻中應(yīng)用比例達32.34%,最大似然分類法和K最鄰近法、K均值法等也是文獻中平均精度較低的方法,分類精度較高的方法則是集成分類器、人工神經(jīng)網(wǎng)絡(luò)和支持向量機。
Khatami等[28]進一步統(tǒng)計分析了既往研究,指出傳統(tǒng)監(jiān)督分類方法中支持向量機平均精度最高,緊隨其后的是人工神經(jīng)網(wǎng)絡(luò),且當影像空間分辨率和光譜分辨率提高時,支持向量機表現(xiàn)出較人工神經(jīng)網(wǎng)絡(luò)更大的優(yōu)勢。此外,ML技術(shù)在作物管理區(qū)的劃分方面已有成功應(yīng)用的例子,Pantazi等[29]利用K均值法和自組織映射結(jié)合遙感數(shù)據(jù)、土壤參數(shù)和產(chǎn)量數(shù)據(jù)進行了作物管理分區(qū),進一步看,農(nóng)業(yè)氣候區(qū)劃(如農(nóng)作物品質(zhì)氣候區(qū)劃)、農(nóng)業(yè)氣象災(zāi)害風險區(qū)劃、農(nóng)業(yè)保險風險區(qū)劃[3031]等是農(nóng)業(yè)氣象工作的重要任務(wù),有待有針對性地將ML技術(shù)應(yīng)用于區(qū)劃工作。近年來,最受歡迎和最具效率的多源多時相遙感影像土地覆蓋與作物制圖方法是集成學習和DL技術(shù)[32]。
針對復雜地區(qū)的分類問題,集成學習的經(jīng)典算法隨機森林的分類精度明顯優(yōu)于傳統(tǒng)的決策樹[33],DL結(jié)構(gòu)中的卷積神經(jīng)網(wǎng)絡(luò)、深度自動編碼器、深度信念網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等均被用于探索該類任務(wù)[3438]。Minh等[39]利用兩種循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合星載合成孔徑雷達(syntheticapertureradar,SAR)影像制作了冬季植被質(zhì)量分類圖,制圖精度優(yōu)于支持向量機和隨機森林。Yang等[40]研究表明:DL技術(shù)用于土地覆蓋分類的精度高于支持向量機等淺層學習模型,且DL技術(shù)無需人工設(shè)計分類特征,并可在分類中使用遷移學習。Kussul等[32]將卷積神經(jīng)網(wǎng)絡(luò)用于作物制圖的精度與隨機森林和一種集成的多層感知器(multilayerperceptrons,MLPs)方法對比,結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)精度最高。
2.2檢測與觀測
雜草檢測是地基農(nóng)業(yè)遙感的一項重要任務(wù),有研究認為雜草是對農(nóng)作物生產(chǎn)最大的威脅,ML技術(shù)和田間傳感器結(jié)合可以精確檢測田間雜草,進而應(yīng)用于農(nóng)業(yè)工具和農(nóng)業(yè)機器人的除草作業(yè),最大程度減少除草劑的使用[41]。Cho等[42]使用電荷耦合元件(chargecoupleddevice,CCD)相機和人工神經(jīng)網(wǎng)絡(luò)組成的機器視覺系統(tǒng)識別了雜草與蘿卜。Karimi等[43]將支持向量機用于玉米田雜草和氮素脅迫檢測,取得比人工神經(jīng)網(wǎng)絡(luò)更高的精度。Binch等[44]的對比研究表明:在經(jīng)典ML技術(shù)中,支持向量機取得最優(yōu)的雜草檢測效果。近年來的研究表明:DL技術(shù)可有效從圖像中自動提取特征,在目標識別中取得優(yōu)于支持向量機的精度[4547]。
王璨等[48]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)準確識別了幼苗期玉米與雜草。Dyrmann等[49]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)田影像中識別了22種雜草與作物物種,并在后續(xù)研究中將全卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于存在嚴重葉片遮擋的情況下,從谷物田中成功識別單株雜草[50]。除雜草檢測,張雪芬等[51]利用支持向量機結(jié)合CCD影像實現(xiàn)了作物發(fā)育期的圖像自動識別,余衛(wèi)東等[52]在對中國農(nóng)業(yè)氣象自動化觀測的展望中提及計算機視覺技術(shù)的應(yīng)用,ML技術(shù)在今后的農(nóng)業(yè)氣象自動化觀測中有待發(fā)揮更重要的作用。
DL技術(shù)可以從高維海量數(shù)據(jù)中強有力提取復雜的結(jié)構(gòu)信息[21],近年來在植株表型觀測、病蟲害檢測、農(nóng)田障礙檢測、果實檢測等任務(wù)中得到成功應(yīng)用[5355],可極大提升農(nóng)業(yè)氣象自動化觀測水平。Christiansen等[56]對比了DL技術(shù)和經(jīng)典ML技術(shù)在農(nóng)田障礙和異常檢測中的應(yīng)用效果,結(jié)果顯示DL技術(shù)具有最高精度和最快運算速度。Yalcin等[57]利用卷積神經(jīng)網(wǎng)絡(luò)自動提取圖像特征,識別農(nóng)業(yè)植被的物候期,精度優(yōu)于基于手工設(shè)計特征的經(jīng)典ML技術(shù)。Jin等[58]應(yīng)用更快速的區(qū)域卷積神經(jīng)網(wǎng)絡(luò)和區(qū)域生長法從Lidar3D點云中分割單株玉米,可準確測量植株高度。
Ubbens等[59]開發(fā)了可用于葉片計數(shù)等植物表型任務(wù)的DL平臺。Xiong等[60]開發(fā)了基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分割軟件用于水稻穗部分割,可實現(xiàn)水稻表型自動化測量,段凌鳳等[61]和張領(lǐng)先等[62]開展了類似研究。Baweja等[63]使用CCD相機和卷積神經(jīng)網(wǎng)絡(luò)組成的機器視覺系統(tǒng)自動計算莖稈數(shù)并測量莖寬。黃雙萍等[64]利用卷積神經(jīng)網(wǎng)絡(luò)和穗株高光譜圖像提取不同尺度穗瘟病斑分布式特征,實現(xiàn)水稻穗瘟病害的精準檢測。Mohanty等[65]通過遷移學習和重新訓練兩種方式訓練卷積神經(jīng)網(wǎng)絡(luò),有效識別14種作物物種和26種作物病害,孫俊等[66]開展了類似工作。Rahnemoonfar等[67]提出一種DL結(jié)構(gòu)用于果實計數(shù),即使水果處于陰影下,或被樹葉、樹枝遮擋,或水果之間存在一定程度的重疊,也能有效計數(shù)。薛月菊等[68]利用DL技術(shù)中的YOLOv2網(wǎng)絡(luò)檢測未成熟芒果,表明該方法在復雜場景下的檢測精度優(yōu)于更快速的區(qū)域卷積神經(jīng)網(wǎng)絡(luò)。
2.3產(chǎn)量預測
在健康的生態(tài)系統(tǒng)下以最低成本取得最大作物產(chǎn)量是農(nóng)業(yè)生產(chǎn)最重要的目標之一[69]。作物產(chǎn)量預測是農(nóng)業(yè)氣象工作中的一項重要任務(wù),關(guān)系到糧食安全、種植結(jié)構(gòu)調(diào)整、作物管理、農(nóng)業(yè)保險等,提高預測的準確性有助于增加作物產(chǎn)量和商業(yè)利潤。經(jīng)典統(tǒng)計方法難以準確預測作物產(chǎn)量的非線性時空變化,當前更有效的產(chǎn)量預測方法包括作物生長模擬和ML技術(shù)[70]。作物生長模型將作物生長階段的動態(tài)機制以數(shù)學模型抽象表達[71],建模過程耗時且昂貴,其運行所需參數(shù)集在發(fā)展中國家尤難獲取。另一方面的研究中,經(jīng)典ML技術(shù)與遙感數(shù)據(jù)、氣象數(shù)據(jù)、土壤數(shù)據(jù)等結(jié)合實現(xiàn)了不同尺度下不同作物產(chǎn)量的準確預測[7273],并有學者對比不同方法的預測能力。
Fortin等[74]研究表明:在馬鈴薯產(chǎn)量預測中,多層感知器預測效果優(yōu)于多元線性回歸。Ruβ[75]對比了多層感知器、回歸樹、徑向基核函數(shù)網(wǎng)絡(luò)和支持向量回歸用于冬小麥產(chǎn)量預測的精度,表明支持向量回歸預測結(jié)果最準確。González等[70]對比了多元線性回歸、M5Prime回歸樹、人工神經(jīng)網(wǎng)絡(luò)、K最鄰近法和支持向量回歸對大規(guī)模種植的多種作物產(chǎn)量的預測能力,結(jié)果顯示:M5Prime回歸樹表現(xiàn)最優(yōu),作者同時指出變量和屬性的選取直接影響不同算法、模型的預測精度,這是其研究與前人研究結(jié)論存在差異的主要原因。與產(chǎn)量預測緊密相關(guān)的農(nóng)業(yè)氣象災(zāi)害風險評估是農(nóng)業(yè)氣象學領(lǐng)域中研究的熱點[7680],較之傳統(tǒng)技術(shù)手段,ML技術(shù)對此有很大的應(yīng)用潛力,目前已有研究將ML技術(shù)用于農(nóng)業(yè)氣象災(zāi)害遙感監(jiān)測與產(chǎn)量影響評估,如Park等[81]利用隨機森林等ML技術(shù)與多源遙感數(shù)據(jù)結(jié)合,對農(nóng)業(yè)干旱進行監(jiān)測評估。
2.4參數(shù)估算
農(nóng)業(yè)氣象研究相關(guān)的水文、土壤、作物參數(shù)通過站點觀測無法取得其連續(xù)準確的空間分布情況,且某些參數(shù)測量難度大、費用昂貴。ML技術(shù)與氣象數(shù)據(jù)、遙感數(shù)據(jù)等相結(jié)合,可簡單、高效地實現(xiàn)參數(shù)估算,且使對其時空連續(xù)性監(jiān)測與預報成為可能。農(nóng)業(yè)氣象工作關(guān)注的熱點參數(shù)包括蒸散、土壤濕度、土壤溫度、氮素含量、葉面積指數(shù)、生物量等。準確估算蒸散對農(nóng)業(yè)灌溉水資源時空優(yōu)化配置至關(guān)重要,同時該參數(shù)測量難度較大。Yang等[87]利用支持向量機結(jié)合通量觀測數(shù)據(jù)與MODIS遙感數(shù)據(jù)實現(xiàn)了大尺度蒸散的時空變化預測。
Jung等[88]使用一種模型樹集成的ML技術(shù)集成站點觀測蒸散與遙感數(shù)據(jù)和氣象數(shù)據(jù),估算全球尺度的多年蒸散。Patil等[89]將ML技術(shù)與氣象數(shù)據(jù)結(jié)合估算參考蒸散,表明單層前饋神經(jīng)網(wǎng)絡(luò)中的極限學習機(extremelearningmachine,ELM)和最小二乘支持向量機估算精度高于經(jīng)驗?zāi)P。Mehdizadeh等[90]利用支持向量機、基因表達式編程、多元自適應(yīng)回歸樣條與氣象觀測資料結(jié)合估算干旱與半干旱地區(qū)的月平均參考蒸散,顯示支持向量機和多元自適應(yīng)回歸樣條效果最好。
3小結(jié)
本文系統(tǒng)概述了ML技術(shù)的主要方法及其在現(xiàn)代農(nóng)業(yè)氣象中的主要應(yīng)用方向,有針對性且全面涵蓋了現(xiàn)代農(nóng)業(yè)氣象中特別是涉及農(nóng)業(yè)遙感的ML技術(shù)的研究及應(yīng)用情況,并納入近年來最新的研究進展。本文將ML技術(shù)在農(nóng)業(yè)氣象工作中的主要應(yīng)用歸納為4個方面:制圖與區(qū)劃、檢測與觀測、產(chǎn)量預測和參數(shù)估算。在制圖與區(qū)劃方面,ML技術(shù)與遙感影像結(jié)合實現(xiàn)了不同尺度的土地覆蓋與作物類型制圖,亦已結(jié)合遙感數(shù)據(jù)、土壤數(shù)據(jù)、統(tǒng)計數(shù)據(jù)用于作物長勢、植被質(zhì)量等專題圖的制作與作物管理區(qū)劃分;在檢測與觀測方面,ML技術(shù)成功用于田間影像中的雜草檢測,DL技術(shù)在植株表型觀測、病蟲害檢測、農(nóng)田障礙檢測、果實檢測等方面,取得了理想精度,可極大提升農(nóng)業(yè)氣象自動化觀測水平。
在產(chǎn)量預測方面,ML技術(shù)與遙感時間序列數(shù)據(jù)、氣象數(shù)據(jù)、土壤數(shù)據(jù)結(jié)合在不同尺度成功預測了不同作物的產(chǎn)量,與之相關(guān),ML技術(shù)在農(nóng)業(yè)氣象災(zāi)害評估中也有很大的應(yīng)用潛力;在參數(shù)估算方面,農(nóng)業(yè)氣象研究關(guān)注的以蒸散、葉面積指數(shù)、土壤濕度、氮素含量等為代表的水文、土壤、作物參數(shù)均可利用ML技術(shù)與氣象數(shù)據(jù)、遙感數(shù)據(jù)等的結(jié)合實現(xiàn)精確反演或預測。綜合看,傳統(tǒng)淺層ML技術(shù)中以支持向量機和人工神經(jīng)網(wǎng)絡(luò)在本文涉及的諸多任務(wù)中應(yīng)用最為廣泛且效果最為理想。近年來的方法對比類研究中,隨機森林和梯度提升機等集成學習方法普遍取得優(yōu)于支持向量機和人工神經(jīng)網(wǎng)絡(luò)的精度,DL技術(shù)則在某些任務(wù)中取得更優(yōu)于集成學習的精度,且可解決淺層ML技術(shù)較難解決的一些問題,如在農(nóng)業(yè)氣象觀測中可精準實現(xiàn)植株表型的自動化觀測。
從應(yīng)用時間上看,人工神經(jīng)網(wǎng)絡(luò)和支持向量機等淺層ML技術(shù)自20世紀90年代開始在農(nóng)業(yè)氣象和農(nóng)業(yè)遙感中應(yīng)用并逐漸繁榮,其中人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用略早于支持向量機,而以支持向量機為代表的核方法則較人工神經(jīng)網(wǎng)絡(luò)更具優(yōu)勢;決策樹自21世紀開始受到學界的關(guān)注,2010年后隨機森林和梯度提升機等決策樹集成方法在很多方面被認為是較核方法更好的選擇;DL技術(shù)自2012年前后重回主流學界的視野,伴隨卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)的成功,自2015年后被廣泛認為在諸多應(yīng)用中的表現(xiàn)超越了支持向量機和集成學習[14]。
盡管將DL技術(shù)應(yīng)用于農(nóng)業(yè)問題的先驅(qū)探索始于2010年[110],但大部分研究成果發(fā)表于2015年以后[15],且有逐年增多的趨勢,國內(nèi)相關(guān)研究相對滯后,多數(shù)發(fā)表于2017年以后,且涉及到的現(xiàn)代農(nóng)業(yè)氣象中的問題尚十分有限。目前有待驗證ML技術(shù)特別是DL技術(shù)在更多農(nóng)業(yè)氣象問題上的適用性和先進性,如農(nóng)業(yè)氣象災(zāi)害遙感監(jiān)測與損失評估、農(nóng)業(yè)氣象災(zāi)害風險評估與區(qū)劃、農(nóng)業(yè)氣候區(qū)劃、氣候變化對作物生長的影響評估等任務(wù),同時,伴隨ML技術(shù)的發(fā)展,特別是類似長短期記憶網(wǎng)絡(luò)的DL時間維算法和新結(jié)構(gòu)的發(fā)展,有望更好地結(jié)合以風云系列氣象衛(wèi)星數(shù)據(jù)為代表的遙感時間序列數(shù)據(jù),在制圖、估產(chǎn)、預測等諸多已開展研究的任務(wù)中取得更高的精度和準確性。
特別地,將ML技術(shù)與智能手機等移動終端結(jié)合,可為農(nóng)業(yè)管理者和生產(chǎn)者提供功能強大且智慧化的農(nóng)業(yè)氣象信息服務(wù);將DL技術(shù)與地基觀測、無人機遙感等結(jié)合,開發(fā)相關(guān)業(yè)務(wù)系統(tǒng),可以顯著提升農(nóng)業(yè)氣象自動化觀測水平。同時,需要認識到ML技術(shù)中沒有一種方法可以取代其他所有方法,在現(xiàn)代農(nóng)業(yè)氣象工作中需要根據(jù)具體任務(wù)和數(shù)據(jù)情況選擇最適用的ML技術(shù),如梯度提升機在當今被普遍認為是處理非感知數(shù)據(jù)的最好算法之一,而當訓練數(shù)據(jù)有限時,淺層ML技術(shù)往往比DL技術(shù)更適用。
作者:李穎陳懷亮
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///nylw/23473.html