本文摘要:摘要:【目的】通過非線性和多種機(jī)器學(xué)習(xí)算法構(gòu)建并對(duì)比不同的立木材積模型,為樟子松立木材積的精準(zhǔn)預(yù)測提供理論依據(jù)!痉椒ā恳源笈d安嶺圖強(qiáng)林業(yè)局184株樟子松伐倒木數(shù)據(jù)為例,建立非線性二元材積模型(NLR),并通過K折交叉檢驗(yàn)和oob誤差檢驗(yàn)的方法得到三種最優(yōu)機(jī)器
摘要:【目的】通過非線性和多種機(jī)器學(xué)習(xí)算法構(gòu)建并對(duì)比不同的立木材積模型,為樟子松立木材積的精準(zhǔn)預(yù)測提供理論依據(jù)!痉椒ā恳源笈d安嶺圖強(qiáng)林業(yè)局184株樟子松伐倒木數(shù)據(jù)為例,建立非線性二元材積模型(NLR),并通過K折交叉檢驗(yàn)和oob誤差檢驗(yàn)的方法得到三種最優(yōu)機(jī)器學(xué)習(xí)算法,包括:反向傳播神經(jīng)網(wǎng)絡(luò)(BP)、ε-支持向量回歸(ε-SVR)和隨機(jī)森林(RF)。對(duì)比分析不同模型間的差異,得到最優(yōu)立木材積模型!窘Y(jié)果】研究表明,機(jī)器學(xué)習(xí)算法在立木材積的擬合和預(yù)測中均優(yōu)于傳統(tǒng)二元材積模型,具體排序?yàn)镽F>BP>ε-SVR>NLR。其中RF相比于傳統(tǒng)模型的確定系數(shù)(R2)提高了2.00%,均方根誤差(RMSE)、相對(duì)均方根誤差(RMSE%)、平均絕對(duì)誤差(MAE)分別降低了22.95%、22.93%、36.34%,且與真實(shí)值相比平均相對(duì)誤差(MRB)的絕對(duì)值更低,由此證明了RF在立木材積預(yù)測中的優(yōu)越性!窘Y(jié)論】機(jī)器學(xué)習(xí)算法作為一種新興的建模方法可以有效地提高立木材積的預(yù)測精度,為森林資源的精準(zhǔn)調(diào)查和經(jīng)營管理提供新的解決方案。
關(guān)鍵詞:樟子松;二元材積模型;BP神經(jīng)網(wǎng)絡(luò);ε-支持向量回歸;隨機(jī)森林
立木材積是森林資源調(diào)查的重要指標(biāo),也是是計(jì)算森林蓄積量和生物量的主要依據(jù)[1-4]。因此,在森林經(jīng)營管理中,為更好的評(píng)經(jīng)濟(jì)效益和生態(tài)效益,立木材積的研究一直以來都被受關(guān)注。傳統(tǒng)立木材積的計(jì)算通常利用已知的一元或多元立木材積表,或通過擬圓錐法、質(zhì)心法、重要性采樣法等進(jìn)行估測[5-6]。隨著人們對(duì)森林資源調(diào)查的不斷深入,針對(duì)不同地區(qū)不同樹種相繼建立了不同類型的材積模型[7-8]。
但森林生長是一個(gè)復(fù)雜連續(xù)且具有隨機(jī)性的非線性生長過程,通過擬合立木材積模型雖然能填補(bǔ)材積預(yù)測的空白,卻受制于模型和變量的選擇以及對(duì)模型先驗(yàn)知識(shí)的累積,且預(yù)測精度受區(qū)域變化影響較大,增加了森林資源調(diào)查和經(jīng)營管理的難度。機(jī)器學(xué)習(xí)算法理論始于20世紀(jì)中葉,相比于傳統(tǒng)模型,機(jī)器學(xué)習(xí)算法可以在沒有先驗(yàn)知識(shí)的前提下對(duì)數(shù)據(jù)進(jìn)行擬合,分析數(shù)據(jù)中不同變量之間復(fù)雜、動(dòng)態(tài)的內(nèi)部結(jié)構(gòu)[9],而且機(jī)器學(xué)習(xí)算法的適用性更廣,應(yīng)用更加方便。能很好的克服數(shù)據(jù)中可能存在的缺失點(diǎn)、噪音、多重共線性和異方差等現(xiàn)象[10],在生物遺傳、信息技術(shù)和金融工程等領(lǐng)域已被廣泛應(yīng)用。近年來隨著統(tǒng)計(jì)軟件技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)算法在林業(yè)上也得到了一定的應(yīng)用。
Guan等[11]通過胸徑及其年增長量建立4種人工神經(jīng)網(wǎng)絡(luò)模型,成功的對(duì)紅松的生存率進(jìn)行了預(yù)測;Maria[12]通過人工神經(jīng)網(wǎng)絡(luò)模型估算樹皮材積,發(fā)現(xiàn)相比于非線性模型的RMSE降低了6.02%;Diamantopoulou等[13]通過對(duì)比分析不同的非線性模型和ε-支持向量機(jī)回歸模型對(duì)4種黑凱木樹皮材積的預(yù)測,得出ε-支持向量機(jī)回歸模型的FI值分別比3種非線性模型降低了3.32%、9.73%和12.23%,且與真實(shí)值更接近。Colin等[14]結(jié)合LiDAR數(shù)據(jù)建立多個(gè)模型對(duì)森林生物量進(jìn)行估算,結(jié)果表明支持向量機(jī)回歸為最優(yōu)模型。目前,已有部分機(jī)器學(xué)習(xí)算法應(yīng)用于立木材積中[15-19],但鮮有對(duì)不同類型算法同時(shí)進(jìn)行對(duì)比和分析的研究。
本文以大興安嶺樟子松(Pinussylvestrisvar.mongolica)為研究對(duì)象,利用matlab2019b建立3種目前應(yīng)用較為廣泛的機(jī)器學(xué)習(xí)算法:反向神經(jīng)網(wǎng)絡(luò)模型(BackPropagation,BP)、ε-支持向量機(jī)回歸模型(ε-SupportVectorRegression,ε-SVR)和隨機(jī)森林模型(RandomForest,RF),并與傳統(tǒng)二元材積模型作對(duì)比,評(píng)價(jià)最優(yōu)模型,為提高樟子松的立木材積預(yù)測精度和科學(xué)經(jīng)營提供理論依據(jù)。
1數(shù)據(jù)和方法
1.1數(shù)據(jù)來源
本文數(shù)據(jù)來源于大興安嶺圖強(qiáng)林業(yè)局(122°18′28″~123°28′10″E,52°15′35″~53°33′42″N)的樟子松數(shù)據(jù)。將樹木伐倒后測量其帶皮胸徑、樹高,并用15個(gè)相對(duì)樹高的帶皮直徑(0%、2%、4%、6%、8%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%),利用區(qū)分求積法計(jì)算樟子松帶皮立木材積。
通過散點(diǎn)圖排除異常點(diǎn)后得到184株樣木,以5cm為一個(gè)徑級(jí)分為10個(gè)徑階,按7:3分徑階隨機(jī)抽樣。最終得到訓(xùn)練樣本129株、測試樣本55株。為消除不同量級(jí)的變量對(duì)模型權(quán)重的影響,避免數(shù)值范圍超出算法的訓(xùn)練區(qū)間,同時(shí)加快網(wǎng)絡(luò)的收斂速度。建模前對(duì)樣本數(shù)據(jù)進(jìn)行min-max標(biāo)準(zhǔn)歸一化處理,使其統(tǒng)一介于[0,1]之間。得到的泛化結(jié)果通過反歸一化還原,并與真實(shí)值對(duì)比和評(píng)價(jià)。
1.2方法
1.2.1二元材積模型
傳統(tǒng)立木材積方程包括一元、多元線性和非線性模型,本文采用林業(yè)上應(yīng)用較為廣泛的二元非線性模型(Non-linearregressionmodels,NLR)作為立木材積公式[20-21]。
1.2.2反向神經(jīng)網(wǎng)絡(luò)模型(BackPropagation,BP)
BP是由輸入層、隱含層和輸出層組成的反向傳播網(wǎng)絡(luò)模型,不同層通過神經(jīng)元相互連接,但相同層神經(jīng)元互不相連。通過激活函數(shù)將上一層的輸入轉(zhuǎn)化為下一層的輸出,如輸出結(jié)果超出期望誤差,則通過誤差逆向傳播算法修正各神經(jīng)元函數(shù)的權(quán)值和閾值,并不斷重復(fù)上述過程以達(dá)到降低誤差的目的[22]。經(jīng)研究表明,三層BP神經(jīng)網(wǎng)絡(luò)即可擬合任何非線性曲線。本文以胸徑D、樹高H作為輸入節(jié)點(diǎn),材積V作為輸出節(jié)點(diǎn),建立結(jié)構(gòu)為2:S:1的三層神經(jīng)網(wǎng)絡(luò)模型。其中隱含層激活函數(shù)選用tansig,輸出層激活函數(shù)選用purelin函數(shù)。
利用經(jīng)驗(yàn)公式Sabc(式中為隱含層神經(jīng)元個(gè)數(shù),分別為輸入層和輸出層節(jié)點(diǎn)數(shù),為1到10之間的整數(shù))可得隱含層神經(jīng)元個(gè)數(shù)在3~12之間。通過適當(dāng)更改隱含層訓(xùn)練算法和神經(jīng)元個(gè)數(shù)可以有效的提高網(wǎng)絡(luò)擬合的速度和精度[23],并用提前結(jié)束訓(xùn)練的方法防止模型過擬合。
本文選用目前較為常用的幾種訓(xùn)練算法,包括梯度下降算法:變學(xué)習(xí)率動(dòng)量梯度下降算法(GDX)、變學(xué)習(xí)率梯度下降算法(GDA)、彈性梯度下降算法(RP);共軛梯度算法:PowellBeale共軛梯度算法(CGB)、Fletcher-Reeves共軛梯度法(CGF)、Polak-Ribiere共軛梯度法(CGP)、Scaled共軛梯度算法(SCG);擬牛頓及其他優(yōu)化算法:擬牛頓算法(BFG)、一步正割算法(OSS)、Levenberg-Marquardt算法(LM)。
1.2.3ε-支持向量回歸模型
(ε-SupportVectorRegression,ε-SVR)ε-SVR是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的超平面模型。通過核函數(shù)將低維空間中難以區(qū)分的向量通過非線性變換映射至高維空間中使其線性可分,借助懲罰因子C和核參數(shù)gamma降低數(shù)據(jù)與超平面之間的殘差,以達(dá)到提高模型精度的目的[17]。
因此改變核函數(shù)類型以及C、gamma參數(shù)可以有效降低誤差,得到最優(yōu)ε-SVR模型。常用的核函數(shù)方法包括線性核函數(shù)(Line)、多項(xiàng)式核函數(shù)(Polynomial)、徑向基核函數(shù)(RBF)等。其中C、gamma參數(shù)通常選用網(wǎng)格搜尋法,即設(shè)定兩個(gè)參數(shù)的范圍,按一定步長進(jìn)行組合建模。但是這種方法費(fèi)時(shí)費(fèi)力且精度不高,因此本文選用遺傳算法(GeneticAlgorithm,GA)進(jìn)行參數(shù)尋優(yōu)。
GA是一種通過模擬物種進(jìn)化過程研發(fā)的一種全局搜索優(yōu)化算法。通過生成一個(gè)初始群體并對(duì)數(shù)據(jù)進(jìn)行編碼、選擇、雜交、變異,不斷生成新的組合,計(jì)算每個(gè)組合的適應(yīng)度,通過“優(yōu)勝劣汰”的方法不斷篩選最優(yōu)個(gè)體,并以適應(yīng)度達(dá)到最大時(shí)的結(jié)果作為最優(yōu)參數(shù),并以K折交叉檢驗(yàn)對(duì)參數(shù)的解釋能力進(jìn)行評(píng)估。綜上所述,GA是一種通用性很強(qiáng)的參數(shù)尋優(yōu)方法,在機(jī)器學(xué)習(xí)中也有著廣泛的應(yīng)用[24]。
1.2.4隨機(jī)森林回歸模型(RandomForest,RF)
RF是一種基于bagging回歸的集成學(xué)習(xí)算法。通過對(duì)樣本數(shù)據(jù)進(jìn)行隨機(jī)且有放回重復(fù)采樣得到多個(gè)樣本組合,并通過節(jié)點(diǎn)分裂和隨機(jī)特征變量的隨機(jī)抽取形成多個(gè)決策樹形成“森林”,對(duì)每個(gè)決策樹得到的結(jié)果進(jìn)行加權(quán)平均,作為樣本的回歸結(jié)果[25]。由于每次采樣中總有大約三分之一的樣本未被選用,它們被稱為袋外數(shù)據(jù)(out-of-bag,oob)。
因此可利用這部分?jǐn)?shù)據(jù)計(jì)算袋外錯(cuò)誤率(out-of-bagerror)代替交叉檢驗(yàn)作為驗(yàn)證模型泛化能力的標(biāo)準(zhǔn),使得隨機(jī)森林可以有效的避免過擬合現(xiàn)象[26]。本文通過控制變量的方法對(duì)決策樹個(gè)數(shù)(ntree)、最小葉子大小(minleaf)、隨機(jī)抽取變量個(gè)數(shù)(mtry)3個(gè)參數(shù)進(jìn)行尋優(yōu),以得到最優(yōu)的RF模型。其他參數(shù)均選用軟件默認(rèn)設(shè)置。
1.3模型評(píng)價(jià)與檢驗(yàn)指標(biāo)
本文選用確定系數(shù)(R2)、平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)、相對(duì)均方根誤差(RMSE%)評(píng)價(jià)模型擬合和預(yù)測的能力,并通過平均相對(duì)誤差(MRB)檢驗(yàn)?zāi)P皖A(yù)測偏差的大小。為評(píng)價(jià)模型的無偏估計(jì)能力,選用z檢驗(yàn)判斷模型泛化結(jié)果與真實(shí)值是否存在顯著差異[19]。
2結(jié)果與分析
2.1NLR模型
通過最小二乘法得到3個(gè)參數(shù)分別為503.706010、11.5126、21.5662。最終二元材積表達(dá)式為51.51261.5662VDH3.706010。
2.2BP模型
通過胸徑D、樹高H和材積V建立三層BP模型,采用10折交叉檢驗(yàn)的方法對(duì)訓(xùn)練樣本分別進(jìn)行算法優(yōu)選和神經(jīng)元參數(shù)尋優(yōu)。為保證不同算法在統(tǒng)一標(biāo)準(zhǔn)下對(duì)比分析,模型的其他參數(shù)統(tǒng)一設(shè)置如下:隱含層神經(jīng)元個(gè)數(shù)為8、最大訓(xùn)練次數(shù)為2000、訓(xùn)練目標(biāo)誤差為0.00001、學(xué)習(xí)速率為0.05、動(dòng)量為0.9,其余參數(shù)均采用軟件默認(rèn)數(shù)值,并采取提前終止的辦法防止模型過擬合。
可以看出在3種梯度下降算法中RP算法的4個(gè)評(píng)價(jià)指標(biāo)均明顯由于其他兩種。通過比較可以看出4種共軛梯度算法的精度總體差距不大,其中CGF算法的R2略高于其他三者,但在RMSE、RMSE%、MAE的表現(xiàn)不如CGB算法,擬合誤差相對(duì)較大。
在其他三種優(yōu)化算法中LM算法無論在擬合優(yōu)度和誤差檢驗(yàn)均為最佳,相比于其他算法R2提高1.13%~5.26%,RMSE降低13.12%~39.81%,RMSE%降低17.41%~42.46%,MAE降低14.97%~45.94%。因此將LM算法作為BP模型的訓(xùn)練算法。根據(jù)經(jīng)驗(yàn)公式計(jì)算可得隱含層神經(jīng)元個(gè)數(shù)在3~12之間,通過試錯(cuò)法依次建模比較,在隱含層神經(jīng)元個(gè)數(shù)為7時(shí)模型R2最高且RMSE最低。綜上所述,最優(yōu)BP模型為LM-DH-7-V。
2.3ε-SVR模型
ε-SVR通過核函數(shù)將數(shù)據(jù)映射至高維空間中,尋找樣本期望風(fēng)險(xiǎn)最小的最優(yōu)超平面實(shí)現(xiàn)線性回歸。本文采用遺傳算法對(duì)三種常見的核函數(shù):線性核函數(shù)(Line)、多項(xiàng)式核函數(shù)(Polynomial)、徑向基核函數(shù)(RBF)進(jìn)行參數(shù)尋優(yōu),具體參數(shù)設(shè)置如下:最大進(jìn)化數(shù)為200,種群進(jìn)化數(shù)量為20、變異值為0.9、不敏感損失參數(shù)p=0.01、懲罰因子C搜索范圍(0,30)、核參數(shù)gamma搜索范圍(0,10),并通過10折交叉檢驗(yàn)得到3組最優(yōu)的模型參數(shù)。
可以看出精度最高的核函數(shù)是RBF,其次是Polynomial和Line核函數(shù)。相比于前兩者R2分別提高1.8%和11.11%,RMSE降低21.46%和52.82%,RMSE%降低21.44%和52.83%,MAE降低31.69%和59.02%,由此可見RBF不僅可以提高擬合能力,更能很好的降低誤差,故選用RBF作為ε-SVR模型的核函數(shù)并建立模型。
2.4RF模型
RF是通過構(gòu)建多個(gè)決策樹(ntree)隨機(jī)選取不同的變量(mtry),并以每個(gè)決策樹最小葉子節(jié)點(diǎn)(minleaf)均值作為模型最后回歸的結(jié)果,因此參數(shù)的大小直接影響模型擬合的精度。經(jīng)研究發(fā)現(xiàn),模型誤差大小隨ntree增加而逐漸減少至某一定值后,便不再發(fā)生變化。因此為確保模型充分訓(xùn)練,預(yù)設(shè)ntree個(gè)數(shù)為2000。采用控制變量的方法測定最優(yōu)minleaf的數(shù)量,在默認(rèn)mtry值下對(duì)比minleaf為1、3、5、10、20時(shí)的oob誤差值?梢钥闯鲭S著minleaf值逐漸減小,模型的誤差也逐漸減小,因此得出最優(yōu)的minleaf值為1。
當(dāng)ntree大于100后,oob誤差基本不再下降,意味著在建立100顆決策樹后模型已完成了訓(xùn)練。為縮短訓(xùn)練時(shí)間,提高模型運(yùn)行的效率,故將ntree的值調(diào)整為100。由于模型的輸入變量只有2個(gè),故mtry的取值范圍為[1,2],調(diào)整參數(shù)后對(duì)不同mtry值重新建立模型,兩條誤差曲線隨著ntree的提高最終重疊在一起,說明改變mtry值不會(huì)對(duì)模型誤差產(chǎn)生影響。但是在擬合過程中可以看出,當(dāng)mtry=2時(shí)模型收斂速度明顯優(yōu)于mtry=1,故mtry值設(shè)置為2。
2.5模型評(píng)價(jià)與檢驗(yàn)
選用最優(yōu)參數(shù)對(duì)訓(xùn)練樣本建模,并用測試樣本驗(yàn)證模型的預(yù)測能力。機(jī)器學(xué)習(xí)算法無論在擬合和預(yù)測中均明顯優(yōu)于傳統(tǒng)的二元材積模型,且機(jī)器學(xué)習(xí)算法中訓(xùn)練樣本與測試樣本的精度差異不大,證明模型并未發(fā)生過擬合現(xiàn)象。通過訓(xùn)練樣本得到的擬合評(píng)價(jià)結(jié)果可以看出,4種模型的R2均高于0.96,且RMSE均低于0.12m3,說明模型都具備較好的擬合能力。其中RF模型表現(xiàn)最好,相比于NLR、BP、ε-SVR,R2分別提高3.43%、2.05%、2.45%,RMSE降低67.30%、59.40%、62.31%,RMSE%降低67.29%、59.38%、62.28%,MAE降低71.48%、60.96%、59.52%。
通過計(jì)算MRB可以看出,所有模型的擬合結(jié)果均略高于真實(shí)值,其中RF模型的偏差最小。對(duì)4種模型的擬合評(píng)價(jià)作對(duì)比,除在MAE中ε-SVR略優(yōu)于BP模型,其余檢驗(yàn)均滿足RF>BP>ε-SVR>NLR。根據(jù)已建立的模型對(duì)對(duì)測試樣本預(yù)測,可以看出4種模型都有較好的預(yù)測能力,R2均高于0.95,RMSE均低于0.12,且與擬合結(jié)果同樣具有RF>BP>ε-SVR>NLR的模型精度次序。相比于其余三者,RF的R2分別提高2.00%、0.98%、1.23%,RMSE降低22.95%、13.49%、16.15%,RMSE%降低22.93%、15.53%、19.19%,MAE降低36.34%、22.10%、22.31%。
NLR與BP的預(yù)測結(jié)果略高于真實(shí)值,ε-SVR與RF的預(yù)測結(jié)果略低于真實(shí)值,通過比較MRB絕對(duì)值可知二元材積模型的預(yù)測偏差最大,RF模型偏差最小。為客觀評(píng)價(jià)模型的無偏估計(jì)能力,故對(duì)模型的擬合和預(yù)測結(jié)果進(jìn)行置信度為95%的z檢驗(yàn),以驗(yàn)證泛化結(jié)果與真實(shí)值的分布是否一致?梢钥闯4種模型的p值均遠(yuǎn)大于0.05,故接受H0保留原假設(shè),即結(jié)果與真實(shí)值不存在顯著差異。綜上所述,RF為最優(yōu)的大興安嶺樟子松立木材積預(yù)測模型。
3結(jié)論與討論
本文利用大興安嶺184株樟子松單木材積數(shù)據(jù)建立傳統(tǒng)二元材積模型,并與3種常見的機(jī)器學(xué)習(xí)算法進(jìn)行對(duì)比。研究結(jié)果表明,機(jī)器學(xué)習(xí)算法可以更好的預(yù)測大興安嶺樟子松材積。通過對(duì)測試樣本的預(yù)測結(jié)果對(duì)比分析中可以看出,預(yù)測精度大小排序?yàn)镽F>BP>ε-SVR>NLR。其中,RF模型的預(yù)測精度最高,相比于傳統(tǒng)模型,RF的R2提高2.00%、RMSE降低22.95%、RMSE%降低22.93%、MAE降低36.34%,且與真實(shí)值相比偏差更低。
通過減少訓(xùn)練樣本后重新建模,RF模型精度仍高于傳統(tǒng)模型,由此可以看出RF模型在樟子松立木材積預(yù)測中的優(yōu)越性。其余2種機(jī)器學(xué)習(xí)算法中,BP雖略優(yōu)于ε-SVR但與RF模型仍有較大差距。這是因?yàn)锽P模型所選用的LM算法與ε-SVR更適用于中小樣本[27-28],而建模所選用的樣本數(shù)量相對(duì)較大,此時(shí)RF模型在大樣本中的適應(yīng)性優(yōu)勢才被凸顯出來。但RF模型同樣存在一定的缺點(diǎn),在處理噪聲較大或小樣本中易發(fā)生過擬合現(xiàn)象[9],因此在面對(duì)此類問題時(shí)應(yīng)先對(duì)數(shù)據(jù)做預(yù)處理,避免對(duì)模型精度造成影響。
與機(jī)器學(xué)習(xí)算法相比,傳統(tǒng)模型雖然可以通過建立回歸方程的方式清晰地表達(dá)不同變量間相互影響的關(guān)系,但通常需要滿足很多檢驗(yàn)條件作為假設(shè)前提,例如正態(tài)性檢驗(yàn)、獨(dú)立性檢驗(yàn)、異方差檢驗(yàn)等,因此不能同時(shí)解釋復(fù)雜的森林生長因子,且不容易對(duì)含有噪聲的大尺度數(shù)據(jù)進(jìn)行擬合,隨著近年來科學(xué)技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)算法的出現(xiàn)很好地解決了傳統(tǒng)模型的問題。
在其他立木材積的研究中也證明了本研究的結(jié)果。Diamantopoulou等[15]和Bhering等[19]發(fā)現(xiàn)不同神經(jīng)網(wǎng)絡(luò)模型估算立木材積的精度均高于傳統(tǒng)的線性或非線性模型,Mushar等[18]在對(duì)比不同的機(jī)器學(xué)習(xí)算法與傳統(tǒng)模型后發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的精度在分類樹種材積比較中精度最高,而在全部類型樹種材積比較中支持向量機(jī)最高。
Wu等[17]運(yùn)用LiDAR數(shù)據(jù)對(duì)立木材積進(jìn)行估算,得出3中機(jī)器學(xué)習(xí)模型精度均高于傳統(tǒng)模型的結(jié)論,其中支持向量機(jī)精度高于隨機(jī)森林,這與本文研究結(jié)論略有差異。雖然機(jī)器學(xué)習(xí)算法目前仍存在一些問題,比如參數(shù)尋優(yōu)沒有統(tǒng)一的標(biāo)準(zhǔn)、無法掌握數(shù)據(jù)在黑箱中運(yùn)行的過程、易產(chǎn)生過擬合現(xiàn)象[11,29]等,但關(guān)于機(jī)器學(xué)習(xí)算法的研究還有廣闊的進(jìn)步空間?偠灾瑱C(jī)器學(xué)習(xí)算法作為一種新興的建模方法,在大興安嶺樟子松立木材積的預(yù)測中相比于傳統(tǒng)的二元材積模型有著明顯的優(yōu)勢,在森林經(jīng)營管理中是一種有效的替代方案。
參考文獻(xiàn)
[1]MaoP,QinLJ,HaoMY,etal.Animprovedapproachtoestimateabove-groundvolumeandbiomassofdesertshrubcommunitiesbasedonUAVRGBimages[J].EcologicalIndicators,125.DOI:10.1016/j.ecolind.2021.107494.
[2]MuukkonenP.GeneralizedallometricvolumeandbiomassequationsforsometreespeciesinEurope[J].EuropeanJournalofForestResearch,2007,126(2).DOI:10.1007/s10342-007-0168-4.
[3]廖祖輝.福建桉樹人工林材積表和蓄積量表編制的研究[J].福建林業(yè)科技,2005(02):17-20.LiaoZH.StudiesoftheVolumeTableandStockingTableCompilationsofEucalyptusPlantations[J].JourofFujianForestrySciandTech,2005(02):17-20.DOI:10.13428/j.cnki.fjlk.2005.02.005.
作者:孫銘辰,姜立春
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/29143.html