本文要點(diǎn):結(jié)合遙感與機(jī)器學(xué)習(xí)(ML)技術(shù)估算樹(shù)木生長(zhǎng)量和生產(chǎn)力已成為極具前景的研究方向。本研究通過(guò)高光譜變量評(píng)估了ML算法預(yù)測(cè)天然林樹(shù)種胸徑(DBH)和樹(shù)高(Ht)的性能。在混交林分中隨機(jī)選取195棵樣本樹(shù),利用350-2500nm波段的光譜讀數(shù)作為模型輸入變量。測(cè)試算法包括:人工神經(jīng)網(wǎng)絡(luò)(ANN)、決策樹(shù)(REPTree)、M5P決策樹(shù)、零規(guī)則算法(Zero R)、隨機(jī)森林(RF)和支持向量機(jī)(SVM)。采用兩種輸入配置:1)僅使用波長(zhǎng)變量(NOSP);2)結(jié)合波長(zhǎng)與樹(shù)種變量(WSP)。算法性能通過(guò)相關(guān)系數(shù)(r)、平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)進(jìn)行評(píng)價(jià)。研究發(fā)現(xiàn),以可見(jiàn)光-近紅外(VNIR)和短波紅外(SWIR)波段作為輸入時(shí),測(cè)試模型可相對(duì)準(zhǔn)確地預(yù)測(cè)DBH與Ht。引入樹(shù)種變量(WSP)后,DT、M5P和SVM算法對(duì)DBH和Ht的預(yù)測(cè)精度達(dá)到最高,相關(guān)系數(shù)均超過(guò)0.6。當(dāng)缺乏樹(shù)種信息時(shí),RF算法展現(xiàn)出更穩(wěn)定且準(zhǔn)確的預(yù)測(cè)能力,相關(guān)系數(shù)維持在0.5左右。本實(shí)證表明,機(jī)器學(xué)習(xí)算法與高光譜數(shù)據(jù)的融合為獲取精準(zhǔn)樹(shù)木測(cè)量數(shù)據(jù)提供了經(jīng)濟(jì)高效的解決方案,將有效推動(dòng)森林管理技術(shù)的進(jìn)步。


圖1. 研究區(qū)域位置
研究區(qū)域包括不同本地樹(shù)種的森林替代。該地區(qū)占地4.8公頃,其特點(diǎn)是種植了來(lái)自巴西植物群的本地森林物種,隨機(jī)分布,每個(gè)物種的樹(shù)木數(shù)量各不相同。該林分于 2013 年 3 月種植,位于巴西南馬托格羅索州南查帕當(dāng)市(圖 1)。該地區(qū)的土壤被歸類為粘土質(zhì)營(yíng)養(yǎng)不良紅。該地區(qū)氣候?yàn)槌睗竦臒釒夂?(Aw),其特點(diǎn)是夏季多雨,冬季干燥。年平均降雨量和溫度約為 750 和 1800 mm−1和 20 和 25 °C。
表1. 研究區(qū)域中評(píng)估的物種及其各自的數(shù)量 (n)

從屬于19種森林物種的195棵樹(shù)中隨機(jī)收集數(shù)據(jù)(表1)。在混交林區(qū)內(nèi)采集樹(shù)葉,以采集代表性樣本。隨機(jī)化涉及從地塊內(nèi)的不同位置選擇樹(shù)木,以確保廣泛的空間分布。

圖2. 每個(gè)采樣物種在離地面1.3米處的直徑(胸徑)、總高度(Ht)和每棵樹(shù)的莖數(shù)的平均值的箱線圖
測(cè)量所得樹(shù)木計(jì)量變量包括胸徑(DBH,單位:厘米)和全樹(shù)高(Ht,單位:米)。胸徑使用卷尺在離地1.3米處測(cè)量,當(dāng)單株胸徑超過(guò)15厘米時(shí),需將測(cè)量值除以π換算;對(duì)于多干型樹(shù)木,需分別測(cè)量每個(gè)主干并計(jì)算單株胸徑;樹(shù)高測(cè)量采用電子測(cè)角儀,多干樹(shù)僅選取最高主干進(jìn)行評(píng)估。圖2展示了各樹(shù)種樣本的胸徑、樹(shù)高及主干數(shù)量的分布情況,數(shù)據(jù)顯示不同樹(shù)種在這三項(xiàng)指標(biāo)上均存在顯著變異。

圖3. 數(shù)據(jù)收集和分析過(guò)程的流程圖
本研究通過(guò)ASD FieldSpec® 4高光譜儀采集195株樣本樹(shù)(每株3片葉片,共585片)的350-2500nm波段光譜數(shù)據(jù),專用接觸式探針有效抑制環(huán)境光干擾,確保測(cè)量精度。原始數(shù)據(jù)經(jīng)RS3軟件記錄,并由ViewSpectroPro轉(zhuǎn)化為.txt格式供分析;诿恐陿(shù)三片葉片的光譜均值構(gòu)建2151個(gè)波段變量數(shù)據(jù)庫(kù),選用六種機(jī)器學(xué)習(xí)算法(ANN、REPTree、M5P、RF、SVM、ZeroR)建模樹(shù)木胸徑(DBH)與樹(shù)高(Ht)。其中M5P算法通過(guò)回歸技術(shù)處理缺失值,ZeroR作為基準(zhǔn)模型提供參照;模型設(shè)置兩種輸入配置(純光譜變量NOSP、光譜+樹(shù)種變量WSP),采用k=10的分層交叉驗(yàn)證進(jìn)行十次重復(fù)測(cè)試,在Weka 3.8.5平臺(tái)默認(rèn)參數(shù)下運(yùn)行。模型性能通過(guò)皮爾遜相關(guān)系數(shù)(r)、平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)評(píng)估,差異顯著性經(jīng)R軟件方差分析及Scott-Knott檢驗(yàn)(p<0.05)驗(yàn)證。

圖4. 用于預(yù)測(cè)胸徑(DBH)的機(jī)器學(xué)習(xí)算法和輸入(有物種的高光譜信息——WSP和沒(méi)有物種的高譜信息——NOSP)的精度度量均值的牛津圖
圖4展示了采用WSP與NOSP兩種輸入配置的機(jī)器學(xué)習(xí)算法預(yù)測(cè)胸徑(DBH)的精度指標(biāo)箱線圖,重點(diǎn)呈現(xiàn)了相關(guān)系數(shù)(r)、平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)的性能差異。結(jié)果顯示:采用WSP配置時(shí),DT、M5P和SVM算法獲得更高r值(>0.6);而NOSP配置下,RF和SVM算法取得最優(yōu)r值(>0.6)。在各算法內(nèi)部對(duì)比中,DT、M5P和SVM使用WSP配置時(shí)精度顯著提升(r>0.6),其余算法則無(wú)顯著輸入配置差異。在誤差指標(biāo)方面(MAE與RMSE),WSP配置使DT、M5P和SVM的誤差均值降至更低水平(<6.0)?傮w而言,WSP輸入配置持續(xù)為所有算法提供更低的誤差率。

圖5. 用于預(yù)測(cè)樹(shù)高(Ht)的機(jī)器學(xué)習(xí)算法和輸入(有物種的高光譜信息——WSP和沒(méi)有物種的高譜信息——NOSP)的精度度量方法的箱線圖
圖5展示了采用WSP與NOSP兩種輸入配置的機(jī)器學(xué)習(xí)算法預(yù)測(cè)樹(shù)高(Ht)的精度指標(biāo)對(duì)比,包括相關(guān)系數(shù)(r)、平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)的變化情況。結(jié)果顯示:使用WSP配置時(shí),DT、M5P和SVM算法獲得最優(yōu)r值(>0.6);而NOSP配置下僅RF算法達(dá)到較高r值(>0.6)。在多數(shù)算法中,WSP配置均展現(xiàn)出更高的相關(guān)性。誤差分析表明,采用WSP時(shí)DT和M5P的MAE與RMSE最低(<2.5),而NOSP配置下僅RF算法誤差最。<3.0)。除RF算法在兩種配置下表現(xiàn)相近外,WSP普遍具有更低誤差。綜合來(lái)看,結(jié)合樹(shù)種變量(WSP)的高光譜數(shù)據(jù)顯著提升了機(jī)器學(xué)習(xí)算法(尤其是RF)對(duì)胸徑和樹(shù)高的預(yù)測(cè)性能。
本文首次利用高光譜數(shù)據(jù)預(yù)測(cè)熱帶本土混交林測(cè)樹(shù)變量,其創(chuàng)新性在于驗(yàn)證了樹(shù)種信息對(duì)預(yù)測(cè)精度的提升作用。采樣涵蓋19屬8科樹(shù)種增強(qiáng)了數(shù)據(jù)變異性,由于不同樹(shù)種特有的葉片形態(tài)和生理特征會(huì)形成獨(dú)特光譜印記,將樹(shù)種作為輸入變量可捕捉物種特異性生長(zhǎng)模式(如樹(shù)干結(jié)構(gòu)差異),從而顯著提升樹(shù)高和胸徑預(yù)測(cè)精度(尤其在RF算法中)。然而,全球超6萬(wàn)種樹(shù)木(僅巴西約1萬(wàn)種)的物種鑒定需耗費(fèi)大量數(shù)據(jù)采集精力,且變量引入會(huì)增加模型復(fù)雜度。研究發(fā)現(xiàn)當(dāng)樹(shù)種數(shù)據(jù)缺失時(shí),M5P、DT和SVM算法僅憑光譜數(shù)據(jù)仍能準(zhǔn)確預(yù)測(cè)變量,這種特征篩選能力降低了模型訓(xùn)練成本。特別值得注意的是,DT與SVM算法在農(nóng)林領(lǐng)域兼具強(qiáng)大的分類與回歸能力,而M5P模型在本研究中也展現(xiàn)出優(yōu)異的預(yù)測(cè)魯棒性和泛化能力。該研究為高光譜技術(shù)在復(fù)雜森林生態(tài)系統(tǒng)中的應(yīng)用提供了重要實(shí)踐依據(jù)。
研究揭示了高光譜數(shù)據(jù)與機(jī)器學(xué)習(xí)算法在林業(yè)參數(shù)預(yù)測(cè)中的協(xié)同效應(yīng),重點(diǎn)探討了樹(shù)種變量對(duì)模型性能的影響機(jī)制。研究發(fā)現(xiàn)隨機(jī)森林(RF)算法具有顯著優(yōu)勢(shì):在樹(shù)種數(shù)據(jù)缺失時(shí)仍保持穩(wěn)定預(yù)測(cè)性能(相關(guān)系數(shù)r>0.6),其抗噪特性使其成為復(fù)雜森林場(chǎng)景的理想選擇。研究創(chuàng)新性地證實(shí),引入樹(shù)種變量可使DT、M5P等算法的MAE降低至2.5以下,這源于不同樹(shù)種特有的葉片光譜特征(19屬8科樣本驗(yàn)證)。但研究也指出實(shí)踐瓶頸:全球6萬(wàn)種樹(shù)木的精確鑒定需要專業(yè)團(tuán)隊(duì)建立光譜數(shù)據(jù)庫(kù),建議未來(lái)研究應(yīng)擴(kuò)大樣本多樣性(包括不同生長(zhǎng)階段和外來(lái)物種)。該技術(shù)體系為森林資源調(diào)查提供了高性價(jià)比解決方案,其誤差優(yōu)化(WSP配置下RMSE降低23%)對(duì)采伐規(guī)劃、生產(chǎn)力評(píng)估等林業(yè)決策具有重要應(yīng)用價(jià)值。
參考文獻(xiàn)
Manfroi Filho E A, Teodoro P E, Teodoro L P R, et al. VNIR-SWIR spectroscopy and machine learning for measuring dendrometric variables in native species[J]. Remote Sensing Applications: Society and Environment, 2025, 37: 101522.
⭐️ ⭐️ ⭐️
動(dòng)物活體熒光成像系統(tǒng) - MARS
In Vivo Imaging System

⭐️ ⭐️ ⭐️
恒光智影
上海恒光智影醫(yī)療科技有限公司,被評(píng)為“國(guó)家高新技術(shù)企業(yè)”、“上海市專精特新中小企業(yè)”,獲批主持“科技部重大儀器專項(xiàng)”子課題,榮獲上海市“科技創(chuàng)新行動(dòng)計(jì)劃”科學(xué)儀器項(xiàng)目、上海市2025年度關(guān)鍵技術(shù)研發(fā)計(jì)劃“計(jì)算生物學(xué)”項(xiàng)目。
恒光智影,致力于為生物醫(yī)學(xué)、臨床前和臨床應(yīng)用等相關(guān)領(lǐng)域的研究提供先進(jìn)的、一體化的成像解決方案。
專注動(dòng)物活體成像技術(shù),成像范圍覆蓋 400-1700 nm,同時(shí)可整合CT, X-ray,超聲,光聲,光熱成像等技術(shù)。
可為腫瘤藥理、神經(jīng)藥理、心血管藥理、大分子藥代動(dòng)力學(xué)等一系列學(xué)科的科研人員提供清晰的成像效果,為用戶提供前沿的生物醫(yī)藥與科學(xué)儀器服務(wù)。