本文要点:结合遥感与机器学习(ML)技术估算树木生长量和生产力已成为极具前景的研究方向。本研究通过高光谱变量评估了ML算法预测天然林树种胸径(DBH)和树高(Ht)的性能。在混交林分中随机选取195棵样本树,利用350-2500nm波段的光谱读数作为模型输入变量。测试算法包括:人工神经网络(ANN)、决策树(REPTree)、M5P决策树、零规则算法(Zero R)、随机森林(RF)和支持向量机(SVM)。采用两种输入配置:1)仅使用波长变量(NOSP);2)结合波长与树种变量(WSP)。算法性能通过相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)进行评价。研究发现,以可见光-近红外(VNIR)和短波红外(SWIR)波段作为输入时,测试模型可相对准确地预测DBH与Ht。引入树种变量(WSP)后,DT、M5P和SVM算法对DBH和Ht的预测精度达到最高,相关系数均超过0.6。当缺乏树种信息时,RF算法展现出更稳定且准确的预测能力,相关系数维持在0.5左右。本实证表明,机器学习算法与高光谱数据的融合为获取精准树木测量数据提供了经济高效的解决方案,将有效推动森林管理技术的进步。
图1. 研究区域位置
研究区域包括不同本地树种的森林替代。该地区占地4.8公顷,其特点是种植了来自巴西植物群的本地森林物种,随机分布,每个物种的树木数量各不相同。该林分于 2013 年 3 月种植,位于巴西南马托格罗索州南查帕当市(图 1)。该地区的土壤被归类为粘土质营养不良红。该地区气候为潮湿的热带气候 (Aw),其特点是夏季多雨,冬季干燥。年平均降雨量和温度约为 750 和 1800 mm−1和 20 和 25 °C。
表1. 研究区域中评估的物种及其各自的数量 (n)
从属于19种森林物种的195棵树中随机收集数据(表1)。在混交林区内采集树叶,以采集代表性样本。随机化涉及从地块内的不同位置选择树木,以确保广泛的空间分布。
图2. 每个采样物种在离地面1.3米处的直径(胸径)、总高度(Ht)和每棵树的茎数的平均值的箱线图
测量所得树木计量变量包括胸径(DBH,单位:厘米)和全树高(Ht,单位:米)。胸径使用卷尺在离地1.3米处测量,当单株胸径超过15厘米时,需将测量值除以π换算;对于多干型树木,需分别测量每个主干并计算单株胸径;树高测量采用电子测角仪,多干树仅选取最高主干进行评估。图2展示了各树种样本的胸径、树高及主干数量的分布情况,数据显示不同树种在这三项指标上均存在显著变异。
图3. 数据收集和分析过程的流程图
本研究通过ASD FieldSpec® 4高光谱仪采集195株样本树(每株3片叶片,共585片)的350-2500nm波段光谱数据,专用接触式探针有效抑制环境光干扰,确保测量精度。原始数据经RS3软件记录,并由ViewSpectroPro转化为.txt格式供分析。基于每株树三片叶片的光谱均值构建2151个波段变量数据库,选用六种机器学习算法(ANN、REPTree、M5P、RF、SVM、ZeroR)建模树木胸径(DBH)与树高(Ht)。其中M5P算法通过回归技术处理缺失值,ZeroR作为基准模型提供参照;模型设置两种输入配置(纯光谱变量NOSP、光谱+树种变量WSP),采用k=10的分层交叉验证进行十次重复测试,在Weka 3.8.5平台默认参数下运行。模型性能通过皮尔逊相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)评估,差异显著性经R软件方差分析及Scott-Knott检验(p<0.05)验证。
图4. 用于预测胸径(DBH)的机器学习算法和输入(有物种的高光谱信息——WSP和没有物种的高谱信息——NOSP)的精度度量均值的牛津图
图4展示了采用WSP与NOSP两种输入配置的机器学习算法预测胸径(DBH)的精度指标箱线图,重点呈现了相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)的性能差异。结果显示:采用WSP配置时,DT、M5P和SVM算法获得更高r值(>0.6);而NOSP配置下,RF和SVM算法取得最优r值(>0.6)。在各算法内部对比中,DT、M5P和SVM使用WSP配置时精度显著提升(r>0.6),其余算法则无显著输入配置差异。在误差指标方面(MAE与RMSE),WSP配置使DT、M5P和SVM的误差均值降至更低水平(<6.0)。总体而言,WSP输入配置持续为所有算法提供更低的误差率。
图5. 用于预测树高(Ht)的机器学习算法和输入(有物种的高光谱信息——WSP和没有物种的高谱信息——NOSP)的精度度量方法的箱线图
图5展示了采用WSP与NOSP两种输入配置的机器学习算法预测树高(Ht)的精度指标对比,包括相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)的变化情况。结果显示:使用WSP配置时,DT、M5P和SVM算法获得最优r值(>0.6);而NOSP配置下仅RF算法达到较高r值(>0.6)。在多数算法中,WSP配置均展现出更高的相关性。误差分析表明,采用WSP时DT和M5P的MAE与RMSE最低(<2.5),而NOSP配置下仅RF算法误差最小(<3.0)。除RF算法在两种配置下表现相近外,WSP普遍具有更低误差。综合来看,结合树种变量(WSP)的高光谱数据显著提升了机器学习算法(尤其是RF)对胸径和树高的预测性能。
本文首次利用高光谱数据预测热带本土混交林测树变量,其创新性在于验证了树种信息对预测精度的提升作用。采样涵盖19属8科树种增强了数据变异性,由于不同树种特有的叶片形态和生理特征会形成独特光谱印记,将树种作为输入变量可捕捉物种特异性生长模式(如树干结构差异),从而显著提升树高和胸径预测精度(尤其在RF算法中)。然而,全球超6万种树木(仅巴西约1万种)的物种鉴定需耗费大量数据采集精力,且变量引入会增加模型复杂度。研究发现当树种数据缺失时,M5P、DT和SVM算法仅凭光谱数据仍能准确预测变量,这种特征筛选能力降低了模型训练成本。特别值得注意的是,DT与SVM算法在农林领域兼具强大的分类与回归能力,而M5P模型在本研究中也展现出优异的预测鲁棒性和泛化能力。该研究为高光谱技术在复杂森林生态系统中的应用提供了重要实践依据。
研究揭示了高光谱数据与机器学习算法在林业参数预测中的协同效应,重点探讨了树种变量对模型性能的影响机制。研究发现随机森林(RF)算法具有显著优势:在树种数据缺失时仍保持稳定预测性能(相关系数r>0.6),其抗噪特性使其成为复杂森林场景的理想选择。研究创新性地证实,引入树种变量可使DT、M5P等算法的MAE降低至2.5以下,这源于不同树种特有的叶片光谱特征(19属8科样本验证)。但研究也指出实践瓶颈:全球6万种树木的精确鉴定需要专业团队建立光谱数据库,建议未来研究应扩大样本多样性(包括不同生长阶段和外来物种)。该技术体系为森林资源调查提供了高性价比解决方案,其误差优化(WSP配置下RMSE降低23%)对采伐规划、生产力评估等林业决策具有重要应用价值。
参考文献
Manfroi Filho E A, Teodoro P E, Teodoro L P R, et al. VNIR-SWIR spectroscopy and machine learning for measuring dendrometric variables in native species[J]. Remote Sensing Applications: Society and Environment, 2025, 37: 101522.
⭐️ ⭐️ ⭐️
动物活体荧光成像系统 - MARS
In Vivo Imaging System
⭐️ ⭐️ ⭐️
恒光智影
上海恒光智影医疗科技有限公司,被评为“国家高新技术企业”、“上海市专精特新中小企业”,获批主持“科技部重大仪器专项”子课题,荣获上海市“科技创新行动计划”科学仪器项目、上海市2025年度关键技术研发计划“计算生物学”项目。
恒光智影,致力于为生物医学、临床前和临床应用等相关领域的研究提供先进的、一体化的成像解决方案。
专注动物活体成像技术,成像范围覆盖 400-1700 nm,同时可整合CT, X-ray,超声,光声,光热成像等技术。
可为肿瘤药理、神经药理、心血管药理、大分子药代动力学等一系列学科的科研人员提供清晰的成像效果,为用户提供前沿的生物医药与科学仪器服务。