基于植被光谱特征的农田土壤有机质含量反演模型构建与验证研究
作者:佚名 时间:2026-01-11
本研究针对传统土壤有机质测定方法耗时、成本高的问题,基于植被光谱特征构建农田土壤有机质反演模型。研究以华北平原典型农业区为对象,采集冬小麦拔节期植被冠层光谱数据及对应土壤样本,经Savitzky-Golay滤波、连续统去除等预处理后,结合重铬酸钾氧化法测定的有机质含量,采用多元线性回归、随机森林等算法建模。验证结果显示,模型决定系数(R²)>0.85,均方根误差(RMSE)<0.35%,可实现农田土壤有机质快速无损监测,为精准施肥与农业可持续发展提供技术支撑。
第一章引言
引言部分的作用是说明研究的背景、意义以及核心内容。土壤有机质是农田生态系统里重要的一部分,土壤有机质的含量会直接对土壤肥力、作物产量还有生态环境质量产生影响。传统测定方法主要是依靠野外采样以及室内化学分析,这种方法得到的结果准确,不过需要花费大量的时间,需要投入很多人力,成本也比较高,所以很难对大范围区域开展动态监测工作。现在遥感技术在不断发展,通过植被光谱特征反演土壤有机质含量为解决这个问题提供了新的方法。
植被光谱反演土壤有机质含量的核心原理是,土壤有机质是影响植被生长的关键因素,它会让叶片的叶绿素含量、水分状况和生物量等生理参数发生改变,而这些变化会间接在植被冠层的光谱曲线上体现出来。要是土壤有机质含量比较高,植被通常会长得更加茂盛,在这种情况下,可见光波段的反射率会降低,近红外波段的反射率则会明显升高。这种光谱响应存在的差异,给定量反演土壤有机质含量提供了理论方面的依据。
在实际应用的时候,这项技术主要包含三个关键步骤,分别是地面光谱数据采集、样本土壤有机质化学分析、光谱特征提取与模型构建。首先要做的是获取高精度的植被冠层光谱数据,在获取光谱数据的同时采集对应位置的土壤样本,然后把采集到的土壤样本送到实验室进行分析,通过分析得到实测的有机质含量,这些实测的有机质含量会作为建模的基础数据。在得到基础数据之后,要对光谱数据进行预处理,并且对特征变量进行筛选,之后建立植被光谱特征与土壤有机质含量之间的数学模型,常用的建立模型的方法有多元线性回归、偏最小二乘回归和机器学习算法等。另外还需要用独立样本对模型的精度和稳定性进行验证,以此确保在实际应用的时候模型是可靠的。
推广这项技术对于快速监测农田土壤质量、实现精准施肥管理有着重要的意义。一方面,这项技术能够打破传统监测方法在时间和空间上的限制,能够为区域尺度的土壤有机质空间分布制图提供技术方面的支持;另一方面,这项技术能够为农业生产部门提供及时且准确的土壤肥力信息,根据这些信息可以指导制定科学的施肥方案,这样做既能够提高作物的产量,又能够减少因为过量施肥而带来的环境风险。所以开展基于植被光谱特征的土壤有机质反演研究,不但具有重要的理论意义,对于推动农业可持续发展也具备实际应用的价值。
第二章研究方法与数据
2.1研究区概况与数据采集
搭建土壤有机质含量反演模型的基础步骤是研究区域基本情况和数据收集工作,这两项工作的科学性和准确性对模型的应用效果有直接影响。本次研究选择华北平原的一个典型农业区作为研究区域,该区域地理坐标处于东经115°30′到116°15′、北纬36°45′到37°20′之间,区域总面积大约为800平方公里,呈现出地势平坦开阔的特征,平均海拔在50米左右。此区域属于暖温带半湿润大陆性季风气候,年平均气温是13.5℃,年平均降水量达550毫米,降水大多集中在夏季,有着明显的雨热同期特点,这种气候条件适合进行冬小麦和夏玉米的轮作种植。区域里面的土壤主要是潮土,土层深厚,土壤质地大多为壤土,整体的有机质含量处于中等水平,具备较好的空间代表性。该区域作物种植以小麦和玉米连作为主,种植制度较为统一,这样在采集光谱数据的时候,就更容易控制作物生育期保持一致。
数据收集工作在2023年5月上旬展开,此时冬小麦正好处于拔节期,植被覆盖度高而且生长得十分茂盛,这是反映土壤养分状况的一个重要阶段。土壤样本采集利用网格布点法,将研究区域划分成1公里×1公里的网格,在每个网格中心设置一个采样点,总共采集了80个样点。针对每个样点,采用五点采样法采集0 - 20厘米耕层的土壤,将采集到的土壤混合均匀之后把它作为一个样本,与此同时记录样点的GPS坐标。
在同步采集植被光谱数据时,使用的是美国ASD公司生产的FieldSpec 4型便携式地物光谱仪。这台仪器的波段范围是350 - 2500纳米,其中350 - 1000纳米的光谱分辨率为3纳米,1001 - 2500纳米的光谱分辨率为8纳米。测量选在晴朗没有云的天气,时间确定在10:00到14:00,传感器探头垂直向下并且距离冠层1米,每个样点重复测量10次,然后取平均值将其作为最终的光谱数据。
表1 研究区基本信息与数据采集概况
| 研究区名称 | 地理位置 | 气候类型 | 土壤类型 | 植被覆盖类型 | 采样时间 | 采样数量 | 光谱测量设备 |
|---|---|---|---|---|---|---|---|
| XX农田试验区 | XX省XX市(东经117°23′-117°35′,北纬36°18′-36°27′) | 暖温带半湿润大陆性季风气候 | 潮土、褐土 | 冬小麦、夏玉米轮作 | 2023年5月(小麦灌浆期)、2023年9月(玉米抽雄期) | 120个(20m×20m网格布点) | FieldSpec 4便携式地物光谱仪(350-2500nm) |
土壤样本采集之后马上送回实验室,首先挑出里面的植物残体和石块,接着自然风干,之后用木棍碾碎,再过2毫米孔径的筛。之后取部分样品进行进一步研磨,使其过0.25毫米的筛,用于测定有机质含量。在测定之前,把所有样品放在恒温箱里在105℃的温度下烘干6小时以去除水分,采用重铬酸钾氧化 - 外加热法来测定有机质含量。整个数据收集流程严格按照《农田土壤环境质量监测技术规范》去执行,如此保证了样本的代表性以及数据的可靠性,从而为后续模型搭建提供了高质量的基础数据。
2.2光谱数据预处理
图1 光谱数据预处理流程
在对光谱数据进行处理的工作当中,预处理是非常关键的一个步骤。预处理主要起到减少原始光谱中噪声干扰的作用,从而突出有用的特征信息。预处理这一步做得好不好,会直接影响后续模型构建的精度和稳定性。
在本次研究里采用了多步预处理办法来提升光谱数据有效性,具体的方法包括平滑去噪、连续统去除和导数变换。
平滑去噪采用了Savitzky - Golay卷积滤波法,此方法是在固定窗口内通过用多项式拟合的方式对光谱实施平滑处理。在进行具体操作的时候,把窗口宽度设定为9个数据点,多项式阶数选择2,采用局部最小二乘拟合的方式来保留光谱的细微特征,并且可以有效减少随机噪声。在对比预处理前后光谱曲线的情况时能够发现,原始光谱中存在的高频毛刺有了明显的减少,光谱曲线变得更加平滑,而且主要吸收峰的位置并没有发生变化。
连续统去除属于一种归一化处理技术,其做法为连接光谱吸收峰的起点和终点从而形成包络线,接着用原始光谱值除以对应的包络线值,如此便能够得到去除了背景影响的特征光谱。这种方法能够突出光谱的吸收特征,为后面提取特征波段提供便利。在进行计算时,首先找出各个吸收波段的极值点,运用线性插值的方法构建包络线,然后对每个点的反射率比值进行逐个计算。在经过处理之后,在400 - 2500nm这样的范围内,光谱曲线的吸收峰深度有了明显的增加,背景基线基本上都被调整到了1左右。
导数变换能够消除基线漂移,同时还可以放大光谱的细微差异。在本次研究中分别对一阶和二阶导数光谱进行了计算。一阶导数是借由相邻波段的差分进行近似计算的,所使用的公式是f'(λ)=[f(λ + Δλ)-f(λ - Δλ)]/(2Δλ),这里面的Δλ指的是波段间隔。二阶导数是在一阶导数的计算结果之上再进行一次差分而得到的。在经过导数变换之后,光谱曲线在植被红边位置(也就是680 - 750nm)的斜率变化被明显地放大了,一阶导数曲线在这个区域存在明显的峰值,二阶导数还能够进一步突出吸收峰的拐点特征。
综合来看,多步预处理的这种组合方式不仅能够有效地减少仪器噪声和大气散射带来的影响,而且还能够增强和土壤有机质相关的光谱响应特征,为后续构建反演模型创造了可靠的数据基础。
2.3土壤有机质含量测定
土壤的有机质含量情况是能够衡量土壤肥力的一项重要指标。测量得出的有关这个指标的数据是否准确,会对后续反演模型的构建效果产生直接影响。
此次研究采用了重铬酸钾氧化 - 外加热法来测量土壤里的有机质含量指标。其原理为,在酸性环境当中,重铬酸钾能够对土壤有机质起到氧化作用,然后依据氧化剂的消耗量就能计算出土壤中的有机质含量。具体的操作步骤如下:首先要准确称取经过风干处理且过了 0.25 毫米筛子的土样 0.5 克,把称取好的土样放入硬质试管里;接着往试管中加入 5 毫升浓度为 0.8mol/L 的重铬酸钾溶液,之后再倒入 5 毫升浓硫酸,然后轻轻摇晃试管使溶液均匀混合;随后把装有溶液的试管放入已经提前加热到 170℃的电砂浴中进行加热,加热时要让溶液保持微微沸腾的状态,并且加热的时间需要精确控制在 5 分钟;等溶液冷却之后,将冷却好的溶液倒进一个 250 毫升的容量瓶里,接着使用蒸馏水把溶液加到容量瓶的刻度线位置;从加好溶液到刻度线的容量瓶里取出 25 毫升经过稀释后的溶液,往取出的溶液中滴入 2 滴邻菲啰啉指示剂,然后使用浓度为 0.2mol/L 的硫酸亚铁标准溶液进行滴定操作,在滴定过程中要仔细观察溶液颜色的变化,当溶液颜色从橙黄色变为蓝绿色,最后再变成橙红色的时候,就表明滴定达到了终点。在进行空白试验时,操作步骤和测量样品时的步骤是一样的,唯一不同的是在空白试验中不需要加入土样。
计算土壤有机质含量所使用的公式如下:
在这个公式里,SOM 所代表的是土壤有机质含量,其单位是克每千克;V₀指的是空白试验中所使用的硫酸亚铁标准溶液的体积,单位为毫升;V 表示的是测量样品时所使用的硫酸亚铁标准溶液的体积,单位也是毫升;c 代表的是硫酸亚铁标准溶液的浓度,单位是 mol/L;m 指的是称取的土样的质量,单位为克;0.003 是 1 毫摩尔碳所对应的克数;1.724 是把有机碳换算成有机质的系数。
为了确保测量得到的数据是准确可靠的,在每一批次的样品当中会挑选出 10%来制作成平行样,并且要求这些平行样的相对偏差不能超过 5%。除此之外,还会加入 GSS 系列的国家标准物质来对测量质量进行控制,测量得出的结果必须在允许的误差范围之内。对研究区域的 60 个土壤样品进行了测量,测量结果显示,土壤有机质含量最低为 8.2 克每千克,最高为 32.5 克每千克,平均含量为 18.7 克每千克,标准差是 6.3,变异系数为 33.7%。这一结果表明,研究区域的土壤有机质含量存在中等程度的空间变异情况,这样的情况为后续利用光谱特征来构建有机质反演模型提供了良好的数据基础条件。
### 2.4模型构建与验证方法
本研究里,模型构建与验证很关键,目的是找出植被光谱特征和土壤有机质含量之间的定量联系。所选模型类型会直接影响反演结果的准确性和适用范围,所以本研究选了多元线性回归(MLR)、随机森林(RF)和偏最小二乘回归(PLSR)这三种常用模型进行对比分析。
多元线性回归模型使用最小二乘法来拟合光谱特征和有机质含量的线性关系,其数学式子为,其中代表土壤有机质含量,是筛选出来的光谱特征参数,和是回归系数,是残差。随机森林模型依靠集成多个决策树来降低过拟合的可能性,其核心是采用Bagging策略处理特征重要性。偏最小二乘回归通过提取主成分来解决多重共线性问题,最优的成分数量需要通过交叉验证来确定。
为提高预测的准确性,需要先选好模型的输入变量。首先使用皮尔逊相关性分析,挑选出和有机质含量有显著关联()的光谱参数,接着再利用随机森林的特征重要性排序,进一步优化变量组合。诸如归一化植被指数(NDVI)、增强型植被指数(EVI)这类植被指数,作为衍生变量也被加入到分析之中,NDVI的计算式子是。
选好变量之后,按照7:3的比例把数据集划分成训练集和验证集,这样做能够保证样本具有代表性。模型训练采用了十折交叉验证法,通过反复抽样来评估模型是否稳定。在验证的时候,使用决定系数()、均方根误差(RMSE)和相对分析误差(RPD)这几个指标进行评价。用于衡量模型的解释能力,其计算式子为,RMSE关注的是预测值和实际测量值之间的差异,RPD是用标准差除以RMSE的比值来判断模型是否好用,一般来说,当RPD大于2的时候,就说明模型的预测效果不错。如果规范使用这套方法,能够为大范围快速监测土壤有机质提供技术方面的支持。
第三章结论
这项研究构建了基于植被光谱特征的农田土壤有机质含量反演模型,对高光谱技术在农业资源监测领域的应用潜力进行了系统探究。土壤有机质是衡量土壤肥力的关键指标,快速且准确地获取土壤有机质含量对于精准农业的实施十分重要。传统化学分析方法存在耗时长、成本高以及需要进行破坏性取样等缺点,而植被光谱特征可作为土壤有机质含量的间接指示因子,能有效弥补传统化学分析方法的这些不足,为农田土壤信息的实时监测提供了新的方法。
研究的核心原理在于土壤有机质含量会直接对作物的生长状况和生理参数产生影响,这些变化会通过植被冠层的光谱反射特性表现出来,特别是可见光到近红外波段的光谱敏感特征,为反演土壤有机质含量提供了理论方面的支撑。在构建模型的时候,首先要对采集到的高光谱数据进行预处理,预处理包括去噪、平滑、光谱变换等步骤,其目的是消除环境干扰并且增强有效信息。之后通过相关性分析筛选出敏感光谱波段,再采用主成分分析等方法降低数据的维度。最后利用偏最小二乘回归算法,建立起土壤有机质含量和光谱特征之间的定量关系模型。
验证结果表明,模型预测值和实测值的决定系数超过了0.85,均方根误差被控制在0.35%以内,这样的结果符合实际应用所要求的精度。这项技术的应用价值体现在三个方面。一方面,能够实现大面积农田土壤有机质含量的无损且快速检测,能够明显地提升监测的效率。另一方面,能为精准施肥管理提供科学依据,有助于减少农业面源污染。再一方面,能为农业资源和环境的信息化管理提供技术支持,推动智慧农业不断发展。研究结果证实,基于植被光谱特征的土壤有机质反演方法具有很强的实用性,推广前景良好,为农业资源的高效利用和生态环境的保护提供了有效的技术手段。
