光谱百科

企业资讯

高光谱数据特征波长变量选择方法有哪些？

发布时间：2025-04-30

浏览次数：747

高光谱成像仪获取的数据非常的庞大，这些信息比较的冗沉，采取一定的方法提取对建模有效的波长变量，删除冗余变量，减少波长变量个数，优化模型，提高模型预测精确度非常的重要。那么，高光谱数据特征波长变量选择方法有哪些？本文对此做了介绍。

近红外高光谱成像仪500

什么是高光谱数据特征变量选择？

高光谱成像系统能获取可见光波段内连续的光谱曲线，光谱变量成白上千，同时，实验中往往样本量较大，所以获取的整体数据矩阵非常大。在这庞大的数据矩阵中，有很多信息是重复的或者是无信息变量甚至可能是影响数据模型结果的噪声数据，这对数据分析中模型的准确度、分析的速度都非常不利，也会影响便携式仪器的开发。同时，光谱数据中由于信息的冗余，谱峰往往是严重重叠在一起，导致特征吸收峰不明显。因此，通常的做法是采用一定的方法寻找到对于建模有效的波长变量，删除冗余变量，减少波长变量个数，优化模型，提高模型预测精确度，我们称为特征变量选择。

选出的特征变量必须是和被检测物质成分有关的波长变量，原理是这些波长点往往是该物质成分官能团的吸收峰。常用的特征波长选择算法有标准方差分析法、逐步回归分析法、相关系数分析法、无信息变量消除法和连续投影法等，其中后面两种算法是两种高效的波长选择方法。下文主要采用的是连续投影算法和无信息变量去除算法。

高光谱数据特征波长变量选择方法：

1.连续投影算法

连续投影算法（SPA）是从连续光谱矩阵中查找指定变量数且表达原始数据最大信息量的变量组，使组内的变量之间的相关性达到最小。连续投影算法虽然只选择原始光谱数据中尽可能少的数据，但能概括样品中绝大多数光谱变量信息，从而在大大减少预测模型建立过程中的自变量个数，提高预测模型精度和速度。

2.无信息变量消除算法

无信息变量消除算法（UVE）能够减小对预测指标贡献度较小的变量，选出最优变量，被去除的光谱变量称为无信息变量。它采用偏最小二乘（PLS）算法建立数学模型，消除贡献度较小的自变量，降低预测模型的复杂度。UVE算法通过在PLS模型中添加一组白噪声变量，然后采用交叉留一法计算每个变量的回归系数。计算变量系数稳定值除以标准差，将结果与根据随机变量矩阵得到的稳定值比较，删除对建模无效的波长变量。

上一页 : 高光谱数据预处理及高光谱数据特征波段提取方法下一页 : 赛斯拜克（SINESPEC）高光谱相机全产品线解析