高光谱数据特征波长的提取及建模方法介绍
发布时间:2024-07-05
浏览次数:442
高光谱成像仪检测到的光谱数据由数百个波段组成,光谱数据会显得非常大且冗余,造成后期光谱数据处理分析时效率不高,精度不高,速度下降。因此,为了提升样本信息分析的准确性,就需要进行光谱数据的提取,并进行模型建设。本文对高光谱数据特征波长的提取及建模方法做了介绍。
高光谱成像仪检测到的光谱数据由数百个波段组成,光谱数据会显得非常大且冗余,造成后期光谱数据处理分析时效率不高,精度不高,速度下降。因此,为了提升样本信息分析的准确性,就需要进行光谱数据的提取,并进行模型建设。本文对高光谱数据特征波长的提取及建模方法做了介绍。
高光谱数据特征波长的提取方法:
常用的特征波长提取算法有遗传算法(GA)、竞争性自适应重加杈算法(CARS)、无信息变量消除法(UME)、连续投影算法(SPA)、回归系数法(RC)、Random frog等。高光谱数据分析中没有标准的、唯一的方法选择最佳波长。
1.Random frog方法
基于可逆跳马尔可夫链蒙特卡洛算法,在模型空间中模拟一条服从稳态分布的马尔可夫链,来计算每个变量的被选概率,从而进行变量的选择。
2.CARS方法
模仿达尔文进化论中的“适者生存”法则,利用指数衰减函数和自适应重加权采样技术去除PLSR模型中权重较小的回归系数,优选出权重前几的系数。
3.SPA方法
通过对光谱数据进行一系列的投影映射构造新的变量集,并根据多元线性回归评价模型的预测性能,该变量集中变量的共线性最小。
4.UME方法
向PLSR模型中添加幅度较小的随机变量矩阵,基于交叉验证建立新的PLSR模型。将每个变量系数平均值和标准差的商作为稳定性的值,同随机变量矩阵得到的稳定性的值作比较,选出被认为和随机变量一样对模型建立无效的波长变量。
5.GA方法
模拟生命进化机制,从任意一个初始群体出发,产生一群新的更适应环境的个体,使群体进化到搜索区域中越来越好的区域。
6.RC方法
PLSR建模所得到的模型回归系数,挑选系数绝对值大的作为特征波长。
高光谱数据的建模方法介绍:
由于高光谱数据的复杂以及数据量很大,很难直接的对数据进行定量定性分析,因此需要对提取得到的光谱数据采用化学计量学的方法进行建模分析,对经过特征波长变量提取后的光谱建立多元变量校正模型,比较不同模型的预测效果,选取最优模型,便于以后的仪器开发应用。目前,采用的化学计量学建模算法主要是偏最小二乘回归法(PLSR)和最小二乘支持向量机(LS-SVM)。
1.偏最小二乘回归法(PLSR)
PLSR是一种常见的多元统计方法,广泛应用于光谱检测模型的建立。其原理是将因子分析和回归分析相结合,同时将光谱数据和理化参考数据分解,采用留一法交互验证计算预测残差平方和,再根据潜在变量的累积贡献率和预测残差平方和,寻找最佳的潜在变量个数将光谱数据和理化参考值相关联,建立回归模型。其优点是较好的解决了样本个数少于变量个数的问题。
2.最小二乘支持向量机(LS-SVM)
LS-SVM是一种改进的支持向量机算法,能够快速的进行线性和非线性建棋分析,能有效解决高维数据分析问题,其算法思想是将原始样本数据映射到高维空间里,用等式约束取代不等式约束,在高维空间里对最小化损失函数进行求解获得线性拟合函数。将传统支持向量机的二次规划问题,简化成求解一个等式方程组问题,大大提高计算效率。
相关产品
-
高光谱成像技术精准测试防火材料阻燃隔热性能
火灾频发,防火材料至关重要 近年来,火灾频发,给人们的生命财产安全带来了巨大威胁。从居民楼火灾到森林大火,每一次火灾事故都令人痛心疾首。据相关统计,仅在过去一..
-
高光谱成像技术对鲜莲直链淀粉含量检测实验室研究
高光谱成像技术是一种能获取丰富光谱和图像信息的无损检测技术,相较于化学检测方法,具有省时、省力、环境友好的优点口。本文将采用高光谱成像技术对鲜莲直链淀粉进行实验..
-
高光谱相机:开启纸张分选的精准时代
在环保日益受到重视的当下,废纸回收成为了资源循环利用的关键一环。每年,全球产生的废纸数量惊人,据相关数据显示,仅我国每年纸张消费就呈约 3500 万吨,若以废弃..
-
高光谱成像技术牛奶蛋白含量的实验室研究
牛奶作为人们日常生活中重要的营养来源,其蛋白质含量是衡量其营养价值的关键指标之一。传统的牛奶蛋白含量检测方法,如凯氏定氮法、高效液相色谱法等,虽然能够得到较为准..