典型校正模型建立方法（二）-新闻中心-标准物质网-河南普天同创计量有限公司

公司动态行业新闻技术前沿文化长廊

热门阅读

热门产品

典型校正模型建立方法（二）

发布时间：2018-10-12 00:00 作者：中国标准物质网阅读量：1582

2.4.3PLS法

光谱数据一般为多维空间数据，偏最小二乘(PLS)法采用因子分析法对多维的光谱数据进行降维处理，其主要原理是将每个X矩阵潜变量的方向进行修改使其投影在与Y矩阵协方差最大的方向，将原始光谱数据分割为多种主成分，不同的主成分(主成分数相当于波段数目)代表不同组分及其对日的信息的影响，通过合理地选取主成分可以剔除干扰信息和干扰信息主成分光谱，仅选取有用的主成分进行模型的回归建立。

PLS法的基本步骤：设在。个标准样本中某个组分的含量矩阵为Y,用N、M表示残差矩阵，PLS法首先将整个光谱矩阵分解为T×P(T为吸光度隐变量矩阵，P为载荷矩阵)，其次将组分含量矩阵Y分解为U×Q(U为含量隐变量矩阵，Q为载荷矩阵)：

A_(n×m)=T_(n×d)P_(d×m)+N_(n×m) (2-25)

Y _(n×1) =U_(n×d)Q_(d×1)＋M_(n×1) (2-26)

再把吸光度隐变量矩阵T和含量隐变量矩阵U作线性回归，对角矩阵B作关联矩阵：

U_(n×d)=T_(n×d)B_(d×d) (2-27)

设检验集中未知样本光谱矩阵为A_unk，则：

A_unk＝T_unk (2-28)

继而推导出T_unk:

Y_unk＝T_unkBQ (2-29)

1．模型回归步骤

1)矩阵标准化：对X_n×m和Y_n×k矩阵中的列向量进行z-score标准化，使数据符合标准正态分布：

其中

2)设置迭代次数f(f≥1且为正整数)后以Y _n×k矩阵中任意列向量作u初值进行迭代。

3)Y矩阵权值变量：

w'＝u'X/u'u (2-32)

4)归一化权值变量：

w'_new=w'_old/‖w'_old‖(2-33)

5)计算矩阵X的t变量：

t=Xw/w'w (2-34)

6)计算矩阵Y的q变量：

q'＝t'Y/t't (2-35)

7)计算矩阵Y的u变量：

u＝Yq/q'q (2-36)

8)变量归一化：

q'_new=q'_old‖q'_old‖ (2-37)

9)检验本次和上几一次迭代中的变量t是否都收敛，收敛则继续进行下一步，发散则返回步骤3)重新迭代。

10)计算矩阵X的P变量：

P'＝t'X/t't (2-38)

11)归一化P变量：

P'_new=P'_old/‖P'_old‖ (2-39)

12)正交化t变量：

t_new=t_oid‖p_old‖(2-40)

13)标准化w变量：

w'_new＝w'_old‖p'_old‖ (2-41)

14)汁算回归系数：

b＝u't/t't (2-42)

15)计算残差矩阵，将矩阵X、Y重新赋值：

E_f=E_f-1-t_fp'_f (2-43)

令X＝E_f

F_r＝F_f-1 -u_fq'_f

令 Y＝F_f (2-44)

16)保存t、p、u、q、b的迭代结果以供计算预测值。从步骤2)重新开始对下个主成分进行迭代：

2．预测算法原理

1)数据标准化：同校正部分算法一样标准化X矩阵；

2)设置迭代次数f(f≥1且为止整数)并将校正集的平均值赋作初始变量开始迭代：

Y＝y (2-45)

3)将校正部分所得变量W、q、b带入下式：

t_f＝XW'_f(2-46)

y=y＋b_ft_fq'_f

4)计算校正集残差矩阵：

x=x-t_fp'_f(2-47)

5)迭代未结束则返回步骤2)继续迭代。

上述原理决定了PLS法具有下列优点：可以最大限度地提取样本光谱的有用信息；避免线性相关；包含不光谱与样本组分含量间的隐含联系，使模型稳健性更好；适用于多组分混合复杂体系的分析：该方一法目前被广泛应用于光谱的定量分析软件。

3．主成分数目f的确定

如果样本光谱矩阵X和样本组分含量矩阵Y间的关系为线性模型，那么模型的主成分数应等于描述模型的组分数，主成分数是能否成功建立PLS模型的关键。

PLS建模中较困难的一步是如何确定主成分数目。主成分数目越多，其各载荷向量对建模的贡献度也就越小，且可能会引进噪声载荷，造成过拟合现象，影响模型精度。反之，主成分数目过少有可能漏掉光谱中的有用信息，使模型不能完全反映样本中目标组分产生的光谱变化，出现欠拟合现象，降低模型预测能力。所以，确定一个合理的参与建模的主成分数目既可以充分利用光谱信息又可以有效过滤干扰信息。

预测残差平方和(PRESS)法是一种常用的主成分数计算方法，其计算过程如下：

式中，n为校正集样本数；f为建模主成分数；Y_p,ij为样本拟合值；Y_ij样本真值。

预测残差二次方和值越小表示模型拟合值与真值越接近，模型预测精度越高，所以通常取其值最接近0时所对应的主成分数作为最佳主成分数进行建模。

基于预测残差二次方和值确定主成分数的方法目前有校正集自预测法、交互验证法、杠杆点预测法、验证集预测法等，目前应用较多且有效的方法是交互验证法。

文章来源：《多光谱食品品质检测技术与信息处理研究》

版权与免责声明：转载目的在于传递更多信息。

如其他媒体、网站或个人从本网下载使用，必须保留本网注明的"稿件来源"，并自负版权等法律责任。

如涉及作品内容、版权等问题，请在作品发表之日起两周内与本网联系，否则视为放弃相关权利。

上一篇：基于SERS光谱技术的苹果多农药残留的定性及定量分析下一篇：典型校正模型建立方法（三）

登录后才可以评论

立即登录