析&采用Noris-Wilams平滑求导(NW)和多元散射校正(MSC)方法对光谱进行预处理;蒙特卡罗无信息变 量消除法(MCUVE)、变量组合集群分析法(VCPA)和区间变量迭代空间收缩法(iVISSA)用于光谱变量选择 和优化;PLS用于光谱校正模型的建立#采用校正集相关系数Rc)、交互验证均方根误差(RMSECV)、预测
集相关系数(Rp)和预测集均方根误差(RMSEP)评价模型&光谱预处理中经MSC处理后的光谱模型优于其 他预处理方法#其RMSECV和RMSEP值都减小# Rc和Rp值都增大&脂肪定量分析中#原始光谱模型的
RMSECV和Rc为0. 21和0. 87, RMSEP和Rp为0. 20和0. 88,变量数(匕)为1 501;经MCUVE方法选择
变量后建立的定量模型,其RMSECV和Rc为0. 17和0. 92, RMSEP和Rp为0. 19和0. 89,; 为400个;
经VCPA选择变量建立PLS定量模型,其RMSECV和Rc为0 . 21和0 . 87, RMSEP和Rp为0 . 25和0 . 81,
; 为12;经iVISSA选择变量后的模型,其RMSECV和Rc为0. 21和0. 86, RMSEP和Rp为0. 20和0. 87, ; 为20&粗纤维定量分析中,原始模型的RMSECV和Rc为0. 28和0. 91, RMSEP和Rp为0. 25和0. 95, ; 为1 501;经 MCUVE选择后的模型,其RMSECV和Rc为0. 23和0. 95, RMSEP和Rp为0. 23和0. 94, ; 为74 0 ;经VCPA选择变量后的模型,其RMSECV和Rc为0 . 27和0 . 91, RMSEP和Rp为0 . 30和0 . 91, ; 为11;经iVISSA选择后变量的模型,其RMSECV和Rc为0 . 29和0 . 9 0, RMSEP和Rp为0 .27和0 . 93, ;为20&结果表明,MSC方法可以有效提高光谱质量,消除光谱平移误差;MCUVE变量选择方法可以简
化模型提高模型精度和稳定性,建立最优模型&在粗脂肪的定量分析模型中,MSC处理后的光谱经过
MCUVE选择后剩余400个变量,Rc和Rp相较于全谱模型提高了 0. 05和0. 01, RMSECV和RMSEP分别
降低到了 0. 17和0. 19;经VCPA和iVISSA选择变量的模型其结果与全谱模型相似,但其变量分别只有12
和20个&在粗纤维模型中,经MCUVE选择后740个变量用于建立PLS模型,其Rc和Rp为0. 95和0. 94,
RMSECV和RMSEP分别为0. 23和0.23; VCPA和iVISSA分别运用11和12个变量建立回归模型,但结
果都比MCUVE模型差&利用饲料近红外光谱建立MSC-MCUVE-PLS模型可以有效对饲料粗脂肪和粗纤
维进行定量分析&关键词 近红外光谱; 饲料; 蒙特卡罗无信息变量消除法; 变量组合集群分析法; 区间变量迭代空间收缩法
中图分类号:S816. 2 文献标识码:A
DOI: 10. 3964/j. issn. 1000-0593(2020)01-0215-06于农业、林业、化工、制药等行业&如Sagrario Modrono等
引言饲料营养的精准配制不仅可以提高饲料的质量,还可以
运用便携式光谱仪实现了饲料中蛋白质、粗纤维和淀粉等组
分的实时测定,-;Patrica A. Harris等运用近红外光谱分析
方法准确分析了马蹄草的营养成分⑵;Lusia Mandie等运 用近红外光谱进行饲料中虫类蛋白含量的检测等节约成本&粗脂肪和粗纤维是饲料主要成分,其含量检测是
饲料精准配制的重要环节,传统的饲料成分方法为湿化学检
本文利用近红外光谱实现对饲料的粗脂肪和粗纤维的含 量检测,在利用近红外光谱建立含量分析回归模型前,采用
光谱预处理方法和变量选择方法来简化模型, 以提高模型分测方法其灵敏度和精确度高,但操作复杂、检测时间长、成
本高&近红外技术作为一种快速无污染的检测方法广泛应用收稿日期:2018-11-21,修订日期:2019-03-19基金项目:国家自然科学基金项目(21265006),国家质量监督检验检疫总局科技计划项目(2015IK160),江西省自然科学基金项目(2015ZBAB201003)资助作者简介:郝 勇,1978年生,华东交通大学机电与车辆工程学院副教授 e-mail: haonm@163.com216光谱学与光谱分析用蒙特卡罗无信息变量消除法第40卷析精度&,切(Monte carlo based unin-
formativevariableelimination#MCUVE)、 变量组合集群分
析法,0-12-(variables combination population analysis, VCPA)
1实验部分1. 1样本和区间变量迭代空间收缩法[13_14] (interval variable iterative
space shrinkage approach, iVISSA)进行变量选择并 比较结
收集了不同厂家不同时期生产的饲料样本325个#包括 果,从而确定最优的变量选择方法&15模型的评价乳猪饲料、中猪饲料和大猪饲料&在采集近红外光谱前先将
样本利用高速万能粉碎机(FW135)粉碎#过40目筛#制成粉 末状样本&饲料的粗脂肪和粗纤维的实际含量按照国家标准 GB/T 6433—2006 和 GB/T 6434—2006 确定 &1.2近红外光谱的采集光谱经过预处理和变量选择后,利用校正集样品建立饲
料粗脂肪和粗纤维含量模型,再利用预测集样品来对模型进
行验证,确定模型能否达到粗脂肪和粗纤维的含量分析要 求&采用校正集相关系数Rc、预测集相关系数Rp、交叉验证
均方根误差RMSECV、预测集均方根误差RMSEP等指标来
使用瑞士步琦公司NIR-Flex N-500傅里叶近红外光谱 仪#其波数范围为10 000〜4 000 cm 1&为了保证光谱仪的 正常运行和所获光谱的一致性#饲料样本的厚度统一为4
mm,实验室温度为10〜30 k #湿度为30%RH〜70%RH&
评价模型的预测精度和稳健性,51门&2结果与讨论2.1光谱预处理方法的结果分析本文共获取352条饲料光谱,每条光谱由1 501个变量组成&1.3 近红外光谱预处理方法建立饲料粗脂肪和粗纤维定量识别模型时# 352个样本 光谱根据 <=联合距离划分样本集算法(sample set partitioning based on joint x-y distance, SPXY)按照 2 : 1 比例划分
饲料中粗脂肪和粗纤维的实际含量统计信息如表1所示。表1饲料中粗脂肪和粗纤维含量统计表(单位:% )Table 1 Statistical table of crude fat and corasefiber content in
为校正集和预测集,校正集有235个样本,预测集含有117
个样本⑷&feed ( unit of content: % )为消除背景噪声的影响需要对原始光谱进行预处理&常
类别最大值4.184.66最小值2.621.91均值3.463.19标准差P.42P.68用的光谱预处理方法主要分为两大类:光谱导数法和散射校
正法,其中 Noris-Williams 导数法(Noris-Williams derivation, NW)和多元散射校正法(multiplicative scatter correction, MSC)有较好的光谱预处理效果1.4近红外光谱变量选择方法粗脂肪粗纤维采用NW导数和MSC对光谱进行预处理&其中NW导
数包括平滑法(NW0h)、一阶导数法(NW1s)和二阶导数法 (NW2nd)三种方法,同时还利用NW^-MSC方法来进行预处
每条饲料的近红外光谱有1 501个变量,其包含了饲料
的全部信息&变量选择方法通过选择有用变量去除冗余信息 来简化模型,提高模型精度&变量选择方法有很多,本文采理&如表2所示为不同预处理方法的饲料粗脂肪和粗纤维含
量模型结果&表2不同预处理方法的饲料粗脂肪和粗纤维含量模型结果Table2 TheresultsoCcrudeCatandcoraseCibercontentsinCeedwithdiCerentpretreatmentmethods预处理方法OriginalNW0hNW1stNW2nd粗脂肪RMSEPP.5P0. 610. 590. 710. 51粗纤维Rc.83.8Rp.9RMSECVRMSEPRp.88.87.87.84.87.88RMSECVRc.87.86.87.74.8.8.2.21.21.21.22.22.23.89.9.81.76.87.86.92.89.64.23.19.2.85.87.87MSCNW1st-MSC.21.210 - 54.91.71.85通过表2可以看出,相比与原始光谱的PLS模型,经 NWOth, NW1st和NW2nd三种方法处理后的模型都没起到明显
RMSEP相比于未经处理的有着0. 01的提升,而RMSECV
与Rc基本相同;NW\"JMSC处理后的效果与原始光谱模型
的效果&而MSC与NW\"JMSC方法对饲料噪声去除有明显
效果,对粗脂肪模型精度有明显的提升&在粗脂肪模型中,
一致&因此,针对饲料的粗脂肪和粗纤维含量分析的光谱预
处理采用MSC方法&图1为饲料的原始近红外光谱和经过 MSC预处理后的光谱& MSC修正了光谱间的相对基线平移
相比于NW\"JMSC方法,单独使用MSC预处理方法能够更
好的实现光谱的信息提取,校正集的RMSECV由0. 74下降 到0.64, Rc由0.84提高到0. 87。在粗纤维模型中,MSC的和偏移,使光谱更为紧密&第1 期光谱学与光谱分析2170.0 ------------------------------------------------------------10 000 9 000 8 000 7 000 6 000 5 000 4 000Wave number/cm'1Wave number/cm'1图1饲料的近红外光谱与MSC预处理后的光谱Fig. 1 Original NIRS of feed and spectra after pretreatment with MSC2.2饲料粗脂肪模型分析中可以看出校正集与测试集相比与MSC-PLS模型分布更为
饲料光谱经过MSC预处理后#分别利用MCUVE# VC-
PA和1VISSA三种变量选择方法结合PLS建立饲料粗脂肪
紧密,+c为0.92, RMSECV为0.17。相比于全谱的模型其
校正模型更为稳定#精度更高&同时# +p相较于MSC-PLS
含量分析模型&图2为不同变量选择方法的脂肪含量分析
PLS模型校正和测试相关图&模型提高了 0.01,且RMSEP降低了 0.01,变量数Vn为
400,大幅度降低&图2(c)为MSC-VCPA-PLS模型,在校正
图2(a)为利用经过MSC预处理的光谱建立的PLS模 型#其校正集和测试集的回归直线基本重合#相关系数+c 和+p分别为0. 87和0. 88。模型的RMSECV和RMSEP分 别为 0.21 和 0.20。图 2(b)为 MSC-MCUVE-PLS 模型,图模型中+c为0.87, RMSECV为0. 21与全谱的PLS模型相 同,而+p为0. 81, RMSEP为0. 25,与MSC-PLS模型相比
起预测结果相差较多& Vn为12个,小于全谱变量数和 MCUVE筛选后的变量数。图2(d)为MSC-iVISSA-PLS模Measured value/%Measured value/%Measured value/%Measured value/%图2不同变量选择方法的饲料粗脂肪含量分析PLS模型校正和测试相关图(a):多元散射模型;(b):多元散射蒙特卡罗模型;(c):多元散射变量组合集群模型;(d):多元散射区间变量迭代空间收缩模型Fig. 2 Calibration and test correlation diagrams of PLS model for quantitative
analysis of feed fa;con;en;wi h di feren;variable selec ion me;hods(a): MSC-PLS; (b): MSC-MCUVE-PLS; (c) : MSC-VCPA-PLS; (d): MSC-iVISSA-PLS218光谱学与光谱分析第4 0卷型,在此模型中Rc为0. 86, RMSECV为0. 21与全谱的校 降低了 0 . 05, RMSEP降低了 0 . 02, Vn为740,由此可知 MCUVE变量选择法有效地选择了有用变量,提高了模型的
正集模型相同,同时预测集的Rp为0.87, RMSEP为0.20
且与全谱的预测值相同,Vn为20与VCPA选择的变量数近 似&精度&图3(c)为经过VCPA变量选择后建立的PLS模型,由
通过图2可以看出三种变量选择方法中,经MCUVE方 法变量选择后,其模型的各个参数都优于全谱模型&经VC-
PA和iVISSA方法选择后都以极少的变量建立检测模型且
图可知,经过VCPA选择了 11个变量来建立模型,相比与 全谱和MCUVE方法,VCPA用极少的变量实现了几乎相同
的结果,其校正集Rc为0. 91, RMSECV为0. 27略好于全
谱校正模型,预测集Rp和RMSEP都差于全谱&图3(d)为 iVISSA变量选择后的饲料粗纤维检测模型,模型的建立基
与全谱模型几乎相同&若精度要求不高时,可以选择VCPA
和iVISSA方法进行变量选择,建立更简洁的模型;若要提 升精度,MCUVE则是最好的选择&2.3
于 20 个变量,其 Rc 为 0. 90, RMSECV 为 0. 29, Rp 为 0. 93,
RMSEP为0.27相比与全谱和MCUVE模型较差,但较于
饲料粗纤维模型分析如图3 为经不同变量选择方法的粗纤维定量分析模型相
VCPA模型更好&关图&图3(a)为经MSC预处理后由全谱1501个变量建立的
PLS模型,其校正集相关系数Rc为0.91, RMSECV为
对比三种变量选择方法,可以看出MCUVE变量选择方 法校正集模型参数优于全谱模型, 而预测 集的参数与全谱预
0.28,在测试集中Rp为0.95, RMSEP为0.25。图3(b)为经 测集参数几乎一致,因其变量数少于全谱,则模型更为简
洁&利用VCPA和iVISSA进行变量选择后,都剩余极少变 量,部分有用信息变量被剔除,因而其模型参数较全谱都稍
过MCUVE变量选择后的模型,选择后剩余740个变量用于
模型分析,其Rc和Rp分别为0. 95和0. 94,较全谱模型的
校正集Rc提高了 0.04。同时RMSECV为0.23,较全谱模型差一些,其优点是模型简单&3 结 论
近红外光谱分析方法用于饲料中粗脂肪和粗纤维的定量
%05%/onwAPPEPQd 2呂p
ud
nIEAp
2
3
Measured value/%42
3
Measured value/%4©%05nI&A pBzpod
(d)4
4
妒0.90 RMSECV=0.29妒0.93 RMSEP=0.273
pB3gp ud
2
2
。校正集—校正集拟合直线•测试集—测试集拟合直线—
2
3
Measured value/%2
3
Measured value/%44
图3不同变量选择方法的饲料粗纤维含量分析PLS模型校正和测试相关图(a):多元散射模型;(b):多元散射蒙特卡罗模型;(c):多元散射变量组合集群模型;(d):多元散射区间变量迭代空间收缩模型Fig. 3 Calibration and test correlation diagrams of PLS model for quantitative
analysis of corase fiber content with different variable selection methods
(a): MSC-PLS; (b): MSC-MCUVE-PLS; (c) : MSC-VCPA-PLS; (d): MSC-iVISSA-PLS分析, 采用不同的光谱预处理方法和光谱变量选择方法对光谱模型进行优化。结果表明,在饲料粗脂肪定量分析中,MSC 预处理方法结合 MCUVE 变量选择方法可以 建立 最优
粗脂肪分析模型,模型变量数由1 501降低到400, RMSEP第1 期光谱学与光谱分析219和RMSECV分别降低为0. 19和0. 17, +p和+c提高到0. 89
和0.92;在饲料粗纤维定量分析中,利用MSC预处理方法
为0 . 23和0 . 23, +p和+c分别为0 . 94和0 . 95。因此,基于
近红外光谱建立的MSC-MCUVE-PLS模型可以有效的进行 饲料的粗脂肪和粗纤维的定量分析,其精度高,稳定性好且
和MCUVE变量选择方法可以实现最优的粗纤维定量分析
模型,模型变量数为740,模型的RMSEP和RMSECV分别更简洁&References[1 - Sagrario M, Ana S, Adela MF, et al. Taianta, 2017, 162: 597.[2 - Patrica A H, Sarah N, Harry B C, et al. Journal of Equine Veterinary Science, 2018, 71: 13.,3 - Luisa M, Ilaria F, Giuseppina A, et al. Food Chemistry, 2018, 267 : 240.,4 - Kelton S S, Anderson S S, Telma W L, et al. Journal of Computer Science, 2015, 11(4) : 621.,5 - Hideyuki S, Junji M. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 192 : 236.,6 - Asmund R, Frans B, Soren B E. Trebds in Analytical Chemistry, 2009, 28(10) : 1201,7 - LI C, Zhao T L, LI C, et al. Food Chemistry, 2017, 221: 990.,8 - Liu X W, Cui X Y, Yu X M, et al. Chinese Chemical Letters, 2017, 28 : 1447.,9 - WU Jing-zhu, WANG Feng-zhu, WANG Li-li, et al(吴静珠,汪凤珠,王丽丽,等).Spectroscopy and Spectral Analysis!光谱学与光谱
分析),2015, 35(1): 99.,10- Yun Y H, Wang W T, Deng B C, et al. Analytica Chimica Acta, 2015, 862: 14.[11- Yang Y N, Xie F F, Yan B, et al. Chemometrics and Intelligent Laboratory Systems, 2017, 170 : 102.,12- ZHAO Huan, HUAN Ke-wei, ZHENG Feng, et al (赵
环,宦克为,郑 峰,等).Journal of Changchun University of Science andTechnology!长春理工大学学报$自然科学版),2016, 39(5): 51.,13- DengBC, Yun Y H, LiangYZ, etal Analyst, 2014, 139+4836,14- DengBC, Yun Y H, MaP, etal Analyst, 2015, 140+1876,15- RipolG, LobonS, Joy M MeatScience, 2018, 143+24,16- FienDL, ElisabethP, HasnaD, etal JournalofPharmaceuticalandBiomedicalAnalysis,2018,151+274,17- PedroSS, AndreiaS, AnaC,etal FoodChemistry,2018,242+196The Research on Quantitative Analysis of Feed Crude Fat and Corase Fiber Based on Near Infrared Spectroscopy and Variables Selection MethodsHAO Yong, WU Wen-hui, SHANG Qing-yuanSchool of Mechatronics & Vehicle Engineering, East China Jiaotong University, Nanchang 330013 , ChinaAbs;rac; Near infrared spectroscopy (NIRS)combined with partial least squares (PLS)method was used to achieve rapid quan-
titativeanalysisofcrudefatandcorasefiberinfeed Thenorris-wiliamsderivation (NW)and multiplicativescatercorrection
(MSC)methodswereusedtopretreatthespectrum#andthemontecarlobaseduninformativevariableelimination (MCUVE)#
variables combination population analysis (VCPA) and interval variable iterative space shrinkage approach (iVISSA) were used toselectandoptimizethevariablesofthespectrum PLS wasusedfortheestablishmentofthespectralcalibration model, and
the parameters of calibration set correlation coefficient (+c), root mean square error of cross validation (RMSECV) , prediction
set correlation coefficient (+p) and root mean square error of prediction (RMSEP) were used to evaluate the models. Compared wiho%herpre%rea%men%me%hods#%heRMSECVandRMSEPvaluesof%hespec%ralmodelaf%erMSC%rea%men%decreased#while
%he +c and +p values increased. In%he crude fa%quan i%a ive analysis model#%he RMSECV and +c of%he original spec%ral model were0.21and0.87#RMSEPand+p were0.20and0.88#and%henumberofvariables (Vn) was1501.Af%erselecingvariables by MCUVE me%hod#RMSECVand+c were0.17and0.92#RMSEPand+p were0.19and0.89#andVn was400.ForVCPA-
PLS model , the RMSECV and +c were 0. 206 and 0. 87 , RMSEP and +p were 0. 25 and 0. 81 , and Vn was 12. For iVISSA-PLS model the RMSECV and +c wereP. 21 andP. 86 RMSEP and +p wereP. 2PandP. 87 andVn was 2P. In the corase fiber model , the RMSECV and +c of the original PLS model were 0. 28 and 0. 91 , RMSEP and +p were 0. 23 and 0 . 95 , and Vn was 1 5 0 1.
After MCUVE selection theRMSECVand+cofthemodelwere .23and .95 RMSEPand+p were .25and .94 andVn was74P.AfterVCPAselection theRMSECVand+cofthemodelwereP.27andP.91 RMSEPand+p wereP.3PandP.91
andVn was11.AfteriVISSAselection theRMSECVand+cofthemodelwereP.29andP.9P RMSEPand+p wereP.27and
22P光谱学与光谱分析第40卷0. 93, and Vn was 20. The results showed that the MSC method could effectively improve the spectral quality and eliminate the
spectral translation error; the MCUVE variable selection method could simplify the model to improve the model accuracy and stability, andestablishtheoptimalmodel.Inthecrudefatquantitativeanalysis model, afterthe MSC-processedspectrum was selected by MCUVE, the remaining 400 were used to establish the PLS model, +c and +p were improved by 0. 05 and 0. 01 com
pared to the full-spectrum model, and the RMSECV and RMSEP were reduced to 0. 17 and 0. 19 ; The model selected by VCPA
and iVISSA had almost the same result as the ful -spectrum model, anditsgreatestfeature wasthatonly12and20variables
were selected. In the corase fiber model, 740 variables selected by MCUVE were used to establish the PLS model with +c and +p
of0.95and0.94,RMSECVandRMSEPof0.23and0.23,respectively;VCPAandiVISSAused11and12variablestoestab- lishtheregression model, but its model results were al worse than the MCUVE model.Theestablishmentof MSC-MCUVE- PLSquantitativeanalysismodelusingfeednear-infraredspectroscopycouldefectivelyquantifycrudefatandcorasefiberinfeed.Keywords Near infrared spectroscopy (NIRS) ; Feed; Monte carlo based uninformative variable elimination (MCUVE) ; Varia
bles combination population analysis (VCPA); Interval variable iterative space shrinkage approach (iVISSA)(Rece2vedNov. 21, 2018%accepted Mar.19, 2019)本刊声明近期以来,一些不法分子假冒《光谱学与光谱分析》期刊社名义,以虚假网站等形式欺骗广大作者、读者&这些虚假网站
公然假冒《光谱学与光谱分析》期刊名义进行大肆的征稿并骗取作者的审稿费和版面费&经部分作者及读者举报,现有关部门
已就此介入调查&我刊将通过法律途径向假冒者追究相应的责任,维护本刊权利。本刊官方网站已正式开通,网址为http: //www. gpxygpfx. com/在此郑重声明,本网址为《光谱学与光谱分析》期刊唯一开通运行的官方网站&本刊从未授权任何单位或个人以任何形
式(包括网上网下)代理本刊征稿、审稿等项业务&希望广大读者和作者切实维护好自身的合法权益,防止受骗上当&《光谱学与光谱分析》期刊社
2019年3月15日
因篇幅问题不能全部显示,请点此查看更多更全内容