高光谱成像的牛肉丸掺假检测
肉丸是一种有着特别口感的肉类深加工产品,深受人们喜爱。相比于猪肉、鸡肉、鱼肉等其他原料肉,牛肉的蛋白质含量较高,肌纤维较粗,因而加工特性更好,牛肉丸也比其他肉丸更有弹性和嚼劲。在我国,以广东潮汕地区制作的牛肉丸为著名。然而,有不法商贩受利益驱使,在牛肉中掺入猪肉,鸡肉等廉价肉制作肉丸冒充纯牛肉丸售卖。这种行为不仅扰乱市场秩序,还会引发一些宗教问题。广东省发布地方标准中明确规定汕头牛肉丸中牛肉占原料肉的比例须大于90%。因而有必要研究快速检测牛肉丸掺假的方法。目前,常用的肉类产品掺假鉴别方法有蛋白质组学分析法,DNA分析法,传感器法和光谱法等。这些检测方法各有其优缺点。蛋白质组学分析法检测结果准确,但所用设备价格昂贵,重复性较差。DNA分析法检测限低,灵敏度高,但操作复杂,且同样存在重复性差的问题。传感器法有着快速无损的优点,然而其结果不够准确。光谱法不仅快速无损,且准确度高,近年来在肉品掺假检测方面得到越来越广泛的应用。高光谱成像技术作为光谱法的一种,不仅具有光谱技术的常规优点,而且较其他光谱技术有着更加全面的信息。高光谱成像能够以数百个波长同时对样本连续成像,同步获取样本的光谱和图像信息,有着数据量丰富、分辨率高的特点。但同时高光谱成像也存在光谱信息重叠、冗余的问题,需要通过特征波长的筛选来提升模型效率和精度。高光谱成像在无损检测肉品掺假方面已有较多的应用。Ropodi等利用高光谱成像结合 PLS-DA和LDA判别模型鉴别掺有猪肉的牛肉样本,结果表明,两种建模方法均可以较好地区分掺假样本,识别率分别为98.48%和96.97%。Kamruzzaman等利用高光谱成像预测牛肉中掺马肉含量,采用不同的方法处理光谱数据并建立偏最小二乘模型(PLS),模型预测集相关系数达到0.98。Wu等研究了高光谱预测虾中掺假物明胶含量的可行性,使用无信息变量消除和连续投影法的组合筛选了佳波长,建立的LS-SVM模型预测集相关系数达0.965,并实现了虾中明胶含量的分布可视化。上述研究证实了高光谱检测肉品掺假的可行性,然而目前未见高光谱应用到牛肉丸掺假检测的报道。
根据唐穗平等的调查,猪肉和鸡肉是市场上主要的牛肉丸掺假物。因此,利用高光谱成像系统采集掺有不同比例猪肉和鸡肉的牛肉丸的信息,对光谱信息进行预处理后建立全波段偏最小二乘掺假含量量预 测模型,而后采用SPA、竞争性自适应重加权算法、联合区间偏最小二乘-竞争性自适应重加权筛选特征波长,建立PLS掺假含量预测模型,以期为牛肉丸掺假快速检测提供参考。
1.1 样本制备
实验所用牛腿肉、猪肉、鸡腿肉、淀粉、调味料(食盐、白糖、味精、黑胡椒粉、料酒)均购于镇江麦德龙超市;肉弹素、谷氨酰胺转氨酶(TG酶)均购于河南千志商贸有限公司。
肉丸制作配方:每1kg原料肉中加入淀粉100g、食盐25g、白糖20g、肉弹素5g、味精4g、黑胡椒粉5g、TG酶5g、料酒20ml、水200ml。工艺流程:选料→清洗→沥干→绞肉→斩拌→混料→煮制→冷却→包装。首先制作原料肉全部为牛肉的牛肉丸,再分别制作以牛肉糜混合不同比例猪肉糜和鸡肉糜的牛肉丸,掺假肉占原料肉质量比分别为5%,10%,15%,20%和25%。总共得到11类样本,每类样本30个平行,共计330个样本。
1.2 高光谱图像采集
1.2.1 高光谱成像系统
采用的高光谱成像系统如图1所示,由江苏大学食品无损检测实验室自主研制。系统硬件部分主要包括CCD摄像机、150W光纤卤素灯、精密电控平移台、电子控制箱和计算机等。软件部分主要是SpectralCube。
1.2.2 高光谱成像数据采集与标定
在高光谱数据采集之前先打开系统预热30min,以减少基线漂移带来的的影响。设置采集参数:CCD摄像机曝光时间为45ms,图像分辨率618*1628;光谱范围为431~962nm,光谱波长间隔为0.858nm;电控平移台移动速度为1.25m/s。采集时将牛肉丸样本置于电控平移台上,打开平移台的同时点击保存按钮采集高光谱数据,最终得到样本的三维数据模块。
高光谱数据采集过程易受光强不均匀和暗电流等影响,需要对获取的原始图像进行黑白板校正。校正公式如式(1)所示。
式中,R为校正后高光谱图像;I为原始高光谱图像;B 为黑板标定图像;W为白板标定图像。
1.3 数据处理方法
1.3.1 高光谱成像的光谱数据提取
利用ENVI软件打开校正后牛肉丸样本高光谱图像,采用矩形工具选取每个样本中心附近200像素*200像素的区域作为感兴趣区域ROI,计算ROI内所有像素点的光谱反射率的平均值作为此样本的光谱数据。300个样本共得到300条平均光谱,最终得到300*618的光谱数据集。
受环境条件和仪器运行等因素的影响,采得的信息中包含无用信息和噪声。为了减少散射光和噪声等影响,需要对光谱数据进行预处理。采用的预处理方法包括一阶导数、二阶导数、均值中心化、多元散射校正、卷积平滑、标准正态变量变换。通过对比不同预处理方法所建立模型的效果,选取较佳预处理方法进行后续数据处理。
1.3.2 光谱特征波长筛选
光谱信息数据量巨大,且存在冗余信息。为了提高模型的效率和精度,对预处理后的光谱进行特征波长的筛选。采用连续投影法(SPA)、竞争性自适应重加权算法(CARS)、联合区间偏最小二乘法(SiPLS)和联合区间偏最小二乘-竞争性自适应重加权(SiPLS-CARS)四种筛选特征波长方法。SPA通过比较不同波长之间投影向量的大小,以投影向量最大的波长为待选波长,并用校正模型选择特征波长。SPA可以使变量之间共线性最小化,很大程度上减少变量的个数。CARS通过蒙特卡罗采样随机抽取校正集的一部分样本建立PLS模型,计算此次采样中波长回归系数的绝对值权重,再利用指数衰减函数去除绝对值较小的波长变量点,剩余的变量以其回归系数的绝对值作为权重采用自适应重加权采样建立PLS模型并计算RMSECV,当RMSECV最小时对应变量即为选择的特征波长。SiPLS先将全波段分为若干个子区间,然后通过计算从所有可能的区间组合模型中选择出相关系数最大且RMSECV值最小的区间组合,是一种高效的筛选特征区间方法。本研究提出的SiPLS-CARS是联用SiPLS和CARS进行波长筛选的一种方法,先利用SiPLS选择最佳波长区间,再利用CARS从最佳区间中筛选特征波长。最后对不同波长筛选方法下建立的预测模型效果进行比较。
1.3.3 掺假含量预测模型
通过建立PLS模型预测牛肉丸掺假含量。PLS能够充分提取数据的有效信息,解决变量共线性的问题,在光谱数据建模中应用广泛。PLS模型预测效果的评估指标为校正集相关系数、预测集相关系数、交叉验
证均方根误差和预测均方根误差。Rc和Rp越接近1,RMSECV和RMSEP越接近0时,模型的预测效果越好。
二 、结果与讨论
2.1 光谱预处理
图2(a)和图3(a)分别为掺有猪肉和鸡肉的牛肉丸样本的原始光谱图,图2(b)和图3(b)为对应平均光谱图(均含有纯牛肉丸光谱)。从平均光谱图中可以看出,不同掺假含量的样本光谱曲线趋势相近,但反射率存在差别,掺假量越大,反射率越大。纯牛肉丸和掺有猪肉的样本平均光谱在710nm处有反射峰,这主要与,O-H键的三级倍频吸收有关。掺有鸡肉样本光谱在710nm处反射峰不如掺有猪肉样本明显,这是由于相比于猪肉,鸡肉与牛肉的差别更大。从原始光谱图中可以看出,当样本数量较大时,光谱曲线重叠严重,无法通过肉眼从光谱曲线上进行区分,此时需要进行数据处理以实现掺假量预测。
2.2 牛肉丸中掺假猪肉含量预测模型建立
2.2.1 全波段PLS模型
将不同预处理方法处理后的光谱以随机分组的方式把180条猪肉掺假光谱的2/3划分为校正集,1/3划分为预测集。用PCA优选前15个主成分,作为模型的输入建立PLS掺假含量预测模型。模型的预测结果如表1所示,可以看出,光谱经MSC预处理后建立的模型预测效果好,当主成分数为15时,模型的Rc和Rp分别为0.9515和0.9481,RMSECV和RMSEP分别为0.0269和0.0261。
2.2.2 特征波长筛选
全波段光谱数据量大且有冗余信息,需要进行特征提取以简化模型、提升模型效率。分别采用SPA,CARS,Si-PLS和SiPLS-CARS四种方法筛选特征波长。2.2.1已指出掺有猪肉的预测模型预处理方法是MSC,故对光谱数据进行MSC处理后进行特征波长筛选。
(1)SPA筛选特征波长
设置选择特征波长数量范围1~25,根据均方根误差(RMSEC)选择波长,选择结果如图4所示。图4(a)和(b)分别表示RESE变化趋势和筛选的特征波长具体位置。从图4(a)中看出,当波长数量从1增加到13时,均方根误差的值程阶梯状下降,随后趋于稳定。选择了13个特征波长(431.05,442.63,476.73,502.69,522.89,555.88,742.60,786.19,864.10,878.14,903.59,927.31和948.39nm),占全波段的2.1%,特征波长具体位置如图4(b)所示。
(2)CARS筛选特征波长
CARS筛选波长的过程如图5所示。采样次数设置为100次,图5(a)为变量个数随采样次数的变化趋势,随着采样次数增加,选择的波长数量逐渐减少,先快减后缓慢。图5(b)为RMSECV随采样次数变化趋势,一开始RMSECV缓慢减小,说明一些无关变量在采样过程中被去除。而后RMSECV阶梯上升,一些关键变量被去除。图5(c)显示采样次数为44时,RMSECV小,此时共筛选了51个特征波长,占全波段的8.25%。
(3)SiPLS筛选波长
将预处理后的全光谱划分为10~25个子区间,分别联合2,3和4个子区间,以RMSECV最小原则优选特征子区间组合。图6显示了联合子区间的位置。从图中可以看出,当把全光谱分为14个子区间,联合第1,3,7,13子区间时,RMSECV最小。每个子区间包含45个波长,因此共筛选180个特征波长,占全波段的29.13%。
(4)SiPLS-CARS筛选特征波长
SiPLS-CARS通过联用SiPLS和CARS实现特征波长的选择。将SiPLS筛选所得波长区间作为新数据,进行CARS波长筛选,结果如图7所示。从图中可以看出,当采样次数为9时,筛选出32个特征波长,占全波段的5.18%。
2.2.3 特征波长下PLS模型结果
不同特征波长筛选方法的PLS模型结果如表2所示。可以看出,CARS筛选波长后建立的模型预测效果佳,模型的Rc和Rp分别为0.9814和0.9721,RMSECV和RMSEP分别为0.0163和0.0203。SPA虽然减少了特征波长数量,但模型的预测效果不如全波段下预测效果。Si-PLS筛选特征区间后模型精度没有得到提升,这是因为所提取的变量是连续的,相邻或者相互之间可能会存在高度相关性。SiPLS-CARS相比于SiPLS不仅有效地缩减了特征波长数量,而且提高了模型预测的精度;相比于CARS筛选波长更少,但精度略低。CARS波长筛选后模型,可以说明CARS可以有效去除无关变量。SiPLS-CARS作为一种新的特征波长筛选方法需要在更多实际应用中测验其实用性。
2.3 牛肉丸中掺鸡肉含量预测模型建立
2.3.1 全波段下PLS模型结果
牛肉丸中掺鸡肉全波段PLS建模方法同2.2.1,结果如表3所示。掺鸡肉含量预测结果总体优于掺猪肉结果,这是因为鸡肉与牛肉差异更大。经1stDer预处理后建立的模型预测效果好,当主成分数为14时,模型的Rc和Rp分别为0.9861和0.9807,RMSECV和RMSEP分别为0.0143和0.0165。
2.3.2 特征波长的筛选
利用SPA筛选了15个特征波长(439.32,448.43,461.72,467.55,473.39,493.46,504.37,591.63,622.44,695.72,,704.38,726.08,768.74,922.04和952.78nm),占全波段的2.43%。CARS筛选了61个特征波长,占全波段的9.87%。SiPLS选择的区间组合为:将全光谱分为14个子区间,联合第7,8,11,12四个子区间,共180个特征波长,占全波段的29.13%。SiPLS-CARS筛选了28个特征波长,占全波段的4.53%。
2.3.3 特征波长下PLS模型结果
不同特征波长筛选方法的PLS模型结果如表4所示。与掺猪肉预测结果类似,CARS筛选波长后建立的模型预测效果佳。此时,模型的Rc和Rp分别为0.9902和0.9878,RMSECV和RMSEP分别为0.0123和0.0126。这表明CARS在牛肉丸高光谱掺假检测中能够较好地去除无关变量、提升模型效率和精确度,可结合PLS模型用于实际检测。不同波长筛选方法对牛肉丸中掺鸡肉含量预测趋势上与掺含量猪肉基本相同。
三、结论
利用高光谱成像进行牛肉丸掺猪肉和鸡肉检测研究。首先采用不同预处理方法建立全波段下PLS模型并比较得出预处理方法,然后用不同方法筛选特征波长建立PLS模型。结果表明:(1)在1stDer,2ndDer,MC,MSC,SG和SNVT预处理方法中,牛肉丸掺猪肉和鸡肉PLS预测模型预处理方法分别为MSC和2ndDer。(2)在SPA,CARS,Si-PLS和SiPLS-CARS四种特征波长筛选方法中,牛肉丸掺猪肉和鸡肉PLS预测模型方法均为CARS,分别筛选了51和61个特征波长。此时,掺猪肉PLS预测模型Rc和Rp分别为0.9814和0.9721,RMSECV和RMSEP分别,0.0163和0.0203。掺鸡肉PLS预测模型Rc和Rp分别为0.9902和0.9787,RMSECV和RMSEP分别为0.0123和0.0126。掺鸡肉预测模型效果整体好于掺猪肉。研究表明采用高光谱成像技术可以实现牛肉丸掺猪肉和鸡肉含量预测,可为快速无损检测牛肉丸掺假提供理论基础。
来源:高光谱成像的牛肉丸掺假检测:孙宗保,王天真,李君奎,邹小波" ,梁黎明,刘小裕{光谱学与光谱分析 第40卷第7期}