MUSES9-HS高光谱相机应用方向
对植物病害和植物胁迫的可靠检测和识别是目前农业领域的一大挑战。现有的标准检测方法通常依赖于农作物学家手动检查作物上可见的症状,还要受限于作物的类型和作物面积的大小(对于许多商业作物来说,面积往往很大),这种监测植物健康的方法既费时又费力。人工检测还依赖于病害或压力表现出明显的症状,而这些症状经常在病害的中后期才表现出来,再通过人工检测或诊断性测试来确定病原体。疾病通常从叶片上的一个小区域开始(例如,由真菌病原体Mycosphaerellagraminicola引起的小麦Septoria tritici blotch(STB);由Venturiainaequalis引起的苹果疮痂),如果作物很大,目视检查可能很难发现,而能够在这个早期阶段识别疾病将会提供一个早期干预的机会,在整个作物被感染或损害之前,控制、预防感染的扩散,或改变作物管理方法。识别受疾病影响的作物区域还有助于针对性地应用化学品。这种精确的方法将可以减少农药和除草剂用量,从而对环境、生态系统服务、种植者的成本和最终消费者产生有利影响。因此,农业和园艺部门对用更自动化的、有针对性的和精确的方法来取代这种人工观察的过程有着浓厚的兴趣。Mahlein发表了关于通过成像传感器检测植物病害的文献,其中包括RGB、多光谱、高光谱、热能、叶绿素荧光和三维传感器。最终观点是,RGB和高光谱成像对于识别特定疾病的效果来说是比较好的。
为了改善作物管理和植物健康,一些研究集中在如何在开始阶段识别到病害,要在出现明显迹象之前。图像分析技术在这方面显示出很大的潜力,它们代表了检测植物中生物和非生物压力的非侵入性和潜在的自主方法。Singh等人在最近的一篇论文中说明了这一点,该论文研究了用于胁迫表型的机器学习,探讨了使用不同传感器进行胁迫识别、分类、量化和预测的高通量表型。
作为一个研究领域,图像分析代表了大量的计算技术,能够从数字图像中提取信息。从实用的角度来看,这意味着对精心捕捉的图像进行自动处理,从图像中产生所需测量的数据集。图像本身可以来自各种来源,从彩色数码相机或智能手机,到更专业的相机,旨在捕捉图像中的各种不同信息。这里的一个技术进步是高光谱图像,相机捕捉到的不仅仅是传统数字图像中常见的三个彩色光带。本论文将特别关注随后的分析方法,即高光谱图像分析。由于技术成本的下降,这种方法最近在经济上已经可以被广大用户所接受。正在开发的分析方法使高光谱成像技术能够被用于更广泛的应用。高光谱成像在很大的光谱范围内使用高保真颜色反射信息(超出人类视觉范围),因此有可能识别植物生长和发展中的微小变化。
在这篇评论中,我们概述了高光谱成像技术,以及如何在实验室和田间应用中利用它来分类和识别植物叶子疾病和压力的早期阶段。从背景理论和高光谱成像技术的概述开始,我们考虑了该方法在植物和作物科学中的一些应用范围。最后,我们讨论了这些方法的一些实际问题;这是一个重要的方面,因为这种相机通常还不能作为作物监测的交钥匙解决方案,所以在这些技术的部署可以在商业环境中实施之前,必须注意收集令人满意的数据,并提供有意义的分析和解释。
1. 彩色数字成像
为了理解高光谱技术本身,首先考虑一下一个标准的、非高光谱的彩色数字图像包括哪些内容,这将是很有帮助的。光的波长对应于颜色,蓝光的中心波长约为475纳米,绿光为520纳米,红光为650纳米。一幅彩色图像代表了三个宽波段的组成,红、绿、蓝。我们的眼睛包含三种类型的锥体,对光谱中的蓝色、绿色和红色部分敏感,每一种锥体都有一个颜色范围,它们受到的刺激或强或弱,取决于发射光的波长。结合来自三种不同锥体的信息,我们在大脑中重建了一个彩色图像。数字图像试图模拟锥体的敏感性,一个像素存储了光谱中蓝色、绿色或红色部分的综合强度,这取决于放置在该像素前端的过滤器类型。高光谱系统中捕获的光线范围也会有所不同。人眼可见的颜色是电磁波谱上的一个小范围,从400到700纳米(图1)。通常用于植物高光谱成像的光谱部分从紫外线(UV)(始于约250纳米)到短波红外(SWIR,约2500纳米)。照相机通常捕捉某个子范围,如可见光和近红外范围(VIS-NIR,400-1300纳米)或短波红外(1300-2500纳米)或紫外线(250-400纳米),这些范围在一些传感器中被结合起来以增加光谱的覆盖范围。
那么,彩色图像就是一个三波段多光谱图像的例子,其中每个波段记录了三种颜色中的一种,即红、绿和蓝。在真正的多光谱图像中,通常会有更多的波段,也许还会对光谱中的红外区域的光进行采样,即波长超过700纳米的光。另一方面,高光谱图像通常包含光谱范围内数百个连续的窄波段。这种方法产生了密集的、信息丰富的彩色数据集,具有足够的空间分辨率,每片叶子有数百个数据点(像素)。
对于植物和植被,非常有用的分析波长范围是可见光范围和近红外范围。这个波长范围可以捕捉到叶子色素(400-700纳米)和间叶细胞结构(700-1300纳米)的变化,但是要看到植物的含水量的变化,需要扩展范围(1300-2500纳米)。例如,严重脱水会影响叶子的中叶结构,这与近红外反射率的变化有关,然而,轻微的干旱压力通常不会有足够的影响,无法被检测到。
2. 高光谱成像技术
高光谱成像光谱仪背后有各种硬件方法,这意味着有不同的方式来捕获图像。成像的设备包括推扫器、滤波轮、液晶可调谐过滤器等等。在一个使用推扫的案例中,入射光线通过一个凸面光栅(或棱镜),将光线分离成狭窄的波长。这种分离后面会被记录在一个光敏芯片上(类似于标准的数码相机)。一个推扫器,有三个组成部分;照相机、光谱仪和镜头。这个系统同时捕捉图像的单一空间线,以及整个彩色光谱范围。然后相机或物体被移动,下一条线被捕获(扫帚被"推"向前方,因此而得名),有效地使相机成为线扫描器,最终的图像是在全部扫描完成后建立的。替代推扫的另一种方法是快照方法,即一次性采集整个图像。迄今为止,推扫技术得到了很多的使用,但最近快照技术的进步正在增加与表型和分析有关的接受度和可能性。
在本综述的其余部分,我们考虑了高光谱成像技术和分析的应用,并将综述分为以下四个部分:(1)现有的植被和病害指数;(2)健康和有病植物的检测和分类与病害分类的应用;(3)量化病害的严重程度;以及(4)早期阶段检测压力症状。
在这些章节中,我们将考虑基于实验室的成像方法,以及基于现场的遥感。除了明显的生物差异外,值得考虑这些环境对高光谱图像数据本身的影响。基于实验室的成像方法是在一个受控的环境中进行的,其中包括人工光源。室外遥感数据通常取决于环境光照,尽管有一些系统使用受控照明进行室外高光谱成像的例子。使用自然光照,即太阳,意味着认识到存在着大气效应,如光的吸收和散射。其他可能导致光谱特征变化的环境因素有:云影和物体表面之间的相互作用、一天中的时间、镜面反射和其他物体的存在,它们可以将二次照明反射到感兴趣的区域。由于这些影响中的许多都与时间有关,成功使用校准参考意味着每当环境照明发生变化时都要更新参考,这在自然照明情况下可能非常短的时间。在受控的照明下,仍然存在问题:存在着光强度的问题:反平方定律指出,照度会根据与光源的距离成反比下降。这意味着会出现不均匀的照明,选择的光源类型需要仔细考虑,它不应该有横跨光谱或图像平面的高强度峰值。
实验室和现场成像之间的另一个潜在差异是分辨率。对于航空遥感数据,空间分辨率通常在每像素米的范围内,这意味着像素通常包含一种以上材料的特征。分析这种数据的第一步是考虑这种多金属问题,即必须考虑像素包含混合材料(称为"混合像素"),并且必须应用光谱解混过程。换句话说,一个像素可能包含植物和土壤,必须使用算法来确定适当的混合。在实验室中,图像通常可以在植物的几厘米范围内拍摄,甚至可能有许多像素代表一片叶子或疾病区域。在这些情况下,一般没有必要进行解混。
对这些基于位置的挑战的进一步考虑将在本评论的后面充分探讨,但在我们继续之前,让我们考虑一下为什么我们希望首先捕获这种高光谱信息。
3. 应用于健康和患病植物的检测和分类
在本节中,我们将讨论专门用于检测植物中生物压力的各种技术。分类技术,也就是把数据分成健康和病害两类的技术,可以分为两种类型:一种是专注于光谱中一些关键波长的技术,另一种是使用整个光谱反应的技术。更进一步说,疾病分类的讨论涉及到多种疾病的识别和特定疾病的检测。
3.1现有的植被和疾病指数
在高光谱成像设备出现之前,希望根据颜色信息对效果进行量化的研究人员已经使用多光谱成像或高光谱、点源设备(如不产生空间图像的光谱仪)来获取颜色数据。高光谱设备一般不提供点对点的测量。相反,用户有很大的责任来开发捕获过程。一旦获得,必须对产生的大量数字数据集进行分析,以提供有用的信息。进入这种大型数据集的一个明智而简单的方法是只考虑波长范围内的少数位置,观察在光谱中预定的关键点的不同条件的变化。使用这种方法,我们还可以通过考虑数据值的比率来抵消相对光变化的影响。这涉及到两个或多个波长的组合,通常被称为"指数"。
为了解释这些数据,通过预先考虑的生物推理(例如知道特定的波长与特定的细胞结构的特性有关),或者由于采集设备所能提供的特定波长的限制(例如从卫星多光谱遥感数据中得出的指数可能只有有限的波长可以使用),已经开发了一些此类指数。当应用于植物材料时,这些指数被称为"植被指数"。存在许多不同的植被指数,每一种指数都使用不同的波长测量来描述植被的生理属性,考察植物的一般属性或其生长的具体参数。
非常流行和广泛的指标之一是归一化差异植被指数(NDVI),它被用来测量作物的一般健康状况。它是通过近红外光和可见光的简单比率来计算的(见表1)。NDVI已被用于许多不同的目的,例如,检测由Sunnpest谷物害虫EurygasterintegricepsPut.(Hemiptera:Scutelleridae)在小麦中造成的压力。大多数指数是非常具体的,只对它们所设计的数据集有良好的效果。有一些以疾病为中心的研究专注于创建疾病指数来检测和量化特定的疾病,例如,一项研究使用叶锈病严重程度指数(LRDSI)检测小麦的叶锈病(Pucciniatriticina),准确率为87-91%,然而,据我们所知,它还没有被广泛测试。
另一种常用的方法是检测红色/近红外边界处反射率突然增加的变化。这个"红边"位置是电磁波谱中的一个狭窄部分(690-740纳米),可见光谱结束,近红外开始(图2)。这一段在规格反应(导数)上有很大的变化,对于绿色植物材料来说,由于叶绿素强烈吸收了700纳米左右的波长,因此材料在这个范围内的反射率很低,但它对红外线(从720纳米左右)有强烈的反射。Cho描述了一些提取或检测红边的不同算法。一个基于红边位置的疾病指数被用来检测小麦的白粉病(Blumeriagraminisf.sp.Tritici),然而它没有部分最小二乘回归(PLSR)那么准确,后者是一种使用统计学方法的技术。我们将在本评论中进一步考虑这些统计学方法中的一些。
3.2使用选定波长的子集进行分类
在这一节中,我们考虑的是依靠全光谱中特定波长的子采样的分类方法。与真正的多光谱数据不同的是,特定的波长可以手动或自动从采集范围的任何地方选择,而多光谱数据则受技术限制。
来自 "背景 "部分的分析通常使用指数来计算代表值,使用光谱中不同位置的离散波长。其中一项涉及小麦田间实验的研究使用了归一化差异植被指数(NDVI)响应,从数据集中消除了除叶子以外的一切数据集,然后用一种叫做"方差分析"的统计方法方差分析(测量统计协方差),以识别选定的波段,然后用二次方鉴别分析(QDA)来对光谱进行分类。在健康和病变叶片(黄锈病)之间进行分类。这代表了超规格分析的典型工作流程:隔离(或分割)图像中感兴趣的部分,然后使用数学技术来识别光谱中可能具有预测能力的区域,最后使用这些空间和光谱区域来学习分类方法。使用QDA,4个波段的总体准确性达到92%。
Moshou描述了一个多层感知器(MLP)的例子,他的目的是使用范围为460-900纳米、光谱分辨率为20纳米的光谱仪来检测田间生长的小麦的黄锈病。该分光仪在现场使用一个手持系统拍摄了图像。然后选择了四个重要的波长。前两个波长是使用"变量选择"选择的,这涉及到使用逐步判别分析和使用F检验来比较波长。第二对波长使用NDVI波长。Moshou使用的神经网络是一个简单的架构,有四个输入,一个由十个神经元组成的隐藏层和两个输出(健康和病态)。架构是由输入的数量、选定的隐藏神经元的数量和所需的输出数量决定的。试验和错误可以用来确定一个合适的结构。Moshou尝试了不同数量的神经元并选择了非常有效的。使用这种方法达到的分类精度对健康植物来说是98.9%,对病变植物来说是99.4%。
MLP方法使用一个简单的架构,由输入、隐藏层和输出组成。在机器学习中,一种新的、更复杂的方法,即深度学习,正在变得流行。深度学习指的是人工神经网络,其结构包含很多层,在每一层中,神经元能够隐含地代表数据的特征,通过这样做,可以在后面的层中获得更复杂的信息,图像特征由网络自动确定。深度学习方法的一个具体例子是卷积神经网络(CNN)。而人工神经网络(ANN)使用神经元激活网络作为其类似的模型。CNN则是基于视觉系统中的视网膜场。无论哪种方法,深度学习需要更长的时间来然而,深度学习需要更长的时间来训练,其架构也更加复杂。然而,随着复杂性的增加,非常令人印象深刻的分类和识别率是可以实现的。
深度学习已经被应用于植物病害检测问题。Mohanty使用CNN检测了14种作物的26种疾病。使用了由54,306张彩色图像组成的数据集,80%用于训练,20%用于测试AlexNet和GoogLeNet(两种流行的预训练CNN版本)。AlexNet的准确率为97.82%,GoogLeNet的准确率为98.36%,使用彩色图像从头开始训练(转移学习的数值更高,分别为99.27和99.34%)。他们选择了具有同质背景的单个叶片。如果在与训练图像不同的条件下对网络进行测试,准确率为31.4%。Sladojevic也使用CNN检测各种作物植物的13种疾病,包括苹果(白粉病、锈病)、梨(叶斑病)、葡萄(枯萎病、螨虫、白粉病、霜霉病),使用CaffeNet,准确率为96.3%。
目前很少有完整的研究将深度学习应用于高光谱数据,尽管这是一个活跃的研究领域。为了将高光谱数据用于深度学习,有几个挑战需要解决。高光谱数据的大小,包括波长的数量,需要大量的处理时间和功率,最好是需要一个图形处理单元。超光谱波长的数量很可能包括来自特定波长的噪声。另外,在训练/测试过程中,需要有足够的数据量和标记的数据。还有一种可能性是,误差会比其他方法高。
其他非深度学习方法包括Yuan,使用FishersLinearDiscriminantAnalysis与遥感数据检测小麦作物的黄锈病和白粉病,总体准确率为93%,选择的波长范围(531,570-654,685-717nm)对检测白粉病和黄锈病在这些规格反射范围内的差异有意义,结果是独立t检验。
有时,数据分析方法与简单的图像处理步骤相结合,以增加特征识别。一系列被称为形态学运算符的图像处理技术可以用来清理二元(黑白)图像。其中一种技术叫做侵蚀,通过将边界像素变成背景像素来缩减物体的前景。相反的技术被称为"扩张",其效果是扩大前景物体的边界。它们可以一起用于填补孔洞,或去除二进制标记数据中的斑点噪声(取决于使用的顺序)。使用这种方法的一种方法是对黄瓜叶子数据的研究,在这个例子中,这种技术被用来分析不同类型的霉菌;霜霉病(Pseudoperonosporacubensis)。首先应用原则成分分析(PCA)来减少数据的大小,并产生一个二进制图像,然后在第二步中使用侵蚀和扩张来增强疾病特征。准确率为90%,但是只使用了20个样本(10个健康的和10个感染的)。这种方法不太可能在其他高光谱图像上有很好的效果来检测疾病,除非叶片数据相似,即使如此,结果也是不确定的。
高光谱成像也可以与显微镜相结合,以更高的分辨率捕捉图像。对具有不同基因型的大麦进行了微观层面的研究,以了解是否可以确定基因型之间的光谱差异。还分析了健康和患病植物的大麦叶片,这些植物被接种了白粉病(B.graminis)。结果表明,除了那些含有霜霉病基因座o(mlo)的品种外,健康和接种的叶片之间存在着时间上的差异,该基因座提供了植物对B.graminis的抗性。在这项研究中,由于噪声的影响,光谱范围被缩小到420-830纳米,然后用Savitzky-Golay滤波器进行归一化和平滑处理,然后用SiVM来寻找极端光谱,接着用Dirichlet聚集回归来寻找叶痕。
3.3使用全光谱数据进行分类
分类方法的目的是将数据分为若干不同的类别。它们源于一系列的统计或机器学习技术。其中一种方法是二次判别分析(QDA),它通过使用协方差矩阵来进行分类,该矩阵将各个类别进行比较。QDA方法被用于牛油果植物的研究,以检查真菌疾病月桂树枯萎病(Raffaelealauricola),使用位于田间和玻璃温室的植物。QDA的分类准确率为94%。当然,在分析管道的每个阶段都有可能使用替代方法。例如,不使用QDA,而是使用决策树方法(一种机器学习技术),其准确率达到95%。为数据选择正确的方法,以及确保足够的数据集大小和质量,是关键。这种机器学习方法代表了一套越来越常见的分类和预测算法。机器学习方法使用训练数据集来训练算法,目的是分析和预测新的、未见过的数据的结果。多层网络(MultilayerLowe)是这种技术的一个例子。MLP是简单的网络(称为人工神经网络),将输入数据映射到输出。这个过程是基于对神经元激活网络的生物学理解,其中信息在神经元之间被发射。输入节点连接到输出,使用激活函数和权重进行更新,可以优化产生正确的输出(使用训练数据)。这种算法需要先验知识(训练数据),因此,如果"疾病光谱"是未知的,那么这种技术将是不适合的。
第三种分类方法是通过使用导数来观察规格特征;这时要分析数据的基本模式或变化。二阶(及以上)导数通常对光照的变化不敏感;但是它们对高光谱数据通常遭受的噪声敏感,因此在使用导数之前需要应用"平滑"。平滑化是一个过程,利用平均化的形式减少单个像素强度和相邻像素之间的差异,以创造一个更平滑的信号。两个平滑的例子是Savitsky-Golay和高斯过滤。Savitszky-Golay提出了一种通过对输入数据的子集拟合局部多项式来平滑噪声数据的方法,然后在单点评估多项式来平滑信号。高斯滤波通过使用高斯加权核对中心信息进行平均化,从而减少噪声。
Huang试图通过使用带有一阶和二阶导数的偏最小二乘回归(PLSR)来检测芹菜作物的硬霉菌腐烂病。部分最小二乘法回归选择一组小的成分。这种技术在预测因子是串联的/高度相关的情况下是有用的,它将减少对数据的过度拟合的风险。使用原始光谱的偏最小二乘回归的分类精度为88.92%,使用Savitzky-Golay一阶导数的PLSR为88.18%,使用二阶导数的PLRS为86.38%。准确率相似,二阶导数的表现稍差。Yuan在Fisher的线性判别分析(FLDA)上使用PLSR来检测小麦的病虫害。它对蚜虫危害的准确率为60%,对黄锈病的准确率为92%。在另一项研究中,Zhang使用FLDA检测小麦的白粉病(使用严重受损的叶片),准确率超过90%。
3.4疾病识别
除了检测疾病的存在,研究的另一个方向是区分不同的疾病,以确定特定的病原体。其中一种方法是光谱信息分歧分类。该方法比较了观察到的光谱和参考光谱(光谱库,或数据中感兴趣的平均光谱)之间的分歧,分歧值越小,光谱就越相似,如果它们大于设定的阈值,则不被归类为参考光谱。光谱信息分歧被用来检测柑橘类水果(葡萄柚)上的柑橘军团,数据的光谱范围是450-930纳米,有92个波段,其中有1个波段的数据。5.2纳米的光谱分辨率。在分析数据之前,通过合并相邻的像素来减少一半的尺寸,进行了预处理步骤。腐烂的葡萄果实与正常的葡萄果实以及出现其他疾病或损害症状的葡萄果实进行了比较,包括:油渍、昆虫损害、黑色素、结痂和风疤;这种方法的分类准确率为95.2%。
4. 量化疾病的严重程度
在检测和分类疾病的同时,我们可能希望记录疾病的有效数量,或其严重程度。这种方法确实遇到了一些特殊的挑战。病害对叶片的损害和覆盖程度会影响叶片被归类为健康或病害的准确性。极端的病害会影响叶片的外观,以至于它们可能根本就不能被算作植物材料。尽管如此,仍有许多方法可以估计严重程度,下面我们介绍一些方法。
光谱角度映射器(SAM)方法将像素光谱与参考光谱相匹配,通过计算光谱之间的角度对像素进行分类,这些光谱被视为空间中的n维向量。这种技术已被广泛用于高光谱数据的分类,包括植物病害,并取得了一定的成功。Yuhas研究了收获前小麦镰刀菌头孢病的严重程度。高光谱数据的波长范围为400-1000纳米,光谱分辨率为2.5纳米。SAM用于检测病害的数量,分类准确率为87%。对小麦植物进行了两个实验,一个在玻璃温室,一个在田间。对植物从接种到建立感染的整个发展阶段进行了成像。Yuhas确定,在感染后,健康和受感染的植物是无法区分的,因为感染还没有建立。然而,当高光谱数据在成熟阶段被检查时,小麦的色素组成发生了变化,健康的植株就会显示为患病的植株。
Mahlein使用同样的技术来分析甜菜病害,特别是Cerospora叶斑病、白粉病和叶锈病。范围是400-1000纳米,2.8纳米的光谱分辨率和0.19毫米的空间分辨率。在一段时期内(>20天)对植物进行分析,以监测每种病害的不同阶段,并将叶片分类为健康或病害。Cerospora叶斑病的分类精度取决于疾病的严重程度(89.01-98.90%),白粉病的精度在90.18-97.23%之间,甜菜锈病达到61.70%,在第20天之前没有使用SAM进行分类。
Rumpf等人使用了与Mahlein相同的数据集,但采用了不同的分析方法;决策树(DT)、人工神经网络(ANN)和支持向量机(SVM)。所有的方法都需要先验知识,但是一旦经过训练就被证明是有效的。例如,对于Cerospora叶斑病,SVM的准确率为97%(DT为95%,ANN为96%);对于甜菜锈病,准确率为93%(DT为92%,ANN为95%);而对于白粉病,准确率为93%(DT为86%,ANN为91%)。在病害覆盖了1-2%的叶片后,用叶片面积覆盖率测量严重程度,准确率为62-68%,对于超过10%的叶片覆盖率,准确率几乎为100%。这表明,在同一组高光谱数据上使用各种分析方法来阐明不同的见解并达到不同的准确度--选择技术很重要。表2列出了用于识别特定疾病的常用技术以及与之相关的准确性。
5.检测早期的压力症状
这种检测系统的最终目标是在对植物进行最少的物理改变的情况下识别疾病。尽可能早地识别疾病或非生物问题有明显的好处。通过使用高光谱技术与适当的分析方法相结合,我们可以现实地希望在人工观察之前识别压力症状。
干旱对许多作物来说是一个重大问题,特别是一些植物种类或品种在一段时间内不会明显显示出这种压力,到这时,作物的潜在产量或质量可能已经下降,因为植物的正常发育过程已经通过压力反应受到影响。干旱的定义也可以从少量缺水到完全缺水不等。本节所讨论的研究在植被指数检测到干旱之前就已经检测到了干旱的发生,而且是在明显迹象出现之前几天。
特别是在干旱胁迫的早期检测中,有一项技术已经成为流行的技术,那就是单纯体积最大化(SiVM),它是一种数据聚类技术。这种技术选择健康和受压植物的光谱特征,然后用这些类别对数据进行聚类。当签名变得与预先学习的样本签名相似时,它就被归类为此类。
Romer研究了包含在防雨棚中的大麦试验和在田间种植的玉米试验中的干旱压力。用来检测压力的技术是单纯的体积最大化,这是一种无监督的技术。光谱范围为400-900纳米,光谱分辨率为4纳米。在预处理过程中,一些波长由于噪声而被去除(<470和>750纳米)。这是高光谱数据常见的情况,因为光谱范围末端的光线不足,特别是基于实验室的光源,可能在光谱的这些区域没有产生很多光线。为了减少数据的大小并去除背景,采用了K-means聚类方法,用平均颜色将数据分成选定的若干组。然后将SiVM与四种众所周知的植被指数--NDVI、光化学反射指数(PRI)、红边渗透点(REIP)和类胡萝卜素反射指数(CRI)进行比较。对于大麦的数据,使用SiVM(第9天)比Vegeta-tionIndices(第13天)更早发现部分水胁迫的减少。对于无水/完全干旱条件下的植物,植被指数在第8天检测到胁迫,比SiVM快一天,但它们未能在第9天和第10天检测到胁迫;然而SiVM确实从第9天开始可靠地检测到胁迫植物。
Behmann还使用支持向量机(SVM)分析了大麦的干旱压力。这种算法是超视距的,需要标记的训练数据,在这种情况下,它被标记为干旱或健康。在用SVM分析之前,数据经过K-means预处理,以减少数据集的大小。光谱范围为430-890纳米,光谱分辨率为4纳米。使用这种方法,Behmann在第6天检测到干旱压力,在第16天检测到NDVI差异。
小麦的干旱胁迫已经通过两种组合技术进行了分析,试图提高检测率。Moshou使用最小二乘支持向量机(LSSVM)来尝试检测干旱胁迫。在温室中研究了小麦植物,并对光谱反射和荧光进行了分析。荧光包括使用高强度的光来激发植物组织,使其发出不同波长的光,这可以用来获得额外的生物洞察力。LSSVM需要进行训练,846个数据样本被用于训练,而302个数据样本被用于测试阶段。对于一些技术来说,由于计算时间的原因,数据集的大小和/或波长的数量将决定分析数据的时间。因此,Moshou使用了六个波长-503、545、566、608、860和881纳米。LSSVM对胁迫叶片的准确率达到76.3%,对健康叶片的准确率达到86.6%。然而,该研究指出,通过使用融合光谱和荧光特征的LSSVM模型,总体准确率大于99%。荧光是对叶子中叶绿素荧光的测量,以确定生理变化。
根据Kersting,许多这些技术很难用于非机器学习或数据挖掘专家,因为高光谱数据需要预先处理或适应(即寻找叶片或使用选定的波长)。此外,除了之外,其他技术都没有对大量植物进行几天的分析。当有大量的数据需要分析时,这是植物表型分析需要考虑的一个重要因素。Ker-Sting声称拥有第一个使用高光谱数据进行干旱压力预测的人工智能技术。开发了一种新的方法,其中包括一种不调整数据或缩小尺寸的干旱预测技术。Kersting在一个大麦干旱实验中展示了该方法,其数据是在五周内收集的。使用的技术被称为Dirichlet聚集回归(DAR),它是基于矩阵因子化的。首先,SimplexVol-umeMaximisation被用来从数据中找到50个光谱特征并对它们进行分类。然后,在对这些值使用高斯过程之前,对潜在的迪里切特聚集值进行估计,以找到每个植物和每个时间点的干旱程度。最后,在出现明显迹象之前,该过程预先预测受干旱影响的植物。根据一个为期五周的大麦实验,干旱的预测发生在可见迹象出现之前的1.5周。对SiVM和DAR的运行时间进行了评估,结果是并行的SiVM的运行时间为30分钟,而使用DAR模型只需几分钟。这表明,开发定制的分析技术可以超越现有方法的直接应用(无论是在计算时间、所需假设、易用性还是最终的准确性方面)。
6.高光谱数据采集和软件
高光谱数据的尺寸很大,尤其是对多种植物进行连续几天的成像时。对一种植物的扫描可以很容易地达到大约一千兆字节的大小。如果对整个光谱范围进行分析,那么这个过程将比选择几个波段进行分析要长得多。然而,有大量的信息数据中包含的信息可能是有价值的。研究人员必须决定使用多少光谱分辨率,以及放弃多少。如果你的相机收集了800个光谱带,你必须问自己是否需要所有的800个光谱带,还是分成400个或200个等光谱带就足够了。这类似于对RGB图像使用类似JPEG的压缩方式。这种压缩创造了更小的文件尺寸,但代价破坏了图像信息(特别是色彩信息)。储存较少的光谱带会产生较小的文件大小,并降低数据分析的复杂性,但代价是丢掉潜在的重要颜色属性。Polder等人探讨了使用三个系统设置的摄谱仪的校准和特性。实验研究了不同类型的噪声和信噪比。实验还确定,通过计算分辨率、光谱范围和像素数量,在一定程度上可以进行分选而不损失信息。
6.1高光谱相机的设置
在分析之前,需要对高光谱数据进行校准,以确保产生的图像由于存在的照明颜色而得到调整;相机软件可能有此选项,但如果没有,则可在捕获数据后进行校准。照明是通过一个已知的白平衡目标进行校准的,它由相机系统成像。这个目标将在光谱上反映一个已知的百分比的光,例如,在相机的整个工作光谱上反映99%。照明的非均匀性可以通过将观察到的数据除以捕获的白平衡数据来校正[49]。此外,系统必须对传感器在无光情况下出现的电噪声(称为暗电流)进行校正。这通常是通过在没有任何光线的情况下用相机拍摄图像来进行的,并使用由此产生的低水平噪声读数来调整未来的措施。
一个重要的问题是多长时间进行一次白平衡校准。在实验室环境中,每个月只拍摄一个白平衡目标可能是合适的。实验中,假设照明已经达到一个平衡点(即灯泡已经完全预热)。然而,在实验室外,照明受到的变化要大得多。云层、阴影和一天中的时间都会非常影响外面的光线颜色,因此必须定期进行白平衡读数,以确保准确的校准。还必须仔细选择一天中拍摄图像的时间,以及是否在阴天和阳光直射的情况下进行拍摄(这可能导致阴影和镜面反射的问题--植物上的亮斑直接反射照明源(即太阳))。还应考虑照明的均匀性--传感器是否在其空间范围内记录了均匀的亮度水平?一种被称为渐晕的效果会导致镜头边缘的像素看起来比中心的像素更暗。
7.结论
近年来,专注于利用高光谱图像分析检测植物压力的科学文献显著增加。植物病害检测是农业和园艺作物管理中的一项重要活动。特别是,检测早期的压力和疾病将对农民和种植者有利,因为它将使早期干预有助于减轻作物损失和降低作物质量。高光谱成像是一个非侵入性的过程,通过扫描植物来收集高分辨的数据。该技术正变得越来越流行,因为相机生产成本的下降使研究人员和开发人员能够更多地使用这种技术。有各种技术可用于分析数据,以检测植物的生物和非生物胁迫,本评论中讨论了其中的例子,重点是健康和患病植物的分类、疾病的严重程度和胁迫症状的早期检测。
植被和疾病指数的数量每年都在增加。显著的波长组合在一起可以表明特定物种的健康或疾病状况。然而,指数对于检测植被的具体标准是很有价值的;指数是根据当时的数据集、物种和对实验有利的条件选择的。有些指数更具有普遍性;NDVI、PRI和其他几个植被指数将致力于发现植物的一般健康状况。但一般来说,要把为植物X设计的指数应用于植物Y的数据集是比较困难的。这就是考虑在光谱上采用更大范围的波长的动机,这有可能产生更好的结果。
摘自:Hyperspectralimageanalysistechniquesforthedetectionandclassificationoftheearlyonsetofplantdiseaseandstress:AmyLowe,NicolaHarrisonandAndrewPFrench