【高光谱遥感分类与信息提取综述】 高光谱遥感概念
摘要:本文从高光谱遥感图像的特点与性质入手,介绍了高光谱遥感的应用情况;并对目前所采用的高光谱遥感图像分类与信息提取的算法,以及这些算法的优劣进行综述;接着,论述了投影寻踪在高光谱遥感图像分类中的可行性。
关键词:高光谱 分类 提取 投影寻踪
1 高光谱遥感概述
高光谱遥感(Hyper spectral Remote Sensing 简称HRS)起步于80年代,发展于90年代,至今已解决了一系列重大的技术问题。它是光谱分辨率在10-2λ的光谱遥感,其光谱分辨率高达纳米(nm)数量级,具有波段数众多,连续性强的特点,其传感器在可见光到红外光的波长范围内(0.4μm~2.5μm)范围内以很窄的波段宽度(3~30nm) 获得几百个波段的光谱信息,相当于产生了一条完整而连续的光谱曲线,光谱分辨率将达到5nm~10nm[1]。高光谱遥感数据的表现可以从以下三个方面来理解[2]:图像空间、光谱空间和特征空间。此外,随着高光谱遥感分辨率的增加,特征空间的维数很高,因而表现不同地物类别的能力也随之不断提高,这也是高光谱遥感之所以能够更精确识别地物的主要原因。
2 高光谱遥感的应用
高光谱影像包含了丰富的地表空间、光谱和辐射的三重信息,它同时表现了地物的空间分布并获得了以像元为目标的地物光谱信息。高光谱遥感技术作为连接遥感数据处理、地面测量、光谱模型和应用的强有力工具,其显著特点是在特定光谱区域以高光谱分辨率同时获取连续的地物光谱影像,其超多波段信息使得根据混合光谱模型进行混合像元分解获取“子像元”或“最终光谱单元”信息的能力得到提高,使得遥感应用着重于在光谱维上进行空间信息展开,定量分析地球表层生物、物理、化学过程和参数,随着成像光谱技术的发展与成熟,遥感技术已经大大拓宽了其原来的应用领域,归纳起来主要包括以下几个方面[5]-[19]:1)在精准农业领域的应用(作物参数反演);2)在林业领域的应用(树种识别、森林生物参数填图、森林健康检测等);3)在水质检测领域的应用(反演水质参数);4)在大气污染检测领域的应用(气溶胶、二氧化氮等的检测与反演);5)生态环境检测领域的应用(检测生物多样性、土壤退化、植被重金属污染等);6)在地质调查领域的应用(矿物添图,岩层识别,矿产资源、油气能源探测等);7)在城市调查领域的应用(城市绿地调查、地物及人工目标识别)。
3 高光谱遥感图像分类与信息提取
3.1 遥感图像处理
遥感数字图像处理是以遥感数字图像为研究对象,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能技术,实现地学专题信息的自动提取[18],要素分类与提取在图像处理过程中占有决定性的地位。遥感图像分类是统计模式识别技术在遥感领域中的具体应用,统计模式识别的关键是提取待识别模式的一组统计特征值,然后按照一定准则做出决策,从而对数字图像予以识别。其主要依据是地物的光谱特征,即地物电磁波辐射的多波段测量值,这些测量值可以用作遥感图像的原始特征值。
3.2 高光谱遥感图像分类与提取
目前,高光谱遥感数据分析方法主要有两个方向[19]-[30]:第一是基于光谱空间的分析方法,其基本原理是化学分析领域常用的光谱分析技术;第二个方向是基于特征空间分析技术,该方向的基本思想是把组成光谱曲线的各光谱波段组成高维空间中的一个矢量,进而用空间统计分析的方法分析不同地物在特征空间中的分布规律。
3.2.1 基于光谱空间的分析方法
高光谱遥感技术的最大特点就是:在地物的每一个像元处,可以得到一条连续的光谱曲线,所有的光谱曲线的集合则构成了光谱空间,不同的地物对应于光谱空间中的一条光谱曲线。因此,基于光谱空间的数据分析方法是高光谱数据分析的主要技术之一,其主要思想类似于化学上常用的光谱分析技术,主要是通过对光谱曲线进行特征分析,发现不同地物的光谱曲线变化特征,从而达到识别地物的目的。由于这种分析方法与地物的物理化学属性直接相关,因此可以方便地对分析结果进行物理解释:由于分析过程主要是针对一个像元的光谱曲线,因此,算法往往比较直观和简单。这些特点使得基于光谱空间的分析技术成为引人注目的一种技术,因而,近年来在这方面产生了许多实用的研究结果。
常用的分析方法包括:(1)光谱角填图法(SAM-Spectral Angle Mapping):又称光谱角度匹配法.是以实验室测得的标准光谱或从图像上提取的一直已知点的平均光谱为参考,求算图像中每个像元矢量(将像元n个波段的光谱响应作为n维空间的矢量与参考光谱矢量之间的广义夹角,根据夹角的大小来确定光谱间的相似程度,以达到识别地物的目的。(2)光谱解混技术(Spectral Unmixing):就是假设某一像元的光谱是由有限几种地物的光谱曲线按某种函数关系和比例混合而成,解混的目的就是通过某种分析和计算,估计出光谱混合方式和混合像元包含的光谱成分及相应比例。(3)光谱匹配滤波技术(Matched Filter):是通过部分光谱解混技术求解端元光谱丰度值的技术。由于前面介绍的线性光谱解混技术要求端元光谱足够完全,而实际上很难确定一幅待研究的高光谱图像所包含的全部端元光谱。匹配滤波技术则选定某些感兴趣的端元光谱的情况下,把未知的光谱归为背景光谱(Unknown background),最大化地突出已知端元光谱而同时尽可能抑制背景光谱,这种方法提供了一种快速探测指定地物种类的技术,而不必知道一幅图像中包含的全部端元光谱。(4)光谱特征匹配(SFF-Spectral Feature Fitting):根据电磁波理论,不同的物质有不同的光谱曲线。人们可以通过分析不同地物的光谱吸收表现,达到识别不同地物的目的。首先把反射光谱数据的吸收特征突出出来,然后用仅保留了吸收特征的光谱与参考端元光谱逐个波段进行最小二乘匹配,并计算出相应的均方根误差(RMS-Root Mean Square),消除背景影响的方法主要是包络线法。
3.2.2基于特征空间的分类方法
前面介绍的基于光谱空间的分析方法主要是通过比较待分像元的光谱曲线与参考光谱的光谱曲线之间的相似程度来达到分类判别的目的。这种思想看起来很直观和理想,类似于人的指纹识别一样,每一个人都有不同的指纹,通过与指纹库中的指纹相比较就可以确定人的身份。然而,遥感问题却远远复杂得多,由于太阳辐射、大气、空间分辨率和光谱分辨率,观测噪声,及多种多样难以确定的因素的影响,很难测得所谓“纯”的光谱曲线。尽管有多种多样的光谱解混技术被提出,但多种因素的影响很难被充分估计出来,因而无论何种光谱分析技术都无法完全达到遥感图像辩识的要求。
另一种遥感图像地物辩识的思想则是从统计分布规律出发,在同一幅图像上,不同地物的光谱数据呈现不同的分布状态,比如不同均值和方差,通过分析这种统计分布规律而实现地物识别的技术就是基于特征空间的分类方法。遥感图像上的每个像元对应n个光谱波段反射值。假若把这几个波段值组成的n维矢量看作是n维欧几里德空间中的一个点,则称矢量X=(X1,X2,…,Xn)为像元的特征值,相应的n维欧几里德空间称为特征空间。在特征空间的意义上,遥感图像上的任一像元对应于特征空间中的一个点,因此,分类的方法可以从寻找像元在特征空间中的分布规律入手,也就是在特征空间中进行判别的问题。
常用的分析方法包括:(1)高斯最大似然分类器(MLC):是遥感分类的主要手段,其基本思想是,假设各类样本数据都是高斯分布(正态分布),判别准则为所属类别的分布密度最大。其分类器被认为是一种稳定性、鲁棒性好的分类器。但是,如果图像数据在特征空间中分布比较复杂、离散,或采集的训练样木不够充分、不具代表性,通过直接手段来估计最大似然函数的参数,就有可能造成与实际分布的较大偏差,导致分类结果精度下降。(2)基于Bayes准则的分类器: 基于Bayes准则的判别函数是统计模式识别的参数方法,要求各类的先验概率P(ωi)和条件概率密度函数P(ωi �x)已知。p(ωi)通常根据各种先验知识给出或假设它们相等: P(ωi �x)则是首先确定其分布形式,然后利用训练样本估计其参数。一般假设为正态分布,或通过数学方法化为正态分布。其判别函数为:Di(X)=P(ωi) P(ωi �x),i=1, 2,…,m。若Di(X)�Dj(X) j=1,2,…,m,j≠i,则X为ωi类。判别函数集有多种导出形式,如最大后验概率准则、最小风险判决准则、最小错误概率准则、最小最大准则、Neyman-Pearson准则等,是依据不同的规则选择似然比的门限来实现的。(3)最小距离判别法:该方法是最直观的一种判别方法,假设在p维欧氏空间中,把c个不同的类别看成分布在空间中的不同位置,最小距离判别方法的思想就是,对待分类的样本,若与某一类的空间几何距离最近,则判别为属于此类。该方法的关键问题,一是如何定义空间距离;另一问题是,如何计算点到各类别的空间距离。(4)基于模糊集理论的判别分类方法:相邻波段影像间存在较大的相似性表明,它们的分类作用可以相互近似替代。因此,只需利用其中的一幅影像参加分类即可,其它与之相似的光谱波段都可被视为冗余波段。显然,要删除这些冗余光谱波段,应首先对原始波段集合中的光谱波段进行模糊等价划分,然后在每个模糊等价波段组中只选择一个光谱波段(或进行线性融合)。(5)基于人工神经网络的分类法:通过建立统一框架,实现对影像的视觉识别和并行推理,是近年来发展起来的综合数据分类方法之一。其目标是利用人工神经网络技术的并行分布式知识处理手段,以遥感影像为处理对象,建立基于人工神经网络的遥感影像分类专家系统。(6)支持向量机(Support Vector Machine )分类方法:支持向量机是一种建立在统计学习理论基础之上的机器学习方法。其最大的特点是根据Vapnik的结构风险最小化原则,尽量提高学习机的泛化能力,即由有限的训练样本集得到小的误差能够保证对独立的测试集保持小的误差。另外,由于支持向量算法是一个凸优化问题,局部最优解也是全局最优解,这是其它学习算法所不及的。以上介绍了几种分类方法,事实上,随着各学科的发展和交叉影响,基于特征空间的分析方法有许多新的进展。
4高光谱遥感数据分类存在的问题
随着光谱分辨率的提高,高光谱遥感能够提供对地物识别更充分的信息,对基于特征空间的分类而言,理论上说,随着特征空间维数的增加,分类精度将会越来越精确,但实际问题并非如此简单。综合以上高维空间的几何特征和统计特性[31]-[36],可以得出这样的结论:基于统计理论的参数估计若在原始高维空间进行,则需相当庞大的训练样本数才能得到比较满意的估计精度,非参数估计方法所需的样本数量更是不可想象。此外,原始高维数据空间的正态分布特性更是难以保证,而正态分布是许多参数估计方法的基础。因此,高光谱遥感分类的表现并未如人们所期望的那样简单,具体来说,在不讨论客观因素的情况下,影响高光谱遥感分类精度的主要因素主要是以下几条:
(1)训练样本数量问题:根据Hughes的研究结果[37],随着特征空间维数的增加,类别可分性提高,但由于遥感中常用的监督分类方法首先要估计样本的分布函数,或分布函数中的一些参数,随着空间维数的增加,待估参数的个数急剧增加,在训练样本数量一定的条件下,导致分类精度在特征空间的维数增加到一定数量后,反而会随着维数的增加而下降。
(2)特征空间的组成:前一个问题导致基于特征空间的分析方法通常不能在原始空间中直接进行,必须对原始波段空间进行降维预处理,得到一个保持了原始空间全局和局部特征结构的低维空间,然后在低维子空间中进行分类判别。
(3)分类器的选择。
(4)类别可分性:类别可分性是数据集固有的一种性质,是由客观条件造就的数据集内在结构,由于客观因素的影响,待分辨的类别之间可区分的程度会有很大的差异,数据集的这种内在的可分离程度对分类精度的高低有着至关重要的影响。
5 结语
过去几十年高光谱遥感已经在各方面有了很大的应用,高光谱技术从遥感的角度提供了大尺度获取地面光谱数据的手段,为人们宏观分类识别地物提供了基础。但是人们在获取大量高光谱图像数据的同时,也面临着如何最大程度地利用这些海量数据的难题,关于高光谱分类与信息提取的技术,虽然取得了一些进展,但是从总体上仍落后于传感器的发展,因此对于高光谱分类与信息提取还有很大的空间值得去研究。
参考文献
[1] 童庆禧,张兵,郑兰芬.高光谱遥感的多学科应用[M].北京:电子工业出版社,2006:1-54.
[2] 许卫东.高光谱遥感分类与提取技术[J].红外(月刊),2004,28-34.
[3] 薛利红,罗卫红,曹卫星,等.作物水分和氮素光谱诊断研究进展[J].遥感学报,2003,7(1):73-80
[4] 金震宇,田庆久,惠凤鸣,等.水稻叶绿素浓度与光谱反射率关系研究[J].遥感技术与应用,2003,18(3):134-137.
[5] N.H.Younan, R.L.King, H.H.Bennett, and JR. Classification of Hyper spectral Data: A Comparative Study [J], Precision Agriculture, 2004(5):41-53.
[6] 程乾,黄敬峰,王人潮,等.MODIS植被指数与水稻叶面积指数及叶片叶绿素含量相关性研究[J].应用生态学报,2004,15(8):1363-1367.
[7] 张良培,郑兰芬,童庆禧,等.利用高光谱对生物变量进行估计[J].遥感学报,1997,1(2):111-114
[8] 赵德华,李建龙,宋子键.高光谱技术提取植被生化参数机理与方法研究进展[J].地球科学进展,2003,18(1):94-99.
[9] 方红亮,田庆久.高光谱遥感在植被监测中的研究综述[J].遥感技术与应用,1998,13(1):62-69.
[10] 陈楚群,潘志林,施平.海水光谱模拟及其在黄色物质遥感反演中的应用[J].热带海洋学报,2003,22(5):33-39.
[11] 李素菊,吴倩,王学军,等.巢湖浮游植物叶绿素含量与反射光谱特征的关系[J].湖泊科学,2002,14(3):228-234.
[12] 谭衢霖,邵芸.遥感技术在环境污染监测中的应用[J].遥感技术与应用,2000,15(4):246-251.
[13] 童庆禧,郑兰芬,王晋年.湿地植被成像光谱遥感研究[J].遥感学报,1997,1(1):50-57.
[14] 夏德深,李华.国外灾害遥感应用研究现状[J],国土资源遥感,1996,(3):1-8.
[15] 甘甫平,王润生,郭小方,等.高光谱遥感信息提取与地质应用前景――以青藏高原为试验区[J],国土资源遥感,2000,3:38-44.
[16] 王青华,王润生,郭小方.高光谱遥感技术在岩石识别中的应用[J].国土资源遥感,2000,4:39-43.
[17] 刘建贵,张兵,郑兰芬,等.城乡光谱数据在城市遥感中的应用研究[J].遥感学报,2000,4:221-228
[18] 梅安新,彭望�,秦其明,等.遥感导论[M].北京:高等教育出版社.2002.
[19] 荆凤,陈建平.矿化蚀变信息的遥感提取方法综述[J].遥感信息,2005,2:62-65.
[20] 耿修瑞,张兵,张霞,等.一种基于高维空间凸面单形体体积的高光谱图像解混算法[J].自然科学进展,2004,14(7):810-814.
[21] CARL J. LEGLEITER. Spectrally Driven Classification of High Spatial Resolution, Huperspectral Imagery: A Tool for Mapping In-Stream Habitat [J].Environmental Management, 2003, 32(3):399-411.
[22] 甘甫平,王润生,马蔼乃,等.基于光谱匹配滤波的蚀变信息提取[J]. 中国图像图形学报,2003,8(A)(2):147-150.
[23] 李新双,张良培,李平湘.基于小波分量特征值匹配的高光谱影像分类[J].武汉大学学报•信息科学版,2006,31(3):274-277.
[24] P.Goovaerts. Geostatistical incorporation of spatial coordinates into supervised classification of hyperspectral data [J].Geograph Syst, 2002, (4):99-111.
[25] 刘汉湖,杨武年,沙晋明.高光谱分辨率遥感在地质应用中的关键技术及前景[J]. 世界地质,2004,23(1):45-49.
[26] Francesco Lagona. Adjacency selection in Markov Random Fields for high spatial resolution hyperspectral data [J].Geograph Syst, 2002(4):53-68.
[27] 李石华,王金亮,毕艳.遥感图像分类方法研究综述[J]. 国土资源遥感,2005,2:1-6.
[28] 王国明,孙立新. 高光谱遥感影像优化分类波段选择[J].东北测绘,1999,22:21-23.
[29] Allan Aasbjerg Nielsen. Spectral Mixture Analysis: Linear and Semi-parametric Full and Iterated Partial Unmixing in Multi-and Hyperspectral Image Data [J]. Mathematical Imaging and Vision. 2001(15): 17-37.
[30] 修丽娜,刘湘南. 人工神经网络遥感分类方法研究现状及发展趋势探析[J].遥感技术与应用,2003,18(5):339-345.
[31] 张连蓬.基于投影寻踪和非线性主曲线的高光谱遥感图像特征提取及分类研究[D].山东:山东科技大学,2003.
[32] Shailesh Kumar, Joydeep Ghosh and Melba M. Crawford.Hierarchical Fusion of Multiple Classifiers for Hyperspectral Data Analysis [J]. Pattern Analysis & Application, 2002 (5): 210-220
[33] 谭璐,易东云,冯国柱,等.局部不变投影[J].自然科学进展,2004,14(3):282-287.
[34] 李智勇,郁文贤,匡纲要,等.基于高维几何特性的高光谱异常检测算法研究[J].遥感技术与应用,2003,18(6):379-383.
[35] 周晓云,孙志挥,张柏礼. 一种大规模高维数据集的高效聚类算法[J].应用科学学报.2006, 24(4):396-400.
[36] 易尧华. 基于投影寻踪的多(高)光谱影像分析方法研究[D].武汉:武汉大学,2004.
[37] Hughes G F.On the mean accuracy of statistical pattern recognizers [J].IEEE Trans.Info.Theory,1968,14(1):55~63.
[38] Friedman J H,Tukey J W.A projection pursuit algorithm for exploratory data analysis[J].IEEE Trans.Comput.,1974,23 (1):881~889.
