一、遥感图象数据压缩分析
近年来,随着新型传感技术的发展,遥感影像的时间、空间和光谱分辨率不断提高,随着航天遥感技术的迅速发展,相应的数据规模呈几何级数增长。遥感数据量日益庞大,有限的信道容量与传输大量遥感数据的需求之间的矛盾日益突出给数据的传输和存储带来了极大的困难。数据压缩技术作为解决这一问题的有效途径,在遥感领域越来越受到重视,尤其对于遥感图象数据来说。一般说来,图象分辨率越高,相邻采样点的相关性越高,数据水分也越大。对遥感数据进行压缩,有利于节省通信信道,提高信息的传输速率;数据压缩之后有利于实现保密通讯,提高系统的整体可靠性。
一般地,图像压缩技术可分为两大类:无损压缩技术和有损(率失真)压缩技术。无损压缩利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2:1到5:1。这类方法广泛用于文本数据、程序和特殊应用场合的图像数据(如指纹图像、医学图像等)的压缩。由于压缩比的限制,仅使用无损压缩方法不可能解决图像和数字视频的存储和传输问题。有损压缩方法利用了人类视觉对图像中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。在多媒体应用中常用的压缩方法有;PCM(脉冲编码调制)、预测编码、变换编码(主成分变换或K-L变换、离散余弦变换MT等)、插值和外推法(空域亚采样、时域亚采样、自适应)、统计编码(Huffman编码、算术编码、Shannon-Fano编码、行程编码等)、矢量量化和子带编码等;混合编码是近年来广泛采用的方法。新一代的数据压缩方法,如基于模型的压缩方法、分形压缩和小波变换方法等也己经接近实用化水平。
在遥感信息处理领域,根据信息处理的阶段性,遥感图像压缩又可分为星上无损压缩、星上有损压缩和地面遥感数据压缩。为了最大限度地保持遥感传感器所获取的目标信息,星上压缩一般采用无损压缩方法。但当信息量大到无损压缩难以满足要求时,也考虑失真量较小的有损压缩,即高保真压缩方法。同时,为了适应遥感数据采样率较高的特点,星上压缩的实时性要求较高,因而要求压缩方法计算简单,硬件复杂度低。
二.目前数据压缩方法标准概述
经常使用的无损压缩方法有Shannon-Fano编码法、Huffman编码法、游程(Run-length)编码法、LZW编码法(Lempel-Ziv-Welch)和算术编码法等。
数据压缩研究中应注意的问题是,首先,编码方法必须能用计算机或VLSI硬件电路高速实现;其次,要符合当前的国际标准。
下面介绍三种流行的数据压缩国际标准。
1、JPEG-静止图像压缩标准
这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM(差分脉冲编码调制、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个部分。前者不会产生失真,但压缩此很小;后一种算法进行图像压缩是信息虽有损失但压缩比可以很大。 JPEG标准实际上有三个范畴:
1)基本顺序过程Baseline Sequential processes) 实现有损图像压缩,重建图像质量达到人眼难以观察出来的要求。采用的是8x8像素自适应DCT算法、量化及Huffman型的墒编码器。[nextpage]
2)基于DCT的扩展过程(Extended DCT Based Process) 使用累进工作方式,采用自适应算术编码过程。
3)无失真过程(Losslesss Process)采用预测编码及Huffman编码(或算术编码),可保证重建图像数据与原始图像数据完全相同。
其中JPEG有以下五种方法:
(l)JPEG算法
基本JPEG算法操作可分成以下三个步骤:通过离散余弦变换(DCT)去除数据冗余;使用量化表对以DCT系数进行量化,量化表是根据人类视觉系统和压缩图像类型的特点进行优化的量化系数矩阵;对量化后的DCT系数进行编码使其熵达到最小,熵编码采用Huffman可变字长编码。(2)离散余弦变换(3)量化(4)游程编码(5)熵编码
2、MPEG-运动图像压缩编码
MPEG(Moving Pictures Experts Group)标准分成两个阶段:第一个阶段(MPEG-I)是针对传输速率为 lMb/s到l.5Mb/s的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒30帧的720x572分辨率的视频信号进行压缩;在扩展模式下,MPEG-2可以对分辨率达1440Xl152高清晰度电视(HDTV)的信号进行压缩。但是MPEG压缩算法复杂、计算量大,其实现一般要专门的硬件支持。MPEG视频压缩算法中包含两种基本技术:一种是基于l6x16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT的压缩,用于减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。
3、 H.261-视频通信编码标准
电视电话/会议电视的建议标准H.261常称为Px64K标准,其中P是取值为 1到30的可变参数;P=l或2时支持四分之一中间格式(QCIF:Quarter Cmmon Intermedia Format)的帧率较低的视频电话传输;P>=6时支持通用中间格式(CIF:Common Intermediate Format)的帧率较高的电视会议数据传输。Px64K视频压缩算法也是一种混合编码方案.
三.遥感影像数据压缩的有效方法――小波压缩
1 针对高分辨率遥感影像,采用先进的图象压缩技术,实现对遥感影像的高保真快速压缩,以解决大规模影像的传输和存储问题。近年来,随着新型传感技术的发展,遥感影像的时间、空间和光谱分辨率不断提高,相应的数据规模呈几何级数增长,给数据的传输和存储带来了极大的困难。一般说来,图象分辨率越高,相邻采样点的相关性越高,数据水分也越大。对遥感数据进行压缩,有利于节省通信信道,提高信息的传输速率;数据压缩之后有利于实现保密通讯,提高系统的整体可靠性随着INTERNET连到千家万户,遥感图象正在逐渐成为信息传递的重要媒介。目前大多使用小波压缩处理遥感图像数据。
2 小波分析基本理论及其在图像压缩中的应用
与傅里叶变换相似,小波变换是一种同时具有时—频二维分辨率的变换。其优于傅氏变换之处在于它具有时域和频域“变焦距”特性,十分有利于信号的精细分析。第一个正交小波基是Harr于1910年构造的;但Harr小波基是不连续的。到80年代,Meyer, Daubechies等人从尺度函数的角度出发构造出了连续正交小波基。1989年,Mallat等人在前人大量工作的基础上提出多尺度分析的概念和基于多尺度分析的小波基构造方法,将小波正交基的构造纳入统一的框架之中,使小波分析成为一种实用的信号分析工具。
该方法先对遥感图像进行小波分解,然后以纹理复杂程度作为区域重要性度量,通过对纹理复杂的重要区域进行标量编码来保证恢复图像的质量,通过对平坦区(即不重要区)进行矢量编码来提高压缩比。实验结果表明该方法具有压缩率较高,图像恢复质量好,速度快等优点,十分适合遥感数据的高保真压缩。[nextpage]
小波变换在压缩中提供了如下优点:(1) 多尺度分解提供了不同尺度下图像的信息,并且变换后的能量大部分集中在低频部分,方便了我们对不同尺度下的小波系数分别设计量化编码方案,在提高图像压缩比的情况下保持好的视觉效果和较高的PSNR。(2) 小波分解和重构算法是循环使用的,易于硬件实现.nextpage]
JPEG的8×8分块压缩方法压缩纹理复杂的块时恢复误差较大,具有比较明显的方块效应,而基于小波变换的图像压缩方法较好地克服了方块效应的影响。通过对不同区域采用不同编码方法,可以较好地保持原图的纹理信息,并达到较高的压缩比.
3 自适应标量、矢量混合量化编码方案
基于小波分解的图像压缩方法的一个重要因素是量化方案的选择。一般说来,量化方法分为标量量化和矢量量化两种。近年来,人们开始研究将标量、矢量量化相结合的方法,以同时获取较高的压缩比、恢复质量和时间性能,这是图像压缩技术的一个重要发展方向。
标量量化的关键是去相关和编码。目前主要的去相关技术是预测方法,如DPCM预测;而编码仍以熵编码为主。标量量化的特点是可保持较高的图像恢复质量,但压缩率一般较低。目前最有效的基于小波分解的矢量量化方法有法国M. Barlaud等人提出的PLVQ塔式格型矢量量化方法和美国J. M. Shapiro提出的EZW方法。这两种方法编码效率较高,但计算非常复杂,不能适用于实时性要求较高的场合。
本文提出的编码方案对图像小波细节子图划分为4×4的块,采用块内的方差作为块的纹理复杂度和重要性度量,对纹理复杂的重要块用较多的位进行编码,而对于较平坦的区域用较少的位进行编码。这实际上相当于将各块的元素组成一个矢量,对不重要的子块采用矢量编码方案,而对重要子块采用标量编码,使得各子块的恢复误差大致平衡。
本压缩方法的具体步骤如下。
(1) 对图像进行3层小波分解,对LL3子图进行熵编码,对HH1不编码(解码时以0填充)。
(2) 把小波分解图的其它各细节子图按4×4块划分,设定阈值0<T0<T1<T2。将方差小于T0的块划分为平坦区;方差大于T0小于T1的块划分为次平坦区;方差大于T1小于T2的块划分为次纹理区;方差大于T2的块划分为纹理区。
(3) 按各块在图中的位置进行块的类别编码。由于块的类别数为4,采用两位编码。对不同类别的块采用下述编码方案:
● 对于平坦区,假设其均值为0,可认为块中所有元素均为0;
● 对于次平坦区,用1位表示整个块的均值,对于块中每个元素再各用1位进行编码,即块中大于均值的元素对应码号为1,否则对应码号为0;
● 对于次纹理区,用2位表示整个块的均值,对于块中每个元素再各用2位进行编码,把块中各元素值对应到0—3这4个码号上去;
● 对于纹理区,用6位表示整个块的均值,用6位表示块内方差,对块中每个元素再各用5位进行编码,把块中各元素值对应到0—31这32个码号上去。
(4) 对上述结果进行算术编码。
上述算法对于原图4×4块的128位数据,平坦区只用2位编码,次平坦区用19位编码,次纹理区用36位编码,纹理区用2+16×5+6+6=94位编码。
四. 算法关键问题
4.1 小波基的选取
多尺度分析中小波基的选择注意5个方面的因素。我们选择了4组小波基对应的二次镜面滤波器(QMF)研究它们的性质: (1) Battle和Lemarie的27-系数滤波器(简称B-L小波);(2) I. Daubechies的4-系数滤波器(简称D-4小波);(3) I. Daubechies的20-系数滤波器(简称D-20小波);(4) Antonini的一组双正交小波基对应的滤波器。
(1) 正交性。用正交小波基由多尺度分解得到的各子带数据分别落在相互正交的L2(R2)的子空间中,使各子带数据相关性减小。但能准确重建的、正交的、线性相位、有限冲击响应滤波器组是不存在的,此时一般放宽正交性条件为双正交。[nextpage]
(2) 支撑集。为了得到有限长度的滤波器组h(n),g(n);避免滤波过程中的截断误差,要求小波基是紧支集的。
(3) 对称性。对称滤波器组具有两个优点:(1)人类的视觉系统对边缘附近对称的量化误差较非对称误差更不敏感;(2)对称滤波器组具有线性相位特性,对图像边缘作对称边界扩展时,重构图像边缘部分失真较小,有利于复杂特性的分析(如序列目标检测和分类)[9]。
(4) 规则性(Regularity)。
(5) 消失矩阶数。
可见,本系统采用的双正交小波基具有良好的性能。
4.2 阈值的选取
本方法的一个关键因素是3个阈值T0,T1和T2的选取。直观地说,3个阈值越大,压缩比越高,而图像恢复质量越差。另外,根据人类的视觉生理、心理特点以及实验结果,不同级别的小波分解系数所含的能量是不同的,因而在图像重构时其重要性也有差异,应区别对待。级别越高,小波系数所含能量越大,量化应越精细。在矢量编码方案中,一般采取级别高的小波子图矢量维数低就是这个道理。通过对不同级别的子图采用不同的阈值可以实现对不同级别子图的区别对待,即级别越高,阈值越小。
进一步,上述3个阈值的选取有两条途径: 一是由用户根据需要交互地给出,而由系统给出一个较优的缺省值。通过对图遥感图像进行实验可以获得各阈值与压缩系统性能指标PSNR和CR(峰值信噪比和压缩比)的关系。
另一种方法是通过对小波分解子图进行统计分析后自适应获得,由前面的讨论我们认为这是不必要的,理由有二: (1) 不同阈值的选取以及同一设定对不同图像造成的压缩性能影响不太大;(2) 自适应选取方法时间性能大大降低,不适合于实时性要求较高的场合。
4.3 算法的实时性问题
目前小波分解已经有快速算法,并可用硬件实现,使研制基于小波分解的实时图像压缩技术成为可能,这对于星上数据压缩具有十分重要的意义。为了提高编码过程的速度,我们没有采用一般用于度量数据能量的方差指标,而代之以4×4子块的块内数据变化范围(即最大最小值之差),从而减少了一次对块中所有元素的扫描,且避免了求方差时的乘法运算,只需作16次浮点数比较(即减法)操作,缩短了编码时间,而图像恢复质量基本没有下降。
另外,对于多波段遥感数据,我们先对它们进行K-L变换,然后对各K-L变换子图使用上述方法进行压缩,效果良好。
4.4 实验结果分析
以上方法在保持较高的保真度情况下压缩比远高于无损压缩,而压缩比和PSNR值均优于JPEG方法。显然,在性能基本不变的情况下,使用变化范围的方法速度要快约40%。该方法在多波段遥感数据的高保真压缩方面也具有良好的效果。
五.图象压缩方法比较:
与现有的彩色序列图象压缩与解压算法相比,我们的算法有了很大的改进。根据遥感图像局部相关性较弱、纹理复杂丰富的特点,提出了基于小波分析理论的自适应标量、矢量混合量化压缩方法。该方法根据遥感图像小波变换后高频子图的局部块纹理强弱将这些块划分为4类,对平坦块进行高倍压缩,对纹理块进行高保真压缩,使各块的恢复误差大致平衡。其主要特点是避免了矢量编码过程中的码书训练和码书搜索,因而时间性能好,并且对单幅图像的压缩比和峰值信噪比(PSNR)优于JPEG方法。此方法与K-L变换去波段相关技术相结合,应用于多波段遥感图像压缩领域,收到了良好的效果。