山百洋 发表于 2005-1-26 00:05:01

安全技术中图像质量的主客观评估[转帖]

本文讨论图像压缩算法对安全图像数据的影响。文中比较了客观标准、主观标准和可辩认性等三种有本质不同的评估技术。我们选择了两幅初始质量不同的典型安全图像数椐(一块车牌和一张人脸),采用包括两种专业技术(JPEG和LuRaWave-LWF)和一种应用技术(Karhunen-Loeve变换-KLT)在内的三种不同的压缩技术,从原始图像中依照不同的压缩率得到一系列压缩图像。最后,评估和比较了作为客观标准的MSE(均方差)、依照ITU-R Rec.500的主观图像质量和图像的可辨认性。目前,图像的传递和存储应用了许多不同的图像压缩技术。这些压缩技术对图像的感知及其最终判读有重要影响。这些影响在诸如数字电视等相对宽带的系统中还不是太重要,但在窄带系统中就变得极其重要了。不同压缩算法带来的伪影和失真有着不同的来源和影响。本文力图展示一些典型情况,并表明它们对安全领域的意义。 图像质量对目标(人,车等)的识别和分类、平时和紧急情况下运动和动作分析等有着根本性的重要意义。通常我们可以定义一些与图像感知有关的参数,包括细节分辨率(图像锐度),灰度分辨率(层次),颜色分辨率相运动分辨率等。当存在压缩引起的失真或伪影时,所有这些参数都将有所变化。 ■有损图像编码标准 在两个基本场合中需要使用高效和粗略的图像压缩:存储空间有限的海量图像数据库,以及通过极窄的通信信道传输图像。尽管有各种不的元损图像压缩技术(特别是计算机 图像格式),但是由于一幅特定图像(源熵有限)的统计特性,采用它们只能获得一定程度的压缩&quot为了得到更高的压缩率,我们只能引人一些有损压缩格式,从而在重建后带来附加失真(如弱化,误差等等)。最常用的图像质量评测方法是计算MSE、SNR等一些客观参数。这些参数易于计算,但它们与图像的主观印象(感知)之间相关程度有限,对图像中的目标进行分辨或分类亦无太多帮助。此外,主观图像质量评测正被广泛研究,并有许多参考文献。下面我们将讨论静态黑白图像和极限压缩率。 目前有损图像压缩大致采用两种主要技术。第一种采用离散余弦变换(DCT)后加量化表以减少数据量。这是JPEG标准的一部分。另一种技术是小波变换WT(例如应用于FBI的指纹数据库中)。WT是LuRaWave或JPEG2000格式的一部分。在我们采用的IRFAN软件包中,JPEG和LiiRaWave两种格式均被使用。第三种方法Karhunen-Loeve扩展是基于图像数据的统计特性。我们将图像矩阵以分布R分割为一系列M子矩阵(向量空间的元素)。让每个子矩阵均为NxN空间随机处理的一个实现。我们可以写出这些实现的相关函数: 从均方根的角度看,空间的最优可从本征向量中构建: 其中扒是些方差矩阵的特征值。 ■以图像压缩标准作为图像处理系统 显然我们能将压缩算法看作任意一个图像处理系统。在标准的图像专题讲座技术论坛 处理中我们以点分布函数PSF或调制传输函数MTF描述一个系统。我们可将一个图像处理系统对点光源(二维Dirac冲击)的响应定义为冲击 响应,或称之为点分布函数(PSF)。PSF常用于表征诸如光的模糊化等特性。图像化后的目标与原始目标间的关系可由原始目标与PSF的卷积来确定。 在频域,基于Fourier变换,卷积运算变为乘法运算。 PSF的Fniirier变换即为光学传递函数(OTF)。 OTF通常为复数,因此它有一个模(绝对值)和幅角。OTF的模称为调制传输函数MTF,或在与对比度有关时称为对比度传输函数CTF。幅角称为相位传输函数,与频移有关。这里有一个重要的假定,即图像处理系统是线性的,任意输人和输出均可表示为不同空间频率的一系列谐波。 我们还可以定义所谓的&quot对比度&quotC,用以描述空间频率域中的MTF的对比度传输效率,其中B为亮度。图像处理系统的所有部分,包括大气,物镜,图像传感器,图像显示器乃至观察者的眼睛均可用MTF来描述。基于上述各公式的全系统MTF是所有各部分MTF的乘积。为便于仿真,图像压缩标准(压缩编码一译码器,CODEC)通常被当作能提供输出图像的&quot黑匣子&quot。作为示例,我们选取了最重要压缩标准之一的JPEG。根据上文提及的理论,我们可将&quot黑匣子&quot(JPEG压缩CODEC)当作一个有PSF和MTF的图像处理系统。我们使用这些参数是由于它们与图像质量的主客观评估有重要关系。 ■主客观图像质量间的关系——视觉模型 图像的主观质量可使用人视觉模型来更深入地解释。几乎所有已公开的模型均有一个通用结构,它包含人视觉系统的光学特性,视网膜取样和一些主要的视觉脑皮质功能,包括在空间频率上的若干个区间内以及对若干个边缘方位进行图像处理的多径算法等。这些模型的参数来源于多个心理生理学实验。这样一个模型处理两幅输人图像: 一幅原始末失真图像,另一幅被测图像。该模型的输出通常被称为&quot差别恰可察觉&quot(JND)映射。JND映射的每 个点表明原始图像和被测图像的每个对应点是否有差别,以及该差别的大小。 在考虑其他心理生理现象后,该模型预测的精度可进一步提高。模型的一个突出进展是使用自动&quot兴趣区域&quot探测算法。对于一幅给定的图像而言
页: [1]
查看完整版本: 安全技术中图像质量的主客观评估[转帖]