具有感兴趣区域的静止图像压缩编码算法研究
发布时间:2008/6/5 0:00:00 访问次数:403
摘要:在研究人眼视觉掩盖效应的基础上,采用了一种感兴趣区域的嵌入式零树小波编码算法(ezw_roi算法),对感兴趣的区域和不感兴趣区域分别进行编码,充分利用了信道资源和存储空间,提高感兴趣区域的图像质量,使重建图像视觉效果更好。
关键词:图像压缩 小波变换 视觉掩盖效应 ezw_roi算法
被誉为数学显微镜的小波变换是从傅里叶变换和加窗傅里叶变换发展而来的。小波变换引入伸缩和平移两个参数,实现了时域-频域局域化分析,从而可以对图像的任何局部区域进行多分辨率分析。由于小波变换后图像具有高频的方向选择性,与人眼的视觉特性相吻合,人眼最重要的视觉特性是视觉掩盖效应,即不变和有规则变化的区域很容易被遗忘,而对突变和极不规则变化的区域感兴趣。采用嵌入式零树小波编码及算法,通过对感兴趣的区域和不感兴趣区域分别进行编码,可以达到充分利用信道资源和存储空间、提高感兴趣区域的图像质量的目的。
1 视觉掩盖效应
在大多数应用场合,最终的图像总是由人眼来观测的,但是人类的视觉系统并不完美。通过对人眼视觉现象的观察与研究发现,视觉掩盖效应可以用于改善图像信息的处理。
视觉选择性与客体的特性有关,人眼对空间频率接近于零的平滑区域和空间频率相似纹理区域有很大的钝性,所以不变与规则变化的场景很容易在人的意识中被遗忘,人类视觉通常只对突变和极不规则变化的区域感兴趣。这种与生俱来的选择性使视觉只限定在有限的目标上。
1.1 静态对比灵敏度
人眼主观上可辨别的最小亮度差别所需要的最小光强差值称为亮度的辨别阀值。也就是说,当刺激光强i增大时,最初感觉不出,直到i变化到i+δi时人眼就感觉到亮度有变化了。人眼对亮度光强变化的响应是非线性的,比值δi/i称为对比灵敏度。在相当宽的光强范围内,δi/i保持常数为0.02,但在i很低或很高时不是常数。如果有背景,则对比灵敏度不仅与目标物的光强度i有关,而且与背景亮度i。有关。图1给出了有背景和无背景时人眼的静态对比灵敏度曲线。
此外,人眼的对比灵敏度还与刺激的空间变化周期(空间变化周期是指刺激的明暗不变,只改变明暗的空间间隔)有关。如果亮度固定在一定水平下,则对比灵敏度与光刺激的空间变化周期之间的关系如图2所示。这一关系通常被称为人眼的调制传递函数。图2中还给出了等亮度的色差信号y-r和y-b的对比灵敏度曲线。由图1和图2可得到以下结论:
(1)恢复图像的误差如果低于对比灵敏度,则不会被人眼觉察。
(2)高频部分在相同的灵敏度阈值下,色差信号y-r的空间频率只有亮度y的一半,y-b则为y的1/4,通常表示色差信号所需的像素比亮度要少得多。
(3)在相同的灵敏度阈值下,斜向栅格的空间频率只有正常栅格的0.7,因此按斜向栅格对图像数据采样所需的频率较低。
(4)高频端的灵敏度要小于低频端,因此对这些部分的量化误差可大一些。
1.2 具有感兴趣区域的人眼视觉特性
人们在观察和理解图像时常常不自觉地对其中某些区域产生兴趣,把这些区域称为视觉感兴趣区域。整幅图像的主观视觉质量取决于感兴趣区域的视觉质量,而不感兴趣区域的降质常常不易被人觉察,对整幅图像视觉质量的影响较小。例如对一副人像照片,反映一个人主要特征的是面部信息,在进行图像压缩时,人的面部信息与其它不重要的信息不必采用相同的压缩比。显然,感兴趣区域的视觉特性也是一种视觉掩盖效应。
2 嵌入式零树小波编码及算法
2.1 ezw编码
一幅图像经过三级小波分解后形成十个子带,如图3所示。小波系数的分布特点是越往低频子带,系数值越大,包含的图像信息越多。如图3中的ll3子带,越是高频子带,系数值越小,包含的图像信息越小。在系数数值相同时,低频子带反映图像的低频信息,对视觉比
摘要:在研究人眼视觉掩盖效应的基础上,采用了一种感兴趣区域的嵌入式零树小波编码算法(ezw_roi算法),对感兴趣的区域和不感兴趣区域分别进行编码,充分利用了信道资源和存储空间,提高感兴趣区域的图像质量,使重建图像视觉效果更好。
关键词:图像压缩 小波变换 视觉掩盖效应 ezw_roi算法
被誉为数学显微镜的小波变换是从傅里叶变换和加窗傅里叶变换发展而来的。小波变换引入伸缩和平移两个参数,实现了时域-频域局域化分析,从而可以对图像的任何局部区域进行多分辨率分析。由于小波变换后图像具有高频的方向选择性,与人眼的视觉特性相吻合,人眼最重要的视觉特性是视觉掩盖效应,即不变和有规则变化的区域很容易被遗忘,而对突变和极不规则变化的区域感兴趣。采用嵌入式零树小波编码及算法,通过对感兴趣的区域和不感兴趣区域分别进行编码,可以达到充分利用信道资源和存储空间、提高感兴趣区域的图像质量的目的。
1 视觉掩盖效应
在大多数应用场合,最终的图像总是由人眼来观测的,但是人类的视觉系统并不完美。通过对人眼视觉现象的观察与研究发现,视觉掩盖效应可以用于改善图像信息的处理。
视觉选择性与客体的特性有关,人眼对空间频率接近于零的平滑区域和空间频率相似纹理区域有很大的钝性,所以不变与规则变化的场景很容易在人的意识中被遗忘,人类视觉通常只对突变和极不规则变化的区域感兴趣。这种与生俱来的选择性使视觉只限定在有限的目标上。
1.1 静态对比灵敏度
人眼主观上可辨别的最小亮度差别所需要的最小光强差值称为亮度的辨别阀值。也就是说,当刺激光强i增大时,最初感觉不出,直到i变化到i+δi时人眼就感觉到亮度有变化了。人眼对亮度光强变化的响应是非线性的,比值δi/i称为对比灵敏度。在相当宽的光强范围内,δi/i保持常数为0.02,但在i很低或很高时不是常数。如果有背景,则对比灵敏度不仅与目标物的光强度i有关,而且与背景亮度i。有关。图1给出了有背景和无背景时人眼的静态对比灵敏度曲线。
此外,人眼的对比灵敏度还与刺激的空间变化周期(空间变化周期是指刺激的明暗不变,只改变明暗的空间间隔)有关。如果亮度固定在一定水平下,则对比灵敏度与光刺激的空间变化周期之间的关系如图2所示。这一关系通常被称为人眼的调制传递函数。图2中还给出了等亮度的色差信号y-r和y-b的对比灵敏度曲线。由图1和图2可得到以下结论:
(1)恢复图像的误差如果低于对比灵敏度,则不会被人眼觉察。
(2)高频部分在相同的灵敏度阈值下,色差信号y-r的空间频率只有亮度y的一半,y-b则为y的1/4,通常表示色差信号所需的像素比亮度要少得多。
(3)在相同的灵敏度阈值下,斜向栅格的空间频率只有正常栅格的0.7,因此按斜向栅格对图像数据采样所需的频率较低。
(4)高频端的灵敏度要小于低频端,因此对这些部分的量化误差可大一些。
1.2 具有感兴趣区域的人眼视觉特性
人们在观察和理解图像时常常不自觉地对其中某些区域产生兴趣,把这些区域称为视觉感兴趣区域。整幅图像的主观视觉质量取决于感兴趣区域的视觉质量,而不感兴趣区域的降质常常不易被人觉察,对整幅图像视觉质量的影响较小。例如对一副人像照片,反映一个人主要特征的是面部信息,在进行图像压缩时,人的面部信息与其它不重要的信息不必采用相同的压缩比。显然,感兴趣区域的视觉特性也是一种视觉掩盖效应。
2 嵌入式零树小波编码及算法
2.1 ezw编码
一幅图像经过三级小波分解后形成十个子带,如图3所示。小波系数的分布特点是越往低频子带,系数值越大,包含的图像信息越多。如图3中的ll3子带,越是高频子带,系数值越小,包含的图像信息越小。在系数数值相同时,低频子带反映图像的低频信息,对视觉比