位置:51电子网 » 技术资料 » 其它综合

H.264中多参考帧预测技术的优化

发布时间:2008/6/5 0:00:00 访问次数:376

摘要:提出了一个低复杂度的快速多参考帧选择算法。模拟结果表明本算法在保持率失真性能的前提下可以大大减少多参考帧预测的计算复杂度。

关键词:h.264运动估计 多参考帧预测 运动搜索

运动估计是去除视频序列相邻帧之间冗余信息的有效方法,对整个视频编码效果有重要的影响。由两大国际标准化组织(iso/iec的mpeg和itu-t的vceg)共同制定的最新的国际视频编码标准h.264/avc仍然采用成熟的基于块的混合编码框架,但由于引入了很多新的编码技术,如多参考帧预测运动估计,从而可以提供更高的编码效率。

以前的视频编码标准如mpeg-4和h.263等都只支持一个参考帧预测。h.264不同于以前的标准,采用了多参考帧预测技术,使得运动搜索范围从原来的一个参考帧扩展为多个解码后的参考帧,这样通常能找到更精确的匹配,从而有助于获得更高的编码效率。但是多参考帧预测技术同时也存在一些缺点,对存储空间和计算能力要求更高。

h.264中引入的拉格朗日率失真最优策略采用穷尽搜索在所有候选参考帧中选择率失真成本最低的参考帧。拉格朗日率失真最优模式选择问题可表述为:

其中m=(mx,my)t表示某个运动矢量,ref表示某个参考帧,jmotion(s,c,m,ref\f1λmotion)表示在运动矢量m和参考帧ref下的率失真成本,s为原始的视频信号,c(m,ref)为在运动矢量m和参考帧ref下的重构视频信号,λmotion为拉格朗日乘子,r(m-p)表示编码运动矢量m的比特数,r(ref)表示编码参考帧ref的比特数,sad(s,c,m,ref)(sum absolute difference)为原始信号和重构信号之间的绝对差和,采用(2)式计算:

其中b1,b2表示块的水平和垂直像表数,可以取值16,8或4。

设m表示运动矢量搜索范围,若只允许一个参考帧进行预测,那么每个宏块需要搜索(2×m+1)2个候选点;若允许n个参考帧进行预测,那么每个宏块总共有n×2×m+1)2个候选搜索点。这意味着,运动搜索的计算量、编码时间随着预测中总参考帧数成倍增长。允许的参考帧数越多,运动搜索的计算量、编码时间就越大。

为了减少上述多参考帧预测技术中存在的问题,本文利用相邻帧间很高的相关性提出了一种低复杂度的快速多参考帧选择算法。

1 快速多参考帧预测算法

在h.264运动估计中,多参考帧运动搜索过程在7种不同的块大小和形状条件下进行,执照从16×16到4×4的顺序依次进行。对于每一个块编码大小,需要在所有可能的参考帧中找出率失真成本最低的参考帧和其相应的运动矢量。多参考帧运动搜索过程首先从概率较高的参考帧ref(0)开始,一直进行到距离当前编码帧最远的参考帧ref(n-1).

由于视频序列相邻帧间存在很强的时域相关性,一般情况下,最优的匹配通常位于与当前编码帧紧密相邻的参考帧,本文采用ref(0)表示这一参考帧;其余的参考帧(在本文中表示为ref(i),i=1,2,…,n-1,设允许的最大参考帧数为n)被选中的概率远远小于第一个参考帧ref(0)。

为了进一步了解不同参考帧在实际视频序列中被采纳的情况,本文选择了几个典型的视频测试序列,并利用拉格朗日率失真最优搜索策略,在不同参考帧数条件下统计不同参考帧的被选中概率,实验数据如表1所示。从表1可以看出,在所有参考帧,ref(0)成为最优参考帧的概率最高,概率高达88.67%,而其余所有参考帧被选中的概率远远小于ref(0)。

表1 参考帧概率统计结果

测试序列总参考帧数ref(0)概率ref(i)概率,(i=1,...,n)
foreman_qcif.yuv587.20

摘要:提出了一个低复杂度的快速多参考帧选择算法。模拟结果表明本算法在保持率失真性能的前提下可以大大减少多参考帧预测的计算复杂度。

关键词:h.264运动估计 多参考帧预测 运动搜索

运动估计是去除视频序列相邻帧之间冗余信息的有效方法,对整个视频编码效果有重要的影响。由两大国际标准化组织(iso/iec的mpeg和itu-t的vceg)共同制定的最新的国际视频编码标准h.264/avc仍然采用成熟的基于块的混合编码框架,但由于引入了很多新的编码技术,如多参考帧预测运动估计,从而可以提供更高的编码效率。

以前的视频编码标准如mpeg-4和h.263等都只支持一个参考帧预测。h.264不同于以前的标准,采用了多参考帧预测技术,使得运动搜索范围从原来的一个参考帧扩展为多个解码后的参考帧,这样通常能找到更精确的匹配,从而有助于获得更高的编码效率。但是多参考帧预测技术同时也存在一些缺点,对存储空间和计算能力要求更高。

h.264中引入的拉格朗日率失真最优策略采用穷尽搜索在所有候选参考帧中选择率失真成本最低的参考帧。拉格朗日率失真最优模式选择问题可表述为:

其中m=(mx,my)t表示某个运动矢量,ref表示某个参考帧,jmotion(s,c,m,ref\f1λmotion)表示在运动矢量m和参考帧ref下的率失真成本,s为原始的视频信号,c(m,ref)为在运动矢量m和参考帧ref下的重构视频信号,λmotion为拉格朗日乘子,r(m-p)表示编码运动矢量m的比特数,r(ref)表示编码参考帧ref的比特数,sad(s,c,m,ref)(sum absolute difference)为原始信号和重构信号之间的绝对差和,采用(2)式计算:

其中b1,b2表示块的水平和垂直像表数,可以取值16,8或4。

设m表示运动矢量搜索范围,若只允许一个参考帧进行预测,那么每个宏块需要搜索(2×m+1)2个候选点;若允许n个参考帧进行预测,那么每个宏块总共有n×2×m+1)2个候选搜索点。这意味着,运动搜索的计算量、编码时间随着预测中总参考帧数成倍增长。允许的参考帧数越多,运动搜索的计算量、编码时间就越大。

为了减少上述多参考帧预测技术中存在的问题,本文利用相邻帧间很高的相关性提出了一种低复杂度的快速多参考帧选择算法。

1 快速多参考帧预测算法

在h.264运动估计中,多参考帧运动搜索过程在7种不同的块大小和形状条件下进行,执照从16×16到4×4的顺序依次进行。对于每一个块编码大小,需要在所有可能的参考帧中找出率失真成本最低的参考帧和其相应的运动矢量。多参考帧运动搜索过程首先从概率较高的参考帧ref(0)开始,一直进行到距离当前编码帧最远的参考帧ref(n-1).

由于视频序列相邻帧间存在很强的时域相关性,一般情况下,最优的匹配通常位于与当前编码帧紧密相邻的参考帧,本文采用ref(0)表示这一参考帧;其余的参考帧(在本文中表示为ref(i),i=1,2,…,n-1,设允许的最大参考帧数为n)被选中的概率远远小于第一个参考帧ref(0)。

为了进一步了解不同参考帧在实际视频序列中被采纳的情况,本文选择了几个典型的视频测试序列,并利用拉格朗日率失真最优搜索策略,在不同参考帧数条件下统计不同参考帧的被选中概率,实验数据如表1所示。从表1可以看出,在所有参考帧,ref(0)成为最优参考帧的概率最高,概率高达88.67%,而其余所有参考帧被选中的概率远远小于ref(0)。

表1 参考帧概率统计结果

测试序列总参考帧数ref(0)概率ref(i)概率,(i=1,...,n)
foreman_qcif.yuv587.20
相关IC型号
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!