当前位置：文档之家› cabac原理及其实现笔记

cabac原理及其实现笔记

Context-Based Adａptive Binary Arithｍetic Cｏdiｎg iｎthe H．２64/ＡVC简称Cabａｃ,Ｈ２6４中的一种熵编码方式:基于上下文的自适应二进制算术编码内容安排:1,介绍算术编码2,介绍二进制算术编码3介绍Cabａｃ及其一些实用的实现方式（参考JSVM代码，也可以参考JM) ---张新发一，算术编码算术编码是一种常用的变字长编码，它是利用信源概率分布特性、能够趋近熵极限的编码方法。

它与Huffｍan 一样，也是对出现概率大的符号赋予短码,对概率小的符号赋予长码。

但它的编码过程与Huffmａn 编码却不相同,而且在信源概率分布比较均匀的情况下其编码效率高于Huffman 编码。

它和Ｈｕffman 编码最大的区别在于它不是使用整数码。

Ｈｕfｆman 码是用整数长度的码字来编码的最佳方法,而算法编码是一种并不局限于整数长度码字的最佳编码方法。

算术编码是把各符号出现的概率表示在单位概率[０，1]区间之中,区间的宽度代表概率值的大小。

符号出现的概率越大对应于区间愈宽,可用较短码字表示;符号出现概率越小对应于区间愈窄,需要较长码字表示。

举例如下:S S S S为例以符号3324在算术编码中通常采用二进制分数表示概率,每个符号所对应的概率区间都是半开区间，即该区间包括左端点，而不包括右端点,如Ｓ１对应［0，0.00１)，Ｓ2 对应[0．001,0.01) 等。

算术编码产生的码字实际上是一个二进制数值的指针,指向所编的符号对应的概率区间。

S S S S……的第一个符号S3 用指向第3 个子区间的指⏹符号序列3324针来代表,可以用这个区间内的任意一个小数来表示这个指针，这里约定这个区间的左端点代表这个指针,因此得到第一个码字.０1１。

⏹后续的编码将在前面编码指向的子区间内进行，将［．0１1，.111] 区间再按概率大小划分为４份，第二个符号S３指向.1００1（S3 区间的左端)，输出码字变为.1001。

⏹然后,Ｓ3 对应的子区间又被划分为4 份，开始对第三个符号Ｓ２进行编码，……．⏹两个参量:编码点（指针所指处)C 和区间宽度A。

初始状态编码点（指针所指处)Ｃ= 0区间宽度A=１.0新编码点Ｃ＝原编码点 C + 原区间A×Pi新区间A = 原区间A×ｐi⏹序列Ｓ3S3S2Ｓ4 …… 的编码过程：第1个符号（S3): C= 0 +１×.０１1 = .011A =1×．1 =.１第２个符号(Ｓ3）: C ＝．0１1 + ．1×．01１＝．1001A = ．1×.1 = .0１第３个符号(Ｓ2）:C= .1００1 + .０１×.001= .１0011A =．01×.０1 ＝．００01第４个符号(S4): C = .100１1 + .0０01×.１1１= .10１0011 （输出的码字)A= .0００1×．001 =.0００0００1解码过程⏹算法解码采取与编码过程相反的步骤把接收到的码字串指向其对应的子区间，得到此子区间对应的符号,即为解码后的符号。

即从码字串中减去已解码符号的子区间的左端点的数值（累积概率），并将差值除以该子区间的宽度（概率值),得到新的码字串。

⏹上述例子当收到字码串(.1０10011) 时,其指向子区间[．０1１,.111]，对应于S3，因此，得到第 1 个符号为S3。

新码字串：（．1010０11- .011)÷(.1）= 0．100011，新码字串仍然指向子区间[.0１1, ．1１1]，因此,第2 个符号仍为S3。

其它符号依次类推二，二进制算术编码二进制算术编码的输入的字符只有两种,如果信源字符集内包含有多个字符，则先将这些字符经过一系列的二进判决，变成二进制字符串。

这两个符号构成的序列的编码与算术编码基本原理相同,仍是不断划分概率子区间的递归过程。

在两个输入字符中，出现概率较大的为MPS (MoreＰrｏbaｂle Ｓｙmｂol)，MPＳ的概率为Pe；出现概率较小的为LPS（LesｓＰrobablｅSymbol)，LPS 的概率为Qｅ，Ｐｅ=1-Qe。

编码初始化子区间为[0，１],MPS与LPS 分配如图所示：编码时，设置两个专用寄存器(C，A)C 寄存器的值为编码点（指针所指处)，初时化为0Ａ寄存器的值为子区间的宽度(该宽度恰好是已输入符号串的概率）,初时化为1随着被编码数据源输入,C 和 A 的内容按以下编码规则修正：当低概率符号LＰS 到来时:Ｃ=C, A＝AQe当高概率符号MＰS到来时：C=Ｃ+AＱe ,Ａ=Ape = Ａ（1-Qｅ）例: 信源符号序列1101１11１0 为LPS Qｅ= 1/8 ＝（0.００１)b１为MPS Pｅ＝7/８＝(0.1１1)b初始状态:C＝0 (子区间起始位置) A=1 (子区间宽度）1，第１个符号1为MPSC＝C+ AＱｅ= 0 + 1 ⨯0.０0１＝0.０01Ａ= AＰe = 1 ⨯0.１11 = 0.1１12，第2个符号1仍为MPSC=Ｃ+ＡQe＝0.００1＋０.1１1 ⨯0.001＝０.０01１11 A＝AＰe= ０.１11 ⨯0.1１1 ＝0.1１0０013，第３个符号0为LPＳC=C=0．001111Ａ=A Qe = 0.１1000１⨯0．001 ＝0．0001100014，继续下去……. 最后得C＝０.０1111０0００0001A=0．1１此时区间的尾为C+A=0.111111100000０,编码区间[C,C+A)编码输出可以是最后一个编码区间中的任意小数值,但为了取得最好的编码效率,选择的小数应有最短的比特长度。

上面区间我们可取０.0１01,即输出为0101解码过程按Qe、Ｐｅ分成两个子区间，判断被解码的码字落在哪个区间,并赋予对应符号。

设c’ =(0.0101)b是被解码的值,初始值A＝1 Qe = 0．０0１当ｃ’落在０－QeA 之间,解码符号为D=0，则Ｃ’ = C’， A =Qe A当c’ 落在ＱeA-A 之间,解码符号为D＝1,则C’ =C’-Qｅ A ，A = Ａ(1-Qｅ) 1，c’ ＝0．0101落在Qe A -A 之间,解码符号为Ｄ＝１c’ = c’-QeA = 0.010１-0．００1 = 0.０011 ， A =Ａ(１-Qe)= 0.1112，c’= ０．0０１１落在Qe A-Ａ之间，解码符号为D=１c’＝ｃ’-QｅＡ= 0.0０１1 －0.000111＝0．000１01，A=A（１-Qe)= 0.１11⨯0.111=0.110001３，c’＝0.0００１0１落在０－QeA 之间,解码符号为 D = 0 c’ ＝c’ = 0．00010１ A = AQe = ０.１１0001⨯0．00１＝0.０001１０001三，ＣABAＣ原理及其实现CAＢAC是Ｈ264的一种熵编码方案，相比如H26４的另外一种熵编码方案CA VLＣ而言,在可接受的视频质量（３0dB到3８dB之间)内变化时，前者可节约平均9%到14%的码流。

ＣAＢＡC有以下几个特性:1，对多数符号使用了自适应概率模型。

2，通过使用上下文关系,利用了符号相关性。

3，限制为二进制算术编码(biｎaryａrｉtｈmetｉc coｄing）,基于只用查表和移位方式的快速二进制算术编解码器。

4，３99 种预定义的上下文模型,分成了各种不同的模型组,例如模型14-20用于帧间宏块类型的编码,模型的选择基于前面编码的信息（上下文关系),每个上下文模型适应实验分布。

先大致介绍CABAC的实现过程，然后对一些技术做细节介绍下面是CABAＣ的编码流程图按上图可知,对一个符号编码有如下过程：1,转化成二进制(Binaｒization)CABＡＣ使用二值算术编码,也就是说只对二进制的判决（０或者1)进行编码。

非二进制符号(例如转换后的系数或者运动矢量）在编码前先要进行二进制转换。

这一过程和变长编码（VＬC）中将信息符号转化为变长编码一样,所不同的是,算术编码器在将信息送去传输之前还要进一步对这些二进制符号进行编码。

2, 选择基于内容的模型:“基于内容的模型”是二进制符号中一个或多个比特的概率模型。

根据对先前已编码符号的统计,从可选模型中选择适当的概率模型。

３, 算术编码:根据选择的概率模型对每个比特进行算数编码。

4，更新模型上图中的bypａss coｄｉnｇ是指对于一些特定语法元素的二进制比特符号，为了加快编码速度而不使用上下文模型的形式。

使用ＣABＡC的熵编码方式在时间耗费方面大于ＣＡVLC，为了达到一个折中，在实际编码中,并不是对所有的语法元素都使用CABＡC编码方案，有许多表征视频序列本身固有参数特征的语法元素的熵编码还是使用ＣAＶＬC。

下图是一些需要用CABＡC编码的语法元素及对应的上下文模型索引。

下面来具体介绍编码过程1,二进制化为了降低算术编码的复杂度，提高编码速度，采用二进制算术编码，即进行熵编码的符号是一系列的二进制符号,这得首先需要把编码语法元素转化成二进制串,包括基本方案和串接方案。

Unary B ｉnar ｉzatio ｎ:对于x>=0的无符号整数值，由x 个”1”和一个终结符合”0”组成。

Tr ｕｎca ｔｅd Unar ｙ B ｉnar ｉzation(ＴＵ）：给定一个参数S,对于编码符号ｘ,0＜＝x<＝S 有效，如果x>S,则取ｘ＝Ｓ,对于x<S 时，二进制串由U ｎa ｒy B ｉｎarizati ｏn 方案给出,对于x=S,Unary B ｉnarization 方案中的那个终结符号”0”被忽略，此时输出二进制串为ｘ个”1”。

kth o ｒｄｅr Exp-G ｏlom(EGK ） Bi ｎar ｉzation:由一个前缀和一个后缀码字串接而成,对于给定ｘ，下面是产生一个k 阶指数格雷码的算法whil ｅ(１）{//unary prfix pa ｒｔ o ｆＥGKif (x ＞=(1＜<k))｛pu ｔ(1)x=x-(1<＜k)k++} ｅｌse {pu ｔ（０）／/ter ｍinating “0” of ｐrefix partｗhil ｅ（k －－) ／/ｂｉna ｒy suf ｆi ｘｐａr ｔ of EGK ｐut((x>>k)&０x ０1)ｂr ｅa ｋ}}前缀是由对应值为2log (/21)kx ⎢⎥+⎣⎦的Ｕｎａry B ｉna ｒiz ａtio ｎ方案产生的二进制串组成,后缀由()2(12)k l x x +-这个十进制值对应的二进制串组成。

Ｆｉxed-Len ｇth(ＦL)B ｉn ａr ｉzat ｉｏn:给定一个参数Ｓ,对于编码语法元素x,必须满足0<=x<S ，输出二进制串为十进制值x 对应的二进制数。

e商务文档

cabac原理及其实现笔记

相关文档推荐：