一种基于MATLAB的JPEG图像压缩具体实现方法说明:该方法主要是对FPGA硬件实现编码的一个验证,MATLAB处理时尽量选择了简单化和接近硬件实现需要。
JPEG编码解码流程:BMP图像输入、8*8分块、DCT变换、量化、Zig_Zag 扫描、获取DC/AC系数中间格式、Huffman熵编码、DC/AC系数Huffman熵解码,反zig_zag扫描、反量化、反DCT变换、8*8组合、解码图像显示。
下面根据具体代码解释实现过程。
1.BMP图像输入A=imread('messi_b.bmp'); %读取BMP图像矩阵R=int16(A(:,:,1))-128; %读取RGB矩阵,由于DCT时输入为正负输入,G=int16(A(:,:,2))-128; %使得数据分布围-127——127B=int16(A(:,:,3))-128;通过imread函数获取BMP图像的R、G、B三原色矩阵,因为下一步做DCT 转换,二DCT函数要求输入为正负值,所以减去128,使得像素点分布围变为-127~127,函数默认矩阵A的元素为无符号型(uint8),所以如果直接相减差值为负时会截取为0,所以先用int16将像素点的值转为带符号整数。
网上很多都提到了第一步的YUV转换,但是由于MATLAB在实验时YUV转换后色差失真比较严重,这里没有进行YUV转换。
个人理解为YUV转换后经过非R/G/B原理显示器显示效果可能会比较好,或者如果图像有色差可以选择YUV调整。
为了方便,读入的图像像素为400*296,是8*8的50*37倍,所以代码里没有进行8*8的整数倍调整。
2. 8*8分块R_8_8=R(1:8,1:8);%取出一个8*8块这里以R色压缩解码为例,后边解释均为R色编码解码过程,最后附全部代码。
R_8_8为:3.DCT变换R_DCT=dct2(R_8_8);使用MATLAB函数dct2进行DCT变换,也可使用DCT变换矩阵相乘的方法,即R_DCT=A* R_8_8*A T,其中A为DCT变换矩阵。
R_DCT为:4.量化R_dct_s=round(R_DCT./S);使用JPEG标准亮度量化表S量化并取整,S为:R_dct_s为:其中第一个数-14为DC系数,剩余63个数为AC系数,左上角低频,右下角高频,可以看出量化后已经将多数高频量丢弃,从而实现数据压缩。
5.Zig_Zag扫描Rdcts_c=reshape(R_dct_s',1,64);Rdcts_c_z=Rdcts_c(zig);利用reshape函数将量化后的矩阵转为[1,64]行向量,利用zig向量按位取值,进行Zig_Zag扫描。
其中Rdcts_c为:11~64位均为0;zig为:zig=[0,1,8,16,9,2,3,10,17,24,32,25,18,11,4,5,12,19,26,33,40,48,41 ,34,27,20,13,6,7,14,21,28,35,42,49,56,57,50,43,36,29,22,15,23,30,37,4 4,51,58,59,52,45,38,31,39,46,53,60,61,54,47,55,62,63];Zig_Zag扫描后的向量Rdcts_c_z为:11~64位均为0;可以看出通过zig向量按位取值准确实现了对量化后DC,AC系数的Zig_Zag 扫描。
6.获取DC/AC系数的中间格式r_dc_diff=Rdcts_c_z(1)-r_dc;用当前DC系数减去上一个8*8子块的DC系数得到两DC系数的差值作为DC 系数中间值,因为图像相邻像素具有很大的相关性,这样做可以减小DC编码长度,进一步压缩代码,在解码的时候通过该差值依次获得各8*8子块DC系数。
r_dc=Rdcts_c_z(1);解码之后用该代码将当前DC系数赋给r_dc作为下一次编码时求差值的参考值。
for i=2:1:64;if Rdcts_c_z(i)==0&&r_n<15&&i~=64r_n=r_n+1;elseif Rdcts_c_z(i)==0&&r_n<15&&i==64r_ac_cnt=r_ac_cnt+1;r_AC(1,2*r_ac_cnt-1)=r_n;r_AC(1,2*r_ac_cnt)=Rdcts_c_z(i);r_n=0;elseif Rdcts_c_z(i)~=0&&r_n<15r_ac_cnt=r_ac_cnt+1;r_AC(1,2*r_ac_cnt-1)=r_n;r_AC(1,2*r_ac_cnt)=Rdcts_c_z(i);r_n=0;elseif Rdcts_c_z(i)~=0&&r_n==15r_ac_cnt=r_ac_cnt+1;r_AC(1,2*r_ac_cnt-1)=r_n;r_AC(1,2*r_ac_cnt)=Rdcts_c_z(i);r_n=0;elseif Rdcts_c_z(i)==0&&r_n==15r_ac_cnt=r_ac_cnt+1;r_AC(1,2*r_ac_cnt-1)=r_n;r_AC(1,2*r_ac_cnt)=Rdcts_c_z(i);r_n=0;endend该for循环用来获取AC系数的中间格式,因为第一个数为DC系数,所以循环从2开始。
因为63个AC系数中有很多值为0,所以采用行程编码可以很大的减小编码长度。
行程编码是指记录两个非0数之间0的个数,以及非零数的数值,非零数个数和数值为一组中间格式,这里为了计数方便,连续16个0出现时,用(15,0)表示,继续获取下一个AC系数中间格式,也就是说行程编码压缩的最大长度设为16bit,例如数列:1、0、0、-1、0、0、0、0、0、3、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、0、2;对该列数通过形成编码获取中间格式即为:(0,1)、(2,-1)、(5,3)、(15,0)、(5,2)。
第一个数为0的个数,第二个数为数值,特殊情况(15,0)指16个0。
通过该for循环获取AC系数中间格式并保存在向量Rdcts_c_z中,奇数表示0的个数,偶数表示AC系数数值。
表示前两个数是1,后边共有16*3+13=61个0,与量化表相同。
7. Huffman熵编码熵编码可以根据Huffman算法对每个量化后的矩阵进行现场编码,但是这样会增加传输数据(需要传输编码表),所以这里采用标准HuffmanVLI编码表进行编码,现,这里没有涉及到Huffman亮度表,而是依据VLI编码表,通过DC/AC系数的数值确定位数和编码(编码原理),熵编码由上表中的位数和编码两部分组成,即压缩后的编码包括两部分,然后再依据VLI编码表,通过位数和编码返回DC/AC 系数(解码原理),编码中还包含了AC系数中0的个数。
0的个数和位数均用4bit 二进制数表示。
r_huff=cell(r_ac_cnt+1,3);%%建立三列矩阵保存压缩后的编码,第一例为0的个数,第二列为编码长度,第三例为编码for j=0:1:r_ac_cnt;if j==0[siz,code]=vli(r_dc_diff); %%通过vli编码函数对DC差值进行编码,获得DC差值编码长度和编码,vli函数见附录。
%[siz,code]=vli(r_dc);%%通过vli函数获取AC系数编码及编码长度 r_huff(1,1)=cellstr(dec2bin(0)); %%cellstr将二进制字符串转为cell格式放入矩阵r_huff(1,2)=cellstr(dec2bin(siz,4));%%将哈夫曼编码长度存为4bitr_huff(1,3)=cellstr(dec2bin(code,siz));%%将哈夫曼编码转为二进制r_code_bit=r_code_bit+siz; %%计算编码长度elseif r_AC(2*j)==0r_huff(j+1,1)=cellstr(dec2bin(r_AC(2*j-1),4));%%将0的个数写入第一列r_huff(j+1,2)=cellstr(dec2bin(0));r_huff(j+1,3)=cellstr(dec2bin(0));elser_huff(j+1,1)=cellstr(dec2bin(r_AC(2*j-1),4));[siz,code]=vli(r_AC(2*j));r_huff(j+1,2)=cellstr(dec2bin(siz,4)); %%AC编码长度写入第二列r_huff(j+1,3)=cellstr(dec2bin(code,siz)); %%AC编码写入第三列r_code_bit=r_code_bit+siz; %%计算编码长度endendend压缩后的编码表r_huff如下:此时已将8*8*8=512bit压缩为4+6*8+2+1+1=56bit。
8.DC/AC系数Huffman熵解码i_n=1;for k=1:1:r_ac_cnt+1;if k==1[i_value]=i_vli(r_huff(1,2),r_huff(1,3)) %%i_vli函数解码,i_vli通过编码长度和编码恢复DC/AC系数真值,函数见附录。
i_Rdcts_c_z(1,i_n)=r_dc+i_value;%i_Rdcts_c_z(1,i_n)=r_huff(1,3);i_n=i_n+1;r_dc=Rdcts_c_z(1);elseif bin2dec(r_huff(k,1))==15&&bin2dec(r_huff(k,2))==0i_Rdcts_c_z(1,i_n:i_n+15)=0;%%出现中间格式(15,0)返16个0i_n=i_n+16;elseif bin2dec(r_huff(k,1))==0&&bin2dec(r_huff(k,2))==0 i_Rdcts_c_z(1,i_n)=0; %%出现中间格式(0,0)反1个0,没有具体分析这种情况到底是否存在,但是如果最后一位恰好为0,此时恰好开始新的中间格式计算,i=64时终止计算,则中间格式为(0,0)i_n=i_n+1;elsei_Rdcts_c_z(1,i_n:i_n+bin2dec(r_huff(k,1))-1)=0;%%哈夫曼编码矩阵r_huff中为二进制数,所以用到了bin2deci_n=i_n+bin2dec(r_huff(k,1)); %%通过第一列分解重复的0 i_value=i_vli(r_huff(k,2),r_huff(k,3)); %%通过第二三列,编码长度和编码解出AC系数真值i_Rdcts_c_z(1,i_n)=i_value;%%将解码后的DC/AC系数放入向量i_Rdcts_c_zi_n=i_n+1;endendend9.反Zig_Zag扫描i_Rdcts_c=i_Rdcts_c_z(i_zig); %%反zig_zag扫描i_Rdct_s(1,1:8)=i_Rdcts_c(1:8); %%变为矩阵形式i_Rdct_s(2,1:8)=i_Rdcts_c(9:16);i_Rdct_s(3,1:8)=i_Rdcts_c(17:24);i_Rdct_s(4,1:8)=i_Rdcts_c(25:32);i_Rdct_s(5,1:8)=i_Rdcts_c(33:40);i_Rdct_s(6,1:8)=i_Rdcts_c(41:48);i_Rdct_s(7,1:8)=i_Rdcts_c(49:56);i_Rdct_s(8,1:8)=i_Rdcts_c(57:64);通过按位取值的方法进行反Zig_Zag扫描,并将扫描获得的向量转为8*8矩阵,其中:i_zag为:i_zig=[1,2,6,7,15,16,28,29,3,5,8,14,17,27,30,43,4,9,13,18,26,31,4 2,44,10,12,19,25,32,41,45,54,11,20,24,33,40,46,53,55,21,23,34,39,47,5 2,56,61,22,35,38,48,51,57,60,62,36,37,49,50,58,59,63,64];i_Rdct_s为:(可见该矩阵与量化后的矩阵相同)10.反量化、反DCT变换i_Rdct=round(i_Rdct_s.*S); %%反量化并取整i_R_8_8=round(idct2(i_Rdct)); %%逆DCT变换其中i_R_8_8为:(可见与DCT变换前差别不大)11.解码图像显示for i_r=1:1:37;for i_c=1:1:50;endend用这样一个嵌套for循环将所有8*8子块进行基于DCT变换的JPEG编码解码处理,i_R(i_r*8-7:i_r*8,i_c*8-7:i_c*8)=i_R_8_8; 在循环最后通过该语句将每一个8*8子块放到i_R矩阵中,然后i_R加128得到解码后R色像素矩阵i_RR。