当前位置:文档之家› 视频音频编码知识

视频音频编码知识

audio。

AAC(Advanced Audio Coder)区别于ac3,mp3(全称MPEG1 Layer3,可不是MPEG3的缩写哦)等等,aac是Mp4官方指定的mp4音频规格。

和video一样,她也有两个profile:- LC-AAC (Low Complexity) 也被叫做MAIN @ Level 2- HE-AAC (High Efficiency) 也被叫做AAC SBR/AAC+/aacplus再次抛开技术性的数据,HE比LC更高级一些,允许你在相同音质下已更低的bitrate编码。

帧间压缩。

其次,时间相关性的统计分析:统计的结果表明,在间隔1~2帧的图像中,各像素只有10%以下的点,其亮度差值变化超过2%,而色度差值的变化只有1%以下。

采用的压缩方法: 分组:把几帧图像分为一组(GOP),为防止运动变化,帧数不宜取多。

1.定义帧:将每组内各帧图像定义为三种类型,即I帧、B帧和P帧;2.预测帧:以I帧做为基础帧,以I帧预测P帧,再由I帧和P帧预测B帧;3.数据传输:最后将I帧数据与预测的差值信息进行存储和传输。

I帧:帧内编码帧I帧特点:1.它是一个全帧压缩编码帧。

它将全帧图像信息进行JPEG压缩编码及传输;2.解码时仅用I帧的数据就可重构完整图像;3.I帧描述了图像背景和运动主体的详情;4.I帧不需要参考其他画面而生成;5.I帧是P帧和B帧的参考帧(其质量直接影响到同组中以后各帧的质量);6.I帧是帧组GOP的基础帧(第一帧),在一组中只有一个I帧;7.I帧不需要考虑运动矢量;8.I帧所占数据的信息量比较大。

P帧:前向预测编码帧。

P帧的预测与重构:P帧是以I帧为参考帧,在I帧中找出P帧“某点”的预测值和运动矢量,取预测差值和运动矢量一起传送。

在接收端根据运动矢量从I帧中找出P帧“某点”的预测值并与差值相加以得到P帧“某点”样值,从而可得到完整的P帧。

P帧特点:1.P帧是I帧后面相隔1~2帧的编码帧;2.P帧采用运动补偿的方法传送它与前面的I或P帧的差值及运动矢量(预测误差);3.解码时必须将I帧中的预测值与预测误差求和后才能重构完整的P帧图像;4.P帧属于前向预测的帧间编码。

它只参考前面最靠近它的I帧或P帧;5.P帧可以是其后面P帧的参考帧,也可以是其前后的B帧的参考帧;6.由于P帧是参考帧,它可能造成解码错误的扩散;7.由于是差值传送,P帧的压缩比较高。

B帧:双向预测内插编码帧。

B帧的预测与重构B帧以前面的I或P帧和后面的P帧为参考帧,“找出”B帧“某点”的预测值和两个运动矢量,并取预测差值和运动矢量传送。

接收端根据运动矢量在两个参考帧中“找出(算出)”预测值并与差值求和,得到B帧“某点”样值,从而可得到完整的B帧。

B帧特点1.B帧是由前面的I或P帧和后面的P帧来进行预测的;2.B帧传送的是它与前面的I或P帧和后面的P帧之间的预测误差及运动矢量;3.B帧是双向预测编码帧;4.B帧压缩比最高,因为它只反映丙参考帧间运动主体的变化情况,预测比较准确;5.B帧不是参考帧,不会造成解码错误的扩散。

注:I、B、P各帧是根据压缩算法的需要,是人为定义的,它们都是实实在在的物理帧,至于图像中的哪一帧是I帧,是随机的,一但确定了I帧,以后的各帧就严格按规定顺序排列。

x264参数介绍(一、帧类型和码率控制)本页说明所有x264参数之目的和用法。

参数的排列相同于在x264 --fullhelp出现的顺序。

参阅:X264统计资料输出、X264统计资料档案和X264编码建议。

x264设定说明x264带有一些内置的文件。

要阅读此说明,执行x264 --help、x264 --longhelp或x264 --fullhelp。

越后面的选项会提供越详细的资讯。

输入以一个位置引数指定输入的视讯。

例如:x264.exe --output NUL C:\input.avs x264 --output /dev/null ~/input.y4m当输入是raw YUV格式时,还必须告知x264视讯的分辨率。

你可能也要使用--fps来指定帧率:x264.exe --output NUL --fps 25 --input-res 1280x720 D:\input.yuv x264 --output /dev/null --fps 30000/1001 --input-res 640x480 ~/input.yuv默认为了减少使用者花费时间和精力在命令列上而设计的一套系统。

这些设定切换了哪些选项可以从x264 --fullhelp的说明里得知。

profile默认:无说明:限制输出文件的profile。

这个参数将覆盖其它所有值,此选项能保证输出profile兼容的视频流。

如果使用了这个选项,将不能进行无损压缩(qp 0 or crf 0)。

可选:baseline,main,high- Baseline Profile 提供I/P帧,仅支持progressive(逐行扫描)和CAVLC- Extended Profile 提供I/P/B/SP/SI帧,仅支持progressive(逐行扫描)和CAVLC- Main Profile 提供I/P/B帧,支持progressive(逐行扫描)和interlaced(隔行扫描),提供CAVLC或CABAC- High Profile (也就是FRExt)在Main Profile基础上新增:8x8 intra prediction(8x8 帧内预测), custom quant(自定义量化), lossless video coding(无损视频编码), 更多的yuv格式(4:4:4...)建议:不设置。

除非解码环境只支持main或者baseline profile的解码。

preset默认:medium一些在压缩效率和运算时间中平衡的预设值。

如果指定了一个预设值,它会在其它选项生效前生效。

可选:ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow and placebo. 建议:可接受的最慢的值tune默认:无说明:在上一个选项基础上进一步优化输入。

如果定义了一个tune值,它将在preset之后,其它选项之前生效。

可选:film, animation, grain, stillimage, psnr, ssim, fastdecode, zerolatency and touhou.建议:根据输入选择。

如果没有合适的就不要指定。

slow-firstpass默认:无说明:随着预设值机制在r1177版本的出现,使用–pass 1会在解析命令行时增加以下设置:* ref 1* no-8x8dct* partitions i4x4 (if originally enabled, else none)* me dia* subme MIN( 2, subme )* trellis 0如果设置preset=placebo则自动关闭此特性。

如果想显式关闭此特性,使用slow-firstpass。

帧类型keyint默认:250说明:设置x264输出中最大的IDR帧(亦称关键帧)间距。

IDR帧是视频流的“分隔符”,所有帧都不可以使用越过关键帧的帧作为参考帧。

IDR帧是I帧的一种,所以它们也不参照其它帧。

这意味着它们可以作为视频的搜索(seek)点。

通过这个设置可以设置IDR帧的最大间隔帧数(亦称最大图像组长度)。

较大的值将导致IDR帧减少(会用占用空间更少的P帧和B帧取代),也就同时减弱了参照帧选择的限制。

较小的值导致减少搜索一个随机帧所需的平均时间。

建议:默认值(fps的10倍)对大多数视频都很好。

如果在为蓝光、广播、直播流或者其它什么专业流编码,也许会需要更小的图像组长度(一般等于fps)。

参见:min-keyint, scenecut, intra-refreshmin-keyint默认:auto(keyint/10)说明:参见keyint的说明。

过小的keyint范围会导致产生“错误的”IDR帧(比如说,一个闪屏场景,参见上一篇blog)。

此选项限制了IDR帧之间的最小距离。

建议:默认,或者与fps相等参见:keyint, scenecutno-scenecut默认:无说明:完全关闭自适应I帧决策。

参见:scenecutscenecut默认:40说明:设置决策使用I帧、IDR帧的阈值(场景变换检测)。

x264会计算每一帧与前一帧的不同程度并得出一个值。

如果这个值低于scenecut,那么就算检测到一个“场景变换”。

如果此时距离上一帧的距离小于 min-keyint则插入一个I 帧,反之则插入一个IDR帧。

较高的值会增加侦测到“场景变换”纪律。

更详细的工作原理可见 /showthread.php?t=121116设置scenecut=0与no-scenecut等效。

建议:使用默认值参见:keyint, min-keyint, no-scenecutintra-refresh默认:off说明:让x264为每keyint数量的帧使用宏块内部编码取代IDR帧。

块以水平移动列的方式更新,也叫刷新波。

对于低延迟的流,这样可以让帧的尺寸比使用标准的IDR帧更加保持恒定。

而且这样可以增强视频流对丢包的容错能力。

这个选项会降低压缩率,所以在确实需要的时候才选择它。

还有一些有意思的事情:1、第一帧依然是IDR帧。

2、内部宏块只在P帧中存在,刷新波在一个或多个B帧后的P帧中广泛存在。

3、主要的压缩率下降原因是在宏块中新(左边)的波并不能参考旧(右边)的波。

建议:使用默认值bframes默认:3说明:设置x264可使用的B帧的最大连续数量。

没有B帧时,一个典型的x264流帧类型是这样的:IPPPPP...PI。

如果设置了-bframes 2,那么两个连续的P帧就可以用B帧替换,然后就像这样:IBPBBPBPPPB (I)B帧和P帧的区别在于它可以参照它之后的帧,这个特点让它可以显著地提升压缩率。

他们的平均品质受–pbratio选项的控制。

还有一些有意思的事情:1、x264有2种B帧,一种可以作为参照帧,一种不能;2、关于x264如何决策B帧或P帧,可以看看这个ffmpeg-devel邮件列表中的这一封 /p.video.ffmpeg.devel/29064。

这种情况下帧类型看起来就像这样IBBBPBBBPBPI(假设设置–bframes 3)。

参见:–no-b-adapt, –b-bias, –b-pyramid, –ref, –pbratio, –partitions, –weightbb-adapt默认:1说明:设置B帧决策算法,这个选项会影响到x264使用P帧或者B帧。

相关主题