[FFMPEG]H264码流中NALU|[FFMPEG]H264码流中NALU sps pps IDR帧的理解

H264码流中NALU sps pps IDR帧的理解 1、概念

  • 什么是NALU?
    H264码流可以分为两层,VCL层和NAL层,NAL的全称是Network abstraction layer,叫网络抽象层,它保存了H264相关的参数信息和图像信息,NAL层由多个单元NALU组成,NALU由了NALU头(00 00 00 01或者00 00 01)、sps(序列参数集)、pps(图像参数集合)、slice、sei、IDR帧、I帧(在图像运动变化较少时,I帧后面是7个P帧,如果图像运动变化大时,一个序列就短了,I帧后面可能是3个或者4个P帧)、P帧、B帧等数据。
  • sps、pps、I帧、P帧在NALU中的关系和nalu type判断
    一个完整的NALU单元结构图如下:

    [FFMPEG]H264码流中NALU|[FFMPEG]H264码流中NALU sps pps IDR帧的理解
    文章图片
    QQ20180912-192759@2x.png 【[FFMPEG]H264码流中NALU|[FFMPEG]H264码流中NALU sps pps IDR帧的理解】
00 00 00 01是NALU头,是序列的标识符的开头,0x27转成二进制是100111,00111转成十进制是7,那么7对应NALU type=sps,0x28转成二进制是101000,转成十进制是8,8对应NALU type=pps,0x25转成二进制是100101,00101转成十进制是5,5对应的NALU type=IDR帧(使用FFMPEG,sps和pps是保存在AVCodecContext的extradata.data中,在解码提取sps和pps时,判断NALU type可以用extradata.data[ 4 ]&0x1f(结果是7是sps,8是pps,计算方式是先转成二进制,0x27&0x1f=11111&00111=00111=7,pps计算类似)),NALU type=1是splice,splice有三种编码模式,I_slice、P_slice、B_slice,I帧在编码时就分割保存在splice中。 NALU type值对应表如下:

NALU type NALU 类型
1 NALU_TYPE_SLICE
2 NALU_TYPE_DPA
3 NALU_TYPE_DPB
4 NALU_TYPE_DPC
5 NALU_TYPE_IDR
6 NALU_TYPE_SEI
7 NALU_TYPE_SPS
8 NALU_TYPE_PPS
9 NALU_TYPE_AUD
10 NALU_TYPE_EOSEQ
11 NALU_TYPE_EOSTREAM
12 NALU_TYPE_FILL
  • IDR帧和I帧的关系
    IDR帧就是I帧,但是I帧不一定是IDR帧,在一个完整的视频流单元中第一个图像帧是IDR帧,IDR帧是强制刷新帧,在解码过程中,当出现了IDR帧时,要更新sps、pps,原因是防止前面I帧错误,导致sps,pps参考I帧导致无法纠正。
    再普及一个概念是GOP,GOP的全称是Group of picture图像组,也就是两个I帧之间的距离,GOP值越大,那么I帧率之间P帧和B帧数量越多,图像画质越精细,如果GOP是120,如果分辨率是720P,帧率是60,那么两I帧的时间就是120/60=2s.

    推荐阅读