H.264 入门篇 - 05 (帧内预测)

16×16模式的DC预测模式同4×4模式的DC预测方法类似，判断左侧16个像素和上方16个像素的有效性，将其中有效部分的均值作为整个预测块的像素值。如果32个像素都无效，则预测块像素值为( 1。本过程的输入是去块效应滤波过程之前的重建样点值，以及对于 Intra_N×N 预测模式（其中 N×N 等于 4×4 或 8×8）下相邻宏块的 IntraNxNPredMode 值。该模式下，16x16宏块中

爱洋葱

5011人浏览 · 2022-10-15 19:11:02

爱洋葱 · 2022-10-15 19:11:02 发布

0、前言

1、帧内预测类型

2、亮度 Intra_4x4 预测

2.1、当前块 Intra4x4PredMode 的推导过程

2.1.1、预测模式获取情况

2.2、获取预测数据

2.3、Intra4x4 预测

2.3.1、Intra4x4_Vertical 预测模式

2.3.2、Intra4x4_Horizontal 预测模式

2.3.3、Intra4x4_DC 预测模式

2.3.4、Intra4x4_Diagonal_Down_left 预测模式

2.3.5、Intra4x4_Diagonal_Down_right 预测模式

2.3.6、Intra_4x4_Vertical_Right 预测模式

2.3.7、Intra_4x4_Horizontal_Down 预测模式

2.3.8、Intra_4x4_Vertical_Left 预测模式

2.3.9、Intra_4x4_Horizontal_Up 预测模式

3、亮度 Intra_8x8 预测

4、亮度 Intra_16x16 预测

4.1、Intra_16x16_Vertical 预测模式

4.2、Intra_16x16_Horizontal 预测模式

4.3、Intra_16x16_DC 预测模式

4.4、Intra_16x16_Plane 预测模式

5、色度8x8块预测

前置文档：

VideoCodec 入门篇 - 00 (编解码简介)

H.264 入门篇 - 00 (简介)

H.264 入门篇 - 01 (Bitstream)

H.264 入门篇 - 02 (帧内预测相邻像素推导)

0、前言

宏块类型为 I 或者 SI 的时候，使用这个过程；

本过程的输入是去块效应滤波过程之前的重建样点值，以及对于 Intra_N×N 预测模式（其中 N×N 等于 4×4 或 8×8）下相邻宏块的 IntraNxNPredMode 值。

1、帧内预测类型

帧内预测包含4种类型：

亮度4x4块Intra_4x4预测模式

亮度8x8块Intra_8x8预测模式

亮度16x16宏块Intra_16x16预测模式

色度8x8块预测方式。

他们都需要在相邻块做去块滤波 (De-blocking) 之前进行帧内预测；

帧内预测的输入为：预测模式和相邻块像素值；

输出为当前块的预测值。

2、亮度 Intra_4x4 预测

当宏块预测模式为 Intra_4x4 使用该过程；

该模式下，16x16宏块中的亮度块，可分为16个4x4块，每个4x4块都使用Intra_4x4预测方式。其中16个4x4块的扫描顺序如下图：

对于索引号 luma4x4BlkIdx 为 0-15 的 4x4 块，获得当前块的预测像素的过程如下：

1）根据相邻块 Intra4x4PredMode 推导当前块 Intra4x4PredMode；

2）根据 Intra4x4PredMode 和相邻块像素值，得到当前块预测像素值。

luma4x4BlkIdx 的值，就是方块里面的标号；

2.1、当前块 Intra4x4PredMode 的推导过程

本过程的输入是 4x4 亮度块的索引 luma4x4BlkIdx 和先前（按照解码顺序）已经得到的相邻宏块的预测方式 Intra4x4PredMode (如果可用) 和 Intra8x8PredMode(如果可用)。本过程的输出是变量每个4x4块的Intra4x4PredMode[ luma4x4BlkIdx ]。

下表定义了 Intra4x4PredMode[ luma4x4BlkIdx ]的值和相应的名称。

Intra4x4PredMode[ luma4x4BlkIdx ]的值为 0、1、2、3、4、5、6、7 和 8，这些值分别代表不同预测方向，如下图：

Intra4x4PredMode[ luma4x4BlkIdx ] 由以下方式得到：

1）以下任一条件满足则使用 DC 预测（Intra_4x4_DC），即 dcPredModePredictedFlag 设为 1

宏块mbAddrA（当前宏块左相邻宏块）不可用；
宏块mbAddrB（当前宏块上相邻宏块）不可用；
宏块mbAddrA可用，并且以帧间预测方式进行编码、constrained_intra_ pred_flag为1；
宏块mbAddrB可用，并且以帧间预测方式进行编码、constrained_intra_ pred_flag为1；
举个例子，I slice的第一个宏块必定使用DC预测，因为它的相邻块mbAddrA、mbAddrB都不可用。

否则 dcPredModePredictedFlag = 0 走如下流程；

2）不满足上述条件，则通过相邻块预测模式预测当前块Intra4x4PredMode。已知以下信息：mbAddrA的预测模式、mbAddrB的预测模式、码流中读取的语法元素prev_intra4x4_pred_mode_flag。

从mbAddrA和mbAddrB的预测模式中选取较小的一个作为预先定义模式。
判断码流中读取的标志位prev_intra4x4_pred_mode_flag，如果该标志位为1，则预先定义模式就是当前块的预测模式；
如果标志位prev_intra4x4_pred_mode_flag为0，则根据码流中解析出的语法元素 rem_intra4x4_pred_mode判断。如果rem_intra4x4_pred_mode的值小于预定义模式的值则选用rem_intra4x4_pred_mode；如果大于等于预定义模式，则当前块的预测模式设为rem_intra4x4_pred_mode + 1。

伪代码如下：

predIntra4x4PredMode = Min( intraMxMPredModeA, intraMxMPredModeB )

if( prev_intra4x4_pred_mode_flag[ luma4x4BlkIdx ] )
    Intra4x4PredMode[ luma4x4BlkIdx ] = predIntra4x4PredMode
else
    if( rem_intra4x4_pred_mode[ luma4x4BlkIdx ] < predIntra4x4PredMode )
        Intra4x4PredMode[ luma4x4BlkIdx ] = rem_intra4x4_pred_mode[ luma4x4BlkIdx ]
else
    Intra4x4PredMode[ luma4x4BlkIdx ] = rem_intra4x4_pred_mode[ luma4x4BlkIdx ] + 1

总结为：

如果不能获取相邻宏块的预测方式，则当前块的预测模式为DC预测；

否则选择相邻块预测方式较小的一个作为当前的模式预测值；

码流中指定了要不要使用这个预测值。如果用，那么这个预测值就是当前块的帧内预测模式；否则就从后续读取的预测模式中计算。

2.1.1、预测模式获取情况

当 DC = 0，即不满足 DC 预测的时候，选取相邻块 mbAddrA（当前宏块左相邻宏块）和 mbAddrB（当前宏块上相邻宏块）的时候，可能出现下面 3 种情况：

1、左与上的相邻块都在当前宏块，即此时当前宏块还未决定是采用 I_8x8 还是 I_4x4 或者其他的预测方式。那么当前块的相邻块A,B的预测模式就采用与这轮的宏块模式相同的方式的预测模式。如，当前正以I_8x8进行帧内预测，那 PredModeA = PredMode8x8A，PredModeB = PredMode8x8_B.

2、左与上的宏块都位于相邻宏块，即当前块位于宏块的左上角。此时左与上块所在的宏块都已选定了所采用的帧内宏块预测方式，因此无论当前块是在哪轮的帧内预测上（I_4x4或I_8x8），都应采用相邻宏块的预测方式来作为当前块的相邻块的帧内预测模式，PredModeA = PredModeMacroBlockA，PredModeB = PredModeMacroBlockB.

3、左或上的其中一个块为相邻宏块，仅有一个（左或上）块位于当前宏块。这种情况下，位于其他宏块的相邻块采用其所在宏块的帧内预测模式，位于当前宏块的相邻块采用这一轮预测模式。PredModeA = PredMode4x4A，PredModeB = PredModeMacroblockB.

最终：

PredPredMode = Min(PredModeA, PredModeB)

2.2、获取预测数据

Intra_4x4 预测需要用到的13个相邻像素值如下图所示：

相邻像素如何获取可参考帧内预测相邻像素推导过程.

首先需要判断这13个像素值是否有效。当下列4个条件满足任意一个，那么该像素便被判定为无效，不能用于预测：

宏块mbAddrN不可获得；
宏块mbAddrN为帧间预测模式，且标识位constrained_intra_pred_flag为1；
宏块mbAddrN为SI类型，，且标识位constrained_intra_pred_flag为1，且当前宏块不是SI类型；
块索引luma4x4BlkIdx为3或11时，EFGH4个像素值不可用；（如下图所示，当解码到第3个块时，4还未解码，所以块4中的预测像素值不能使用，也就是EFGH这4个像素值）。

2.3、Intra4x4 预测

Intra4x4 预测根据相邻的13个像素值得到当前4x4块预测像素值。预测方式共有9种；

2.3.1、Intra4x4_Vertical 预测模式

2.3.2、Intra4x4_Horizontal 预测模式

2.3.3、Intra4x4_DC 预测模式

Dc数值为相邻像素值的均值：

A、B、C、D、I、J、K、L都存在时，dc为这8个像素值的均值；
A、B、C、D不可用时，dc为I、J、K、L这4个像素的均值；
I、J、K、L不可用时，dc为A、B、C、D这4个像素的均值；
当这8个像素都不可用时，dc为(1<<(bit_depth-1))

2.3.4、Intra4x4_Diagonal_Down_left 预测模式

当A、B、C、D、E、F、G、H 8个像素存在时才能使用这种预测模式；

当(x,y)=(3,3)，即计算一个4×4像素块最右下方的像素p时：
pred4x4L[ x, y ] = ( p[ 6, −1 ] + 3 * p[ 7, −1 ] + 2 ) >> 2
其他情况计算方式如下：
pred4x4L[ x, y ] = ( p[ x + y, −1 ] + 2 * p[ x + y + 1, −1 ] + p[ x + y + 2, −1 ] + 2 ) >> 2；

以像素点a为例，做一条左下方向成45°直线，会穿过预测像素点B，预测计算过程依赖A、B、C三个像素值，pred_a = (A+2B+C+2)/4