简单百科
编码单元

编码单元

编码单元（CTU）是指在高效率视频编码（HEVC）中的一种基本单位，它可以包含一个编码单元（coding Unit, CU），也可以被分割成多个更小的编码单元。

简介

高效率视频编码（HEVC）使用编码单元来指示该单元是使用画面内预测（Intra Prediction）还是画面间预测（Inter Prediction）。这些编码单元可以通过四分树（Quadtree）结构方便地表示，这是一种递归结构，四分树上的数字表示节点是否继续分割，如果节点将继续分割，则为1，如果不继续分割，则为0。当节点上的数字为0时，该节点成为编码单元。在编码树中，叶子节点（Leaf Node）就是编码单元。在编码单元上采用Z-scan方式进行处理，对于编码树而言，这是深度优先遍历。编码单元的大小支持2Nx2N，其中N=4、8、16或32，因此HEVC的四分树最高深度为4。

深度遍历选择和早期编码单元裁剪

为了降低新一代高效视频编码（High Efficiency Video Coding，HEVC）标准的编码复杂度，提出了一种基于四叉树结构类型分析和早期编码单元（Coding Unit，CU）裁剪的HEVC快速编码新算法。首先，通过分析已编码的最大编码单元（Largest CU，LCU）四叉树结构类型，确定其深度遍历区间（Depth Range，DR）类型。然后，利用相邻已编码的LCU以及前向参考帧和后向参考帧中坐标位置相同的LCU的DR类型来预测当前LCU的DR类型，并根据预测得到的DR类型对当前LCU设定CU深度遍历区间。最后，采用托马斯·贝叶斯决策原理获取阈值，并利用该阈值在CU分割过程进行早期CU裁剪。

编码复杂度分析

HEVC采用率失真优化方式决定LCU最终四叉树结构的分割形式，这样，可以在保证视频质量的前提下获得最小的码率。其率失真代价函数J（CU）为：

J（CU）=SSE+λ×B，

其中：d表示当前CU的深度值，B代表当前CU经过各种PU预测和模式选择后编码所需的比特数，λ为约瑟夫·拉格朗日算子，SSE（Sum of Square Error，SSE）表示原始图像块和重建图像块之间的误差平方和。

深度遍历选择和早期裁剪新算法

在充分考虑到HEVC的四叉树编码结构和视频的时空域相关性的基础上，首先通过对四叉树结构类型进行分析，确定其深度遍历区间（Depth Range，DR）类型，利用参考帧相同位置的LCU和相邻LCU的DR类型来预测当前LCU的CU深度遍历区间；然后，再根据预测的深度区间进行编码。同时，采用托马斯·贝叶斯决策训练原理获取阈值，并利用该阈值对CU分割进行早期CU裁剪。

1. DR类型的确定：

HEVC采用四叉树结构进行编码，一个LCU最终的分割类型是通过其CU深度值确定的，大小为64×64的LCU包括256个4×4块，每个4×4块都用一个深度值depth（depth∈[0，3]）表示。不同四叉树结构的LCU，其CU深度值的分布情况也不同，LCU的四叉树结构类型可以分为8种（即A，B，C，D，E，F，G，H）。若能在LCU四叉树结构划分前对其类型进行预测，通过该类型设定CU深度遍历范围，就可以减少不必要的CU深度遍历，从而降低其编码复杂度。但过于精细的预测遍历区间会很容易造成误判。因此，将深度值分布相近的四叉树结构类型进行合并，并定义T、T、T和T四种DR类型。例如，T包括C和D两种四叉树结构类型，其中：C的深度值为1和2，D的深度值则全为2，故将这两种四叉树结构的DR类型定为T。算法根据DR类型进行CU深度遍历，相比原始0～3的全遍历，明显减少了编码复杂度。

2. 利用时空相关性的中值DR类型预测：

在视频序列中，当前编码LCU与相邻已编码的LCU以及前一帧和后一帧中与当前编码LCU位置相同的LCU（以下简称为对应LCU）之间有很大的相关性。LeftLCU、滔搏电子竞技俱乐部 LCU、Left-top LCU、Col1LCU和Col2LCU共5个参选预测LCU的DR类型来预测当前编码LCU的DR类型。

3. 基于托马斯·贝叶斯决策的早期CU裁剪预判：

在LCU的块划分过程中，若当前CU（depth∈[1，2]）为其上一层CU的第4个分割CU，则在计算完其率失真代价J后，就有可能通过预判断提前进行早期CU裁剪过程。

采用贝叶斯决策原理在帧内模式选择过程中训练基于SATD（Hadamard transformed SAD）的率失真代价最佳阈值。

帧内预测编码单元划分快速算法

高效率视频编码(HEVC)采用基于编码单元(CU)的四叉树块分区结构，能灵活地适应各种图像的纹理特征，显著提高编码效率，但编码复杂度大大增加，提出一种缩小深度范围且提前终止CU划分的快速CU划分算法。基于Sobel边缘检测算子计算一帧中各深度边缘点阈值，缩小后面若干帧中CU遍历的深度范围；同时，统计该帧中各CU划分为各深度的率失真(RD)代价，计算各深度的RD代价阈值。然后，在后续视频帧中，利用RD代价阈值在缩小的深度范围内提前终止CU划分。为了符合视频内容的变化特性，统计参数是周期性更新的。经测试，在平均比特率增加仅1.2%时，算法时间平均减少约59%，有效提高了编码效率。

基于代价的划分提前终止

HM的CU划分过程，是在4个深度级范围内逐级比较RD代价，并选择RD代价最小的划分作为最佳划分。由LCU边缘点确定的2个或3个深度级范围内进行CU划分。为进一步加快CU划分速度，采用基于RD代价的CU划分提前终止策略。

一般情况下，若CU当前深度的RD代价越小，则说明当前划分方式的效果越好，该CU继续划分的可能性越小。也就是说，若CU当前深度RD代价小于某个阈值，就无需继续划分，这就是“CU划分提前终止策略”。

在学习帧中，除了得到边缘点数目与深度级范围的对应关系外，还利用HM得到各LCU的划分深度及对应的RD代价，并计算每个深度级所对应的RD代价的均值及标准差，再计算用于提前终止的RD代价阈值。在此后的应用帧中，从最小深度级开始计算当前深度级的RD代价，若当前深度级CU的RD代价小于对应深度级的RD代价阈值，则该CU不继续划分，提前终止，否则继续按深度增加逐级比较。这样，就大大减小了RD代价的计算量。

快速划分算法流程

对于整个算法流程，首先是学习帧基于梯度获得一帧图像中各深度的边缘点阈值，在统计边缘点的同时也统计一帧中各LCU最终划分时各子CU的RD代价，并对统计得到的各个深度级RD代价求均值和标准差，获得用于判断的RD代价阈值。然后在应用帧中，先依据边缘点阈值获得当前LCU需遍历的深度范围，再在该深度范围内，比较当前深度CU的RD代价和RD代价阈值的大小，若小于RD代价阈值则CU提前终止。具体步骤为：

(1)首先是学习帧，对每个LCU依据Sobel边缘检测算子计算各像素点的梯度值，获得梯度图后，将梯度图按LCU扫描顺序划分为4块；

(2)利用otsu算法计算每块的分割阈值Gfour，i=0，1，…，3(取计算得到值的0.75)，并依据该阈值判断该块内各LCU的边缘点数；

(3)依据HM中该帧图像各LCU最终划分深度将LCU的边缘点数分组(深度0和1并为一组)，分别计算各深度边缘点数的均值和标准差，剔除边缘点数目落在标准差之外的CU，重新计算，将再次计算的均值和标准差之和作为对应深度级的阈值Th_Edge，j=1，2；

(4)在统计各LCU梯度的同时，统计该帧中各CU最终划分时的RD代价，并计算各深度级的RD代价均值和标准差，获得RD代价阈值，阈值计算公式为式(4)；

(5)学习帧结束后，进入应用帧，根据步骤(3)中得到的阈值判断当前LCU的边缘点数属于哪个划分深度，获得遍历的深度范围，然后将递归过程中当前深度CU的RD代价RD与对应深度的阈值Th_RD，k=0，1，…，3进行比较，若小于阈值，则终止当前CU划分，CU最终划分深度为k。否则，深度加1，继续比较下一深度的RD代价和相应阈值，直至最大深度。然后进入下一个LCU的比较，再次执行步骤(5)。若执行到学习帧，则返回到步骤(1)。

参考资料

H.265 Terms - CTU, CU, PU, TU.知乎专栏.2024-10-22

coding tree unit解析_编码树单元.CSDN博客.2024-10-22

视频名词浅析——HEVC(H.265)编码及视频标准制定者.知乎专栏.2024-10-22