新一代通用视频编码H.266/VVC:原理、标准与实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.1 色彩

1.视觉色彩感知

人类对五彩斑斓的世界的感知始于视网膜内的感光细胞,这里的光感受器由光敏感化学物质构成的神经细胞组成,它将光信号转换为大脑可理解的信号。光感受器由两类细胞组成:杆状细胞(Rods)和锥状细胞(Cones)。杆状细胞是很敏感的光探测细胞,可接收到仅由一个光子发出的微弱信号,其代价是牺牲了分辨率,杆状细胞并不能分辨细节内容,它只在光线较弱时起作用[3]

根据化学成分和对不同波长光敏感性的差异,锥状细胞可再分为3类:S锥状细胞、M锥状细胞和L锥状细胞。图2.1给出了这3类细胞对不同波长光的敏感度[4],从图中可以看出,这3类锥状细胞感光能力的峰值波长分别为440nm(蓝色光)、540nm(绿色光)、570nm(红色光)。这3类锥状细胞在可见光谱上具有重叠的通带,不同入射光对3类锥状细胞产生不同强度的激励响应,不同的激励响应组合被感知成不同的色彩[5]

图2.1 3类锥状细胞对不同波长光的敏感度[4]

入射光源可以分为照明光源和反射光源。照明光源的感知色彩直接取决于光源的光谱。反射光源是指能够反射入射光的光源,如当一束光照射到物体上时,某个波长范围内的能量被吸收,其他波长的能量被反射。因此,非光源体的感知色彩取决于入射光的光谱成分和物体吸收光谱的物理特性。虽然同一物体在不同照射光源下产生不同的反射光谱,然而人眼在不同入射光照条件下对物体颜色的感知趋于稳定,即人眼可以分辨这种由光源变化导致的物体表面反射谱的变化,这称为色彩恒定[6-7]。需要注意的是,数字相机感光色彩只与进入相机的光谱相关,因此需要采用后处理方式调整拍摄图像以达到色彩恒定。

2.三基色原理

3类锥状感光细胞的不同响应组合形成了视觉色彩感知,这意味着感知色彩只依赖3类锥状细胞的响应强度,这称为色彩视觉的三感光细胞原理[8]。虽然自然界中的光往往包含丰富的频谱分量,但其视觉感知仍与3类锥状细胞对其的响应强度有关。如果使用少量单波长入射光组合使这3类锥状细胞的响应强度与自然光引起的响应强度相同,那么其视觉感知亦相同。

实验表明,自然界中的绝大部分颜色,都可以由3种基色按一定比例混合得到;反之,任意一种颜色均可被分解为3种基色。如大多数单色光也可以分解成红、绿、蓝3种色光,这是色度学的最基本原理,即三基色原理[9]。3种基色是相互独立的,任何一种基色都不能由其他两种颜色合成。这3种基色合成的颜色范围最为广泛,红、绿、蓝按照不同的比例相加合成混色称为相加混色。

3.颜色空间

颜色空间也称彩色模型,其使用某些标准方式对颜色加以说明。本质上,彩色模型是坐标系统和子空间的阐述,位于系统中的每种颜色都由单个点表示。颜色空间从提出到现在已经有上百种,大部分只是局部不同或专用于某一领域,常用的颜色空间有RGB、YUV、YCbCr、HIS等[10-11],这里只介绍视频压缩中常用的RGB、YUV、YCbCr颜色空间。

(1)RGB颜色空间。

RGB(红绿蓝)是依据人眼识别的颜色定义出的空间,可表示大部分颜色。RGB颜色空间是图像处理中最基本、最常用、可直接面向硬件的颜色空间。我们采集得到的彩色图像,一般是被分成R、G、B加以保存的,彩色监视器的显示系统也基于该颜色空间。采用RGB颜色空间表示视频时,每个像素用3个分量表示,即R、G、B这3个色度值。需要注意的是,RGB颜色空间的分量与亮度密切相关,即只要亮度改变,3个分量都会随之相应地改变,该特性并不适用于图像处理。

(2)YUV颜色空间。

YUV颜色空间主要用于优化彩色视频信号的传输,并使其向后兼容老式黑白电视机。其中,Y表示明亮度,也就是灰阶值;而U和V表示的是色度,用于指定像素的颜色。亮度Y是通过RGB输入信号来建立的,方法是将RGB信号按特定比例叠加到一起;色度U反映的是RGB输入信号蓝色部分与信号亮度值之间的差异;色度V反映了RGB输入信号红色部分与信号亮度值之间的差异。YUV颜色空间的重要特征是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,这样表示的图像就是黑白灰度图像。彩色电视机采用YUV颜色空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题,使黑白电视机也能接收彩色电视机信号。Y′UV也是经常使用的颜色空间,其原理与YUV颜色空间相同,其中Y′为Y经过伽马校正后的值。

(3)YCbCr颜色空间。

YCbCr颜色空间与YUV颜色空间类似,其中,Y表示明亮度,Cb表示RGB输入信号蓝色部分与信号亮度值之间的差异,Cr表示RGB输入信号红色部分与信号亮度值之间的差异。YUV颜色空间过去用于表示电视系统中向后兼容的模拟彩色信息,而YCbCr颜色空间则主要应用于图像、视频编码的数字彩色信息表示,是YUV颜色空间压缩和偏移的版本。然而,目前YUV颜色空间也常用于数字彩色信息的表示,此时其与YCbCr颜色空间相同。

YCbCr颜色空间是数字视频编码源的主要表示形式。YCbCr与RGB(8比特量化深度)相互转换的公式为

4.色域

色域(Color Gamut)是指所能表达的颜色构成的范围区域,也指具体设备(如显示器、打印机等)所能表现的颜色范围。国际照明协会(International Commission on Illumination, CIE)制定了一种描述色域的方法:CIE色度图(CIE Chromaticity Diagram)[12]。CIE色度图如图2.2所示,坐标xy表示颜色空间的颜色分量,分别反映红色和绿色在RGB三基色中的比例。环绕在颜色空间边沿的颜色是光谱色,边界代表光谱色的最大饱和度,边界上的数字表示光谱色的波长,其轮廓包含所有的感知色调。所有单色光都位于舌形曲线上,这条曲线就是单色轨迹,曲线旁标注的数字是单色光(光谱色)的波长。自然界中各种实际颜色对应的点都位于这条闭合曲线内。

人眼可见的色彩包含数百万种颜色,但扫描仪、显示器或彩色打印机等显色设备只能重现其中的部分颜色,这个“子集”就是色域。人们为不同的领域制定了不同的色域标准,将这些色域标准能表现的色域范围用RGB三点连线组成的三角形区域来表示,三角形的面积越大,表示能表现的色域范围越大。ITU-R BT.709高清数字电视标准(又称Rec.709,High-Definition TeleVision, HDTV)和ITU-R BT.2020超高清数字电视标准(又称Rec.2020,Ultra-High Definition TeleVision, UHDTV)规定的色域如图2.2所示。

图2.2 CIE色度图