Перейти к основному содержимому

Представление изображений

Черно-белые изображения

Изображения бывают цветные и одноцветные. Одноцветное изображение содержит градации одного цвета, как правило градации серого, поэтому в дальнейшем такие изображения будем называть чёрно-белыми. Такие изображения представляются в виде матрицы интенсивностей пикселей размера H×WH\times W, где HH - высота, а WW - ширина изображения:

Представления цветов

Представление в RGB

Для представления цветного изображения используется свойство, что любой цвет может быть представлен как сочетание базисных цветов: красного (red), зелёного (green) и синего (blue). Такое представление цвета называется RGB представлением, и если присмотреться вблизи к экрану старых телевизоров, то можно увидеть, что каждый пиксель состоит из трёх, светящих красным, зелёным и синим цветом.

Представление в CIELab

В цветовом представлении CIELab (Lab, Luv) цвет также представляется в виде сочетания трёх компонент:

  • L-luminance (яркость)

  • (a,b) - цвет

Визуализация (a,b) пространства показана ниже для двух значений яркости L [1]:

Разделение на яркость и цвет позволяет легко варьировать яркость и контраст изображений, не изменяя цвета. Также это представление выбрано таким образом, чтобы величина Евклидового расстояния 2-мя между цветами (L1,a1,b1)(L_1,a_1,b_1) и (L2,a2,b2)(L_2,a_2,b_2) линейно соответствовала воспринимаемой человеческим глазом разнице в цветах (для RGB - не так).

Представление изображения в CIELab формате позволяет нейросетям работать инвариантно

  • к освещенности (если обрабатывать только a,b компоненты)

  • инвариантно к цвету (если обрабатывать только L компоненту)

Например, классификация растений должна быть инвариантна к освещенности, если получаем кадры в разное время суток. А классификация марок машин не должна зависеть от цвета, который может быть любым, а должна определяться только контурами автомобиля в пространстве яркости L.

Представление HCL

Цветовое представление HCL кодирует каждый цвет ещё более интерпретируемыми компонентами:

  • цвет (hue)

  • насыщенность цвета (chroma)

  • яркость (lightness)

Пространство HCL визуализируется следующим образом [2]:

Это пространство позволяет обучать модели, работающие инвариантно к цвету, яркости и насыщенности.

Существует также популярное цветовое представление CYMK, которое мы не будем рассматривать, т.к. оно используется в издательском деле.

Представление цветных изображений

Цветное изображение представляется тензором размера 3×H×W3\times H\times W, т.е. трём конкатенированным матрицам размера H×WH\times W, определяющих карты интенсивностей каждого из трёх каналов, которым представляется цвет (RGB, Lab, HCL). Например, для RGB представления каждая матрица задаёт карту интенсивностей красного, зелёного и синего цветов, как показано на рисунке:

Литература

  1. https://ru.wikipedia.org/wiki/LAB

  2. https://www.freepng.ru/download/цветовая-система-манселла.html