Нормализация свёрточных слоёв
Для повышения устойчивости и скорости настройки свёрточной нейросети применяется нормализация свёрточных слоёв (convolutional layer normalization).
Эта нормализация несколько отличается от батч-нормализации и нормализации слоя в многослойном персептроне, учитывая специфику обработки пространственных данных на изображениях.
Особенностью свёрточного слоя является то, что свёртка извлекает один и тот же признак в разных локациях на изображении. Таким образом, применив свёртку, мы получаем карту пространственной размерности значений одного и того же признака, где - высота, а - ширина карты признаков. Применив свёрток, мы получим реализаций каждого из признаков, извлекаемых каждой свёрткой.
Настройка параметров нейросети производится мини-батчами из изображений.
Таким образом, внутреннее представление изображений мини-батча можно представить в виде тензора размера , как показано на рисунке слева, а основные виды нормализации свёрточных слоёв (batch norm, instance norm, layer norm) - справа [1]:
Каждый тип нормализации задаётся одной и той же формулой, перевзвешивающей активации каналов :