Пулинг для последовательностей
Операция пулинга
Пулинг (pooling) - операция агрегации соседних значений последовательности или активаций свёртки, которая применяется для уменьшения длины промежуточного представления последовательности. Самые популярные - это максимизирующий и усредняющий пулинг.
Максимизирующий пулинг (max pooling) агрегирует по области, возвращая максимальный элемент, как показано ниже для области из трёх соседних элементов:
Усредняющий пулинг (average pooling) агрегирует по области, возвращая среднее значение элементов области, как показано ниже также для области из трёх соседних элементов:
Если пулинг применяется к нескольким каналам (результатам действия нескольких свёрток), то он действует независимо для каждого канала:
Гиперпараметры
У пулинга отсутствуют настраиваемые параметры, но есть два гиперпараметра:
-
размер области, по которой производится агрегация (называется также размером ядра или kernel size). В примерах выше размер ядра был равен 3.
-
шаг смещения агрегируемой области для получения следующего выходного значения (stride). В примерах выше шаг был равен 3, и, как правило, его всегда выбирают равным размеру ядра.