Мобильные архитектуры

Мы рассмотрели различные идеи повышения точности классификации изображений свёрточными сетями. Отметим, что более высокая точность обеспечивалась увеличенным числом слоёв и преобразований, что требует для их применения высокопроизводительной видеокарты с большим объёмом памяти.

Однако на практике важна не только точность, но и вычислительная производительность, а также экономичность модели по памяти, которые позволяют

использовать модель на скромных вычислительных устройствах, таких как фотоаппарат и мобильный телефон;
обрабатывать большее количество пользовательских запросов за единицу времени.

Поэтому актуальна разработка так называемых мобильных архитектур (mobile architectures), не требовательных к вычислительным ресурсам.

Рассмотрим идеи повышения вычислительной эффективности на примерах популярных мобильных свёрточных архитектур.

В сети MobileNet [1] для снижения размерности вместо максимизирующего пулинга использовались свёртки с шагом (stride) 2. Вместо стандартных свёрток использовались поканальные сепарабельные свёртки (depthwise separable convolutions). Впоследствии появлялись новые версии этой модели, в которых были добавлены тождественные связи (как в ResNet).

В сети SqueezeNet [2] вообще не использовались полносвязные слои. Рейтингами классов служили выходы глобального пулинга, применённого к последнему (свёрточному) слою сети. Свёртки 3x3 заменялись суперпозицией свёрток 3x1 и 1x3.

В сети SqueezeNext [3] вначале изображение сильно сжималось свёрткой 7x7, а вся последующая обработка велась уже в сильно пониженном разрешении.

В модели ShuffleNet [4] многократно использовались групповые свёртки (grouped convolutions). Чтобы свёрточные признаки не замыкались в своих группах, а использовали всю доступную информацию, каналы периодически перемешивались.

Таким образом, мобильные архитектуры активно использовали облегчённые версии свёрток, изученные ранее. Число слоёв и число каналов в каждом слое также было существенно меньше. Использовались и другие инженерные улучшения, описанные в приведённых статьях.

Мобильные архитектуры

Литература​

Литература