Мобильные архитектуры
Мы рассмотрели различные идеи повышения точности классификации изображений свёрточными сетями. Отметим, что более высокая то чность обеспечивалась увеличенным числом слоёв и преобразований, что требует для их применения высокопроизводительной видеокарты с большим объёмом памяти.
Однако на практике важна не только точность, но и вычислительная производительность, а также экономичность модели по памяти, которые позволяют
-
использовать модель на скромных вычислительных устройствах, таких как фотоаппарат и мобильный телефон;
-
обрабатывать большее количество пользовательских запросов за единицу времени.
Поэтому актуальна разработка так называемых мобильных архитектур (mobile architectures), не требовательных к вычислительным ресурсам.
Рассмотрим идеи повышения вычислительной эффективности на примерах популярных мобильных свёрточных архитектур.
В сети MobileNet [1] для снижения размерности вместо максимизирующего пулинга использовались свёртки с шагом (stride) 2. Вместо стандартных свёрток использовались поканальные сепарабельные свёртки (depthwise separable convolutions). Впоследствии появлялись новые версии этой модели, в которых были добавлены тождественные связи (как в ResNet).
В сети SqueezeNet [2] вообще не использовались полносвязные слои. Рейтингами классов служили выходы глобального пулинга, применённого к последнему (свёрточному) слою сети. Свёртки 3x3 заменялись суперпозицией свёрток 3x1 и 1x3.
В сети SqueezeNext [3] вначале изображение сильно сжималось свёрткой 7x7, а вся последующая обработка велась уже в сильно пониженном разрешении.
В модели ShuffleNet [4] многократно использовались групповые свёртки (grouped convolutions). Чтобы свёрточные признаки не замыкались в своих группах, а использовали всю доступную информацию, каналы периодически перемешивались.
Таким образом, мобильные архитектуры активно использовали облегчённые версии свёрток, изученные ранее. Число слоёв и число каналов в каждом слое также было существенно меньше. Использовались и другие инженерные улучшения, описанные в приведённых статьях.