В какой работе впервые были предложены групповые свёртки? Чем была вызвана необходимость их использования?
Сколько свёрток с пространственным размером ядра 3x3 нужно последовательно применить, чтобы получить признаки, зависящие от областей 9x9 пикселей исходного изображения?
Чем мотивирована структура incepion-блоков в сети GoogleNet?
Чем мотивирована структура ResNet-блоков в сети ResNet?
В какой архитектуре было предложено использовалась больше 100 слоёв?
Назовите приёмы, позволяющие снижать число параметров и повышать экономичность расчётов в свёрточных нейросетях.