Регуляризация весов нейросети
Идея
Вместо того, чтобы жёстко упрощать модель, исключая лишние признаки, нейроны и целые слои, можно упрощать модель мягко, добавляя в функцию потерь регуляризацию, штрафующую веса по их абсолютной величине.
Пусть - вектора признаков всех объектов обучающей выборки, а Y - вектор их откликов (целевых значений), как вводилось ранее.
Чаще всего используется L2-регуляризация (называемая weight decay):
либо -регуляризация: