Линейный ансамбль моделей
Для повышения точности прогнозов часто и спользуют ансамбли моделей (model ensemble), называемые также композициями моделей. Для этого используют прогнозы базовых моделей , а итоговый прогноз строят через агрегирующую модель (называемую также мета-моделью) . Таким образом, прогнозы базовых моделей выступают признаками для агрегирующей модели.
Часто используется линейная комбинация прогнозов различных моделей:
Веса этой модели настраиваются через линейную регрессию, признаками которой выступают прогнозы базовых моделей. Чтобы избежать переобучения, коэффициенты настраиваются на отдельной обучающей выборке, а не выборке, по которой настраивались параметры базовых моделей.
Построение прогнозов, агрегируя ансамбли моделей и используя при этом произвольную агрегирующую функцию, будет впоследствии рассматриваться в алгоритме стэкнига и блендинга.
Веса можно настраивать обычным способом, а можно ввести дополнитель ные требования из логики задачи:
Вместо классической L2-регуляризации мы приближаем веса к равномерным . Тогда даже для больших модель будет сдвигаться к разумной стратегии - равномерному усреднению прогнозов базовых моделей, а не к константному нулю.
Если базовые модели систематически переоценивают или недооценивают прогноз, то в агрегирующую модель можно добавить смещение , которое мы не будем подвергать регуляризации.