Линейный ансамбль моделей
Для повышения точности прогнозов часто используют ансамбли моделей (model ensemble), называемые также композициями моделей. Для этого используют прогнозы базовых моделей , а итоговый прогноз строят через агрегирующей модель (называемую также мета-моделью) . Таким образом, прогнозы базовых моделей выступают признаками для агрегирующей модели .
Часто используется линейная комбинация прогнозов различных моделей:
Веса этой модели настраиваются через линейную регрессию, признаками которой выступают прогнозы базовых моделей. Чтобы избежать переобучения коэффициенты настраиваются на отдельной обучающей выборке, а не выборке по которой настраивались параметры базовых моделей.
Веса можно настраивать обычным способом, а можно ввести дополнительные требования из логики задачи:
Вместо L2-регуляризации рекомендуется использовать приближение весов к равномерным . Тогда для больших модель будет сдвигаться к равномерному усреднению прогнозов базовых моделей, а не к константному нулю.
Если базовые модели систематически переоценивают или недооценивают прогноз, то в агрегирующую модель можно добавить смещение .