Перейти к основному содержимому

Вопросы для самопроверки

  • Может ли качество бустинга устойчиво снижаться при выборе слишком большого числа базовых моделей?
  • Имеет ли смысл в качестве базовых моделей бустинга использовать только линейные модели? Почему?
  • В качестве базовых моделей бустинга следует использовать простые или сложные модели (в терминах их гибкости подстройки под данные)? Почему?
  • Каждая следующая модель бустинга снижает смещение или разброс (в терминах разложения ошибки на смещение и разброс)?
  • Почему нельзя строить бустинг только над линейными моделями?
  • Насколько устойчивым к наличию выбросов будет получаться решение, найденное алгоритмом AdaBoost?
  • Следует выбирать модели градиентного бустинга так, чтобы их прогнозы оказывались как можно более похожими или непохожими? Какие приёмы позволяют этого добиться?