Перейти к основному содержимому

Вопросы для самопроверки

  • Может ли качество бустинга устойчиво снижаться при выборе слишком большого числа базовых моделей?
  • Имеет ли смысл в качестве базовых моделей бустинга использовать только модели линейной регрессии? Почему?
  • В качестве базовых моделей бустинга следует использовать простые или сложные модели (в терминах их гибкости подстройки под данные)? Почему?
  • Насколько устойчивым к наличию выбросов будет получаться решение, найденное алгоритмом AdaBoost?
  • Следует выбирать модели градиентного бустинга так, чтобы их прогнозы оказывались как можно более похожими или непохожими? Какой приём позволяет этого добиться?
  • Объясните, почему приём shrinkage приводит к повышению точности прогнозов? Какой у него есть недостаток?
  • На какую обучающую выборку будет настраиваться базовая модель градиентного бустинга при решении задачи классификации с логистическими потерями?