Иллюстрация работы градиентного бустинга по шагам
Рассмотрим визуализацию работы градиентного бустинга:
Gm(x)=f0(x)+εf1(x)+εf2(x)+...+εfm(x),
m=1,2,3,...,
где
-
f0(x)≡0;
-
f1(x),f2(x),... - решающие деревья глубины 3;
-
ε=0.3.
Для простоты визуализации рассмотрим двум ерное признаковое пространство
x=[x1,x2]
Будем строить целевую зависимость y(x) и текущее приближение Gm(x) на левом графике, а ошибку y(x)−Gm(x) и следующую базовую модель fm+1(x) - на правом.
m=0:

m=1:

m=2:

m=3:

m=4:

m=5:

m=6:

m=7:

m=8:

m=9:

m=10:

Как видим, с ростом m отклонение прогноза от истинного значения уменьшается и становится более шумным. Скачки в ошибке возникают на местах разбиения признакового пространства узлами деревьев.
Результаты работы были получены, используя интерактивный визуализатор Алексея Рогожникова [1], в котором можно отобразить работу бустинга и при других пользовательских настройках.
Литература
- Brilliantly wrong: Gradient Boosting explained.