Поточечный график
Для оценки регрессионных прогнозов на качественном уровне часто строят поточечный график (scatter plot), показывающий зависимость предсказанных откликов от реальных, то есть визуализируют множество точек
Рассмотрим следующую одномерную зависимость признака от отклика в осях :
Тогда в осях прогнозы будут выглядеть т ак:
Прогнозы тем лучше, чем они ближе к диагональной прямой .
По второму графику сразу видно, что модель систематически занижает прогнозы для малых и для больших, а для средних наоборот завышает. Это можно использовать для более тонкой настройки регрессионной модели.
По близости точек к диагонали можно судить о точности прогнозов. Также по графику легко можно идентифицировать выбросы - это будут те точки, которые сильно отклоняются от диагонали.
Подобная визуализация удобна тем, что её можно проводить для любого вида регрессии (линейной, нелинейной) и для любого количества признаков.
Если наблюдений слишком много, то вместо поточечной визуализации можно строить эмпирическое распределение плотности точек, н апример, в виде двумерной гистограммы.