Поточечный график
Для визуализации качества регрессионных прогнозов строят поточечный график (scatter plot), показывающий зависимость предсказанных откликов от реальных, то есть визуализируют множество точек
Прогнозы будут тем лучше, чем ближе они будут лежать к диагональной прямой .
Рассмотрим следующую одномерную зависимость признака от отклика в осях :
Тогда в осях прогнозы будут выглядеть так:
По второму графику сразу видно, что модель систематически занижает прогнозы для малых и для больших, а для средних наоборот завышает. Это можно использовать для более тонкой настройки регрессионной модели.
По близости точек к диагонали можно судить о точности прогнозов. Также по графику легко можно идентифицировать выбросы - это будут те точки, которые сильно отклоняются от диагонали.
Если наблюдений слишком много, то вместо поточечной визуализации можно строить эмпирическое распределение плотности точек, например, в виде двумерной гистограммы.