Интерпретация логистической регрессии
Рассмотрим модель логистической регрессии для решения задачи бинарной классификации, когда y∈{−1,+1}. В модели предполагается, что
p(y=+1∣x)p(y=−1∣x)=1+e−wTx1=1−p(y=+1∣x)=1+ewTx1
Здесь также, как и для линейной регрессии, по знаку коэффициента можно судить направлении влияния признака на прогноз: признак с положительным коэффициентом увеличивает вероятность положительного класса, а признак с отрицательным коэффициентом - уменьшает.
Величину коэффициента можно проинтерпретировать следующим образом:
1+e−wTx=p(y=+1∣x)1e−wTx=p(y=+1∣x)1−p(y=+1∣x)p(y=+1∣x)=p(y=+1∣x)p(y=−1∣x)ewTx=p(y=−1∣x)p(y=+1∣x)=odds ratio
Последняя величина (отношение вероятностей классов) называется odds ratio, и увеличение i-го признака на 1 приводит к её увеличению в ewi раз.