Перейти к основному содержимому

Интерпретация логистической регрессии

Рассмотрим модель логистической регрессии для решения задачи бинарной классификации, когда y{1,+1}y\in\left\{ -1,+1\right\}. В модели предполагается, что

p(y=+1x)=11+ewTxp(y=1x)=1p(y=+1x)=11+ewTx\begin{align*} p\left(y=+1|\mathbf{x}\right) &= \frac{1}{1+e^{-\mathbf{w}^{T}\mathbf{x}}} \\ p\left(y=-1|\mathbf{x}\right) &= 1-p\left(y=+1|\mathbf{x}\right) = \frac{1}{1+e^{\mathbf{w}^{T}\mathbf{x}}} \end{align*}

Здесь также, как и для линейной регрессии, по знаку коэффициента можно судить направлении влияния признака на прогноз: признак с положительным коэффициентом увеличивает вероятность положительного класса, а признак с отрицательным коэффициентом - уменьшает.

Величину коэффициента можно проинтерпретировать следующим образом:

1+ewTx=1p(y=+1x)ewTx=1p(y=+1x)p(y=+1x)p(y=+1x)=p(y=1x)p(y=+1x)ewTx=p(y=+1x)p(y=1x)=odds ratio\begin{gathered} 1+e^{-\mathbf{w}^{T}\mathbf{x}}=\frac{1}{p\left(y=+1|\mathbf{x}\right)} \\ e^{-\mathbf{w}^{T}\mathbf{x}}=\frac{1}{p\left(y=+1|\mathbf{x}\right)}-\frac{p\left(y=+1|\mathbf{x}\right)}{p\left(y=+1|\mathbf{x}\right)}=\frac{p\left(y=-1|\mathbf{x}\right)}{p\left(y=+1|\mathbf{x}\right)}\\ e^{\mathbf{w}^{T}\mathbf{x}}=\frac{p\left(y=+1|\mathbf{x}\right)}{p\left(y=-1|\mathbf{x}\right)}=\text{odds ratio} \end{gathered}

Последняя величина (отношение вероятностей классов) называется odds ratio, и увеличение i-го признака на 1 приводит к её увеличению в ewie^{w_{i}} раз.