Линейный дискриминантный анализ (Linear Discriminant Analysis, LDA) — это упрощённая модель квадратичного дискриминантного анализа при предположении, что все классы распределены нормально с общей ковариационной матрицейΣ:
p(x∣y)=(2π)D/2∣Σ∣1/21exp(−21(x−μy)TΣ−1(x−μy))
где D — размерность пространства признаков.
Геометрический смысл
Общность ковариационной матрицы означает, что распределение точек всех классов имеют идентичную форму и ориентацию, а различаются распределения только положением своих центров μy.
Отбрасывая общее для всех gy(x) слагаемое −2Dln(2π)−21ln∣Σ∣, получаем окончательный вид дискриминантных функций:
gy(x)=−21(x−μy)TΣ−1(x−μy)+lnp(y)
Геометрический смысл прогнозов
Из вида дискриминантной функции видно, что построение прогнозов методом LDA можно интерпретировать как переход в новое декоррелированное пространство признаковx′=Σ−1/2x, где множество объектов становится сферическим, после чего объект в обновлённом пространстве относится к классу с ближайшим центроидомμy с поправкой на частотность каждого класса.
Действительно, представив обратную ковариационную матрицу как квадрат из её корня Σ−1=(Σ−1/2)TΣ−1/2 получим:
В отличие от QDA, где количество параметров растёт как O(C⋅D2), в LDA мы оцениваем только одну ковариационную матрицу, общую для всех классов, поэтому число параметров растёт как O(D2).
Это делает метод более простым и менее склонным к переобучению, по сравнению с QDA. Общая ковариационная матрица менее склонна к вырождению, чем матрицы отдельных классов в QDA, особенно, когда есть классы, содержащие мало наблюдений.
Тем не менее, для большого числа признаков и малого числа наблюдений либо в случае линейной зависимости признаков даже общая ковариационная матрица может вырождаться или быть плохо обусловленной.
В таких случаях применяют регуляризацию, смешивая ковариационную матрицу с единичной матрицей:
Σ^reg=(1−α)Σ^+ασ2I
где α — гиперпараметр регуляризации, а σ2=tr(Σ^)/D — средняя дисперсия всех признаков.
С примерами использования методов QDA и LDA в библиотеке scikit-learn можно ознакомиться в [3] и [4].