Квадратичный дискриминантный анализ
Квадратичный дискриминантный анализ (Quadratic Discriminant Analysis, QDA [1]) — это метод генеративной классификации, который базируется на предположении о том, что признаки каждого класса распределены согласно многомерному нормальному закону:
Каждый класс имеет свою собственную матрицу ковариации , что означает, что форма и ориентация распределения объектов каждого класса могут существенно различаться.
Дискриминантная функция
Плотность многомерного нормального распределения в рамках класса имеет вид:
Как было показано в предыдущей главе, в генеративном подходе прогноз строится через максимизацию рейтинга .
Выведем дискриминантную функцию, подставив плотность в логарифм и отбросив константу , которая не влияет на результат сравнения:
Раскроем квадратичную форму в последнем слагаемом:
Итоговое выражение для квадратичной дискриминантной функции:
Так как функция содержит слагаемое , граница между любыми двумя классами определяется множеством точек и представляет собой квадратичную поверхность.
Преимуществом метода является существование аналитического решения при настройке параметров методом максимального правдоподобия, что делает настройку модели быстрой.
Сложность модели и число параметров
QDA является достаточно гибким методом, что обусловлено большим количеством настраиваемых параметров. Для каждого класса необходимо оценить:
- априорную вероятность ( параметр);
- вектор средних ( параметров);
- симметричную матрицу ковариации ( уникальных параметров).
Суммарное число параметров модели составляет:
При большой размерности признаков количество параметров растёт квадратично, что может привести к быстрому переобучению (overfitting), особенно если данных в конкретном классе мало.
Также заметим, что необходимость обращения ковариационных матриц для каждого класса имеет вычислительную сложность .
Регуляризация
При высокой размерности признаков или малом объёме обучающей выборки выборочные ковариационные матрицы становятся плохо обусловленными (ill-conditioned) или вовсе вырожденными. В таких случаях для обеспечения устойчивости модели применяется регуляризованный дискриминантный анализ (Regularized Discriminant Analysis, RDA [1]), основанный на методе сжатия (shrinkage) оценок ковариационных матриц.
Докажите, что в случае, если количество признаков больше числа объектов (), матрица будет вырожденной, что делает невозможным вычисление обратной матрицы