Многоклассовая логистическая регрессия
Существует обобщение логистической регрессии и для решения задачи многоклассовой классификации, в которой прогнозируемая величина принадлежит одному из классов:
В этом случае вводится дополнительное преобразование поверх рейтингов классов линейного многоклассового классификатора.
Многоклассовый линейный классификатор, как известно, определяется дискриминантными функциями, измеряющими рейтинг каждого из классов:
Для компактн ости записи смещение не указано, поскольку здесь мы добавили константную единицу в число признаков.
В модели многоклассовой логистической регрессии предполагается связь с вероятностями классов через softmax-преобразование:
для каждого класса .
Как видим, SoftMax преобразование переводит -мерный вектор рейтингов классов в -мерный вектор выходов, которые
-
неотрицательны
-
и суммируются в единицу.
Таким образом, выходы SoftMax можно трактовать как вероятности классов.
Веса полученной вероятностной модели нужно оценивать методом максимального правдоподобия.
Поскольку дискриминантные функции определены с точностью до сдвига на общую функцию (обоснуйте!), то, сдвигая каждый раз найденные дискриминантные функции на , получим эквивалентный классификатор с рейтингом последнего класса равным тождественному нулю.
Поэтому, не ограничивая общности, можно сразу положить и находить только вектора весов . Число параметров модели тогда снизится с до .