Перейти к основному содержимому

Интерпретация метрических методов

Метод K ближайших соседей

В методе K ближайших соседей для нового объекта x\mathbf{x} ищется KK ближайших объектов в обучающей выборке, а в качестве прогноза выдаётся среднее значение откликов для этих объектов.

Этот метод является интерпретируемым, поскольку для обоснования того или иного прогноза достаточно просто посмотреть на отклики ближайших объектов.

Например, при классификации можно ли пациенту с заданным диагнозом и другими характеристиками проводить операцию, или нет, метод может обосновать своё решение - например, операцию пациенту проводить можно, поскольку этот пациент очень похож на Иванова, Петрова и Сидорова из обучающей выборки, которым операцию провели, и они благополучно пошли на поправку.

Метод ближайших центроидов

Метод ближайших центроидов идейно похож на метод ближайших соседей, но применим только к задаче классификации. Вначале для каждого класса вычисляется характерный представитель этого класса (центроид) простым усреднением по объектам заданного класса. Затем для нового объекта x\mathbf{x} сопоставляется тот класс, расстояние до центроида которого меньше всего.

Идея построения прогноза легка для восприятия. Сложности с интерпретацией могут возникнуть лишь в том, что при усреднении объектов может возникнуть нереалистичный объект (например, если объект-пациент больницы, то можем усреднить людей разного пола, возраста и с разными несочетаемыми симптомами). В этом случае центроиды можно заменить на ближайшие к ним реальные объекты обучающей выборки (примеры реальных людей), а если множество объектов одного класса невыпуклой формы, то можно доработать метод таким образом, чтобы каждый класс представлялся не одним, а сразу несколькими репрезентативными объектами.