В методе K ближайших соседей отклики ближайших соседей учитываются равномерно, с одинаковыми весами. Можно дополнительно немного повысить качество прогнозов, если позволить более близким ближайшим соседям влиять сильнее на прогноз, чем более далёким. Для этого равномерное усреднение по ближайшим соседям нужно заменить на взвешенное усреднение, где больший вес будет соответствовать более близким соседям.
В учебнике x1,x2,...,xN обозначают объекты обучающей выборки. Сейчас же пусть (x1,y1),(x2,y2),...(xK,yK) - ближайшие соседи в обучающей выборке для целевого объекта x, для которого мы строим прогноз. Причем эти соседи упорядочены по возрастанию расстояния до них:
ρ(x,x1)≤ρ(x,x2)≤...≤ρ(x,xK)
Регрессионный прогноз базового метода строится простым усреднением по откликам ближайших соседей
y(x)=K1k=1∑Kyk
Взв ешенное обобщение строится уже взвешенным усреднением откликов:
y(x)=∑k=1Kwk∑k=1Kwkyk
Аналогично в задаче классификации базовым методом вероятности классов строятся по формуле:
K1∑k=1KI[yk=1]∑k=1KI[yk=2]⋯∑k=1KI[yk=C]
Взвешенное обобщение учитывает каждого ближайшего соседа со своим весом: