Значения Шепли
Значения Шепли (Shapley values) позволяют объяснить для каждого объекта вклад значения каждого признака в прогноз модели . Т.е. оценка производится для конкретного объекта и конкретного значения выбранного признака. Вклад значений всех признаков и обеспечивает результирующий прогноз.
Рассмотрим в качестве примера задачу Titanic, в которой по описанию каждого пассажира (включающую класс билета, пол, возраст и т.д.) нужно предсказать, выжил он в результате кораблекрушения или нет. На рисунке ниже (источник) показано объяснение прогнозируемой вероятности выживания для одного из пассажиров.
Видно, что высокая вероятность прогнозируемого выживания 0.93 была обеспечивается тем, что пассажир - женщина, которая не путешествовала третьим классом. Однако то, что она не путешествовала первым классом (в one-hot кодировании индикаторы класса-разные признаки) несколько снизило оцениваемую вероятность выжить.
Для расчёта вклада значения -го признака в прогноз на объекте значение Шепли приближённо вычисляется по следующей формуле:
где - число повторов (чем выше, тем точнее оценка), - случайный объект из выборки, а версии , в кото рых для одинакового случайного подмножества признаков вместо исходных значений из подставлены значения признаков из , при этом
-
в -й признак равен (исходное значение)
-
в - -й признак равен (подставлен из )
По сути, происходит оценка, насколько в среднем вырастает прогноз, если оставить и заменить интересующее значение признака случайным значением из выборки при одновременной замене случайного подмножества других признаков. В итоге получим среднюю прибавку к прогнозу за счёт того, что интересующий признак принимает заданное значение.
Таким образом, значения Шепли оценивают важность признаков в контексте заданного объекта , а сумма их значений равна отклонению прогноза от среднего прогноза по всем объектам.
Недостатком метода, как и перестановочно й важности признаков, является усреднение по малореальным объектам, поскольку в процедуре оценки генерируются синтетические объекты, для которых часть значений признаков взята из одного объекта, а другая часть - из другого, что может приводить к маловероятным комбинациям признаков, особенно когда признаки сильно скоррелированы.
С помощью значений Шепли можно вычислить и глобальную важность каждого признака. Для этого абсолютные значения Шепли для интересуемого признака усредняются по всем объектам выборки:
Детальнее о значениях Шепли, их теоретическом обосновании и свойствах можно прочитать здесь.