Обозначения в учебнике
Специальная терминология
-
Отклик - целевая величина, которую мы предсказываем.
-
Признак - известное свойство объекта, для которого строится прогноз.
-
Вектор признаков - все известные свойства, записанные в виде вектора.
-
Модель - функция, отображающее вектор признаков в прогнозное значение отклика по некоторому правилу.
-
Алгоритм - то же, что и модель, но с настроенными параметрами.
-
Сложность модели в учебнике обозначает выразительную гибкость или способность модели подстраиваться под обучающие данные. Если рассматривается модель с низкой сложностью, то такая модель называется простой. Не путать с вычислительной сложностью/простотой, относящейся к числу элементарных операций, необходимых для вычисления функции.
Скаляры, векторы и матрицы
-
Векторы всегда обозначают векторы-столбцы (а не строки), и обозначаются строчными буквами, такими как или . Скалярные значения (числа) обозначаются только строчными буквами, как .
-
Матрицы обозначаются заглавными буквами, такими как .
-
- неотрицательно определенная матрица .
Специальные символы
-
- -мерный вектор. В записи означает, что принадлежит множеству -мерных векторов, т.е. является -мерным вектором.
-
= для любого, например, условие, что синус никогда не превосходит единицу записывается как .
-
- вектор признаков, иногда обозначаемый как .
-
- -й объект выборки.
-
- -й признак вектора признаков .
-
- общее число признаков, называемое также размерностью признакового пространства
-
- истинное значение отклика или целевой переменной, которую мы предсказываем.
-
- предсказанное значение отклика алгоритмом.
-
- число объектов в обучающей выборке
-
- матрица объекты-признаки, в которой каждая строка - вектор признаков соответствующего объекта выборки наблюдений. Значения признака для разных объектов идет в соответствующем столбце этой матрицы.
-
- вектор откликов (желаемых ответов алгоритма), представляющий собой вектор вещественных значений для задачи регрессии и категориальный вектор для задачи классификации.
-
- число классов в классификации.
-
Классы обозначаются цифрами в многоклассовой классификации и -1,+1 в бинарной классификации (на два класса).
-
- вектор параметров модели, настраиваемый по обучающей выборке. Иногда обозначается как .
-
- оценка вектора параметров. Иногда обозначается .
-
- функция потерь на одном объекте.
-
- средние потери на обучающей выборке (эмпирический риск).
Специальные функции
-
- число элементов, например,
-
#[объектов] = число объектов,
-
#[признаков] = число признаков
-
-
- оператор положительной срезки (оставление неотрицательного значения и зануление отрицательного)
-
-
Описание алгоритмов
-
:= означает "присвоить значение". Например, присвоение переменной значения ноль записывается в виде .
-
Асимпотитческая сложность алгоритмов обозначается как . Например, сложность увеличения всех элементов -мерного вектора на единицу равна , а асимптотическая сложность увеличения на единицу всех элементов матрицы - .