Перейти к основному содержимому

Обозначения в учебнике

Специальная терминология

  • Отклик - целевая величина, которую мы предсказываем.

  • Признак - известное свойство объекта, для которого строится прогноз.

  • Вектор признаков - все известные свойства, записанные в виде вектора.

  • Модель - функция, отображающее вектор признаков в прогнозное значение отклика по некоторому правилу.

  • Алгоритм - то же, что и модель, но с настроенными параметрами.

  • Сложность модели в учебнике обозначает выразительную гибкость или способность модели подстраиваться под обучающие данные. Если рассматривается модель с низкой сложностью, то такая модель называется простой. Не путать с вычислительной сложностью/простотой, относящейся к числу элементарных операций, необходимых для вычисления функции.

Скаляры, векторы и матрицы

  • Векторы всегда обозначают векторы-столбцы (а не строки), и обозначаются строчными буквами, такими как xx или x\mathbf{x}. Скалярные значения (числа) обозначаются только строчными буквами, как w0w_0.

  • Матрицы обозначаются заглавными буквами, такими как AA.

  • A0A\succcurlyeq0 - неотрицательно определенная матрица AA.

Специальные символы

  • RD\mathbb{R}^D - DD-мерный вектор. В записи xRDx\in\mathbb{R}^D означает, что xx принадлежит множеству DD-мерных векторов, т.е. является DD-мерным вектором.

  • \forall = для любого, например, условие, что синус никогда не превосходит единицу записывается как sin(x)1  x\sin(x)\le 1 \;\forall x.

  • xRD\mathbf{x}\in \mathbb{R}^D - вектор признаков, иногда обозначаемый как xx.

  • xi\mathbf{x}_i - ii-й объект выборки.

  • xjx^j - jj-й признак вектора признаков x\mathbf{x}.

  • DD - общее число признаков, называемое также размерностью признакового пространства

  • yy - истинное значение отклика или целевой переменной, которую мы предсказываем.

  • y^\hat{y} - предсказанное значение отклика алгоритмом.

  • NN - число объектов в обучающей выборке

  • XRN×DX\in\mathbb{R}^{N \times D} - матрица объекты-признаки, в которой каждая строка - вектор признаков соответствующего объекта выборки наблюдений. Значения признака для разных объектов идет в соответствующем столбце этой матрицы.

  • YRNY\in\mathbb{R}^{N} - вектор откликов (желаемых ответов алгоритма), представляющий собой вектор вещественных значений для задачи регрессии и категориальный вектор для задачи классификации.

  • CC - число классов в классификации.

  • Классы обозначаются цифрами 1,2,...C1,2,...C в многоклассовой классификации и -1,+1 в бинарной классификации (на два класса).

  • w\mathbf{w} - вектор параметров модели, настраиваемый по обучающей выборке. Иногда обозначается как ww.

  • w^\hat{\mathbf{w}} - оценка вектора параметров. Иногда обозначается w^\hat{w}.

  • L(y^,y)\mathcal{L}(\hat{y},y) - функция потерь на одном объекте.

  • L(w)=1Nn=1NL(y^n,yn)L(\mathbf{w})=\frac{1}{N}\sum_{n=1}^{N}\mathcal{L}(\hat{y}_n,y_{n}) - средние потери на обучающей выборке (эмпирический риск).

Специальные функции

  • #[]\#[\cdot] - число элементов, например,

    • #[объектов] = число объектов,

    • #[признаков] = число признаков

  • [z]+=max{z,0}[z]_{+}=\max\{z,0\} - оператор положительной срезки (оставление неотрицательного значения и зануление отрицательного)

  • I[условие]={1,если условие выполнено0,если условие не выполнено\mathbb{I}[\text{условие}]=\begin{cases} 1, & \text{если условие выполнено}\\ 0, & \text{если условие не выполнено} \end{cases}

  • sign(x)={1,x01,x<0sign(x)=\begin{cases} 1, & x\ge0\\ -1, & x<0 \end{cases}

Описание алгоритмов

  • := означает "присвоить значение". Например, присвоение переменной tt значения ноль записывается в виде t:=0t:=0.

  • Асимпотитческая сложность алгоритмов обозначается как O()O(\cdot). Например, сложность увеличения всех элементов nn-мерного вектора на единицу равна O(n)O(n), а асимптотическая сложность увеличения на единицу всех элементов матрицы n×nn \times n - O(n2)O(n^2).