Какое число уникальных значений целевой переменной может быть в задаче разметки (labeling) на C классов?
Объясните, почему в среднем эмпирический риск на обучающей выборке будет меньше, чем на тестовой?
Чем обучение с учителем отличается от обучения без учителя?
Чем отличаются параметры модели от гиперпараметров?
Объясните, зачем нужна L2 регуляризация? Её целесообразнее применять для недообученных или переобученных моделей?
Рассмотрим задачу классификации, в которой наблюдений первого класса существенно больше, чем второго. При взвешенном учёте каждого объекта вес объектов второго класса должен быть больше или меньше, чем вес объектов первого класса?
Для чего используется кросс-валидация? Какие у неё преимущества и недостатки по сравнению с использованием отдельной валидационной выборки?
В чём заключается основное предположение методов частичного обучения? Всегда ли оно выполнено на практике?