Перейти к основному содержимому

Вопросы для самопроверки

  • Какое число уникальных значений целевой переменной может быть в задаче разметки (labeling) на CC классов?
  • Объясните, почему в среднем эмпирический риск на обучающей выборке будет меньше, чем на тестовой?
  • Чем обучение с учителем отличается от обучения без учителя?
  • Чем отличаются параметры модели от гиперпараметров?
  • Объясните, зачем нужна L2 регуляризация? Её целесообразнее применять для недообученных или переобученных моделей?
  • Рассмотрим задачу классификации, в которой наблюдений первого класса существенно больше, чем второго. При взвешенном учёте каждого объекта вес объектов второго класса должен быть больше или меньше, чем вес объектов первого класса?
  • Для чего используется кросс-валидация? Какие у неё преимущества и недостатки по сравнению с использованием отдельной валидационной выборки?
  • В чём заключается основное предположение методов частичного обучения? Всегда ли оно выполнено на практике?