Заключение
Учебник дорабатывается, периодически могут появляться новые темы и улучшаться описания существующих. Обновления учебника вы можете отслеживать в телеграм-канале проекта.
Вы ознакомились с основными задачами, понятиями и моделями машинного обучения. Изучили, какие базовые предположения лежат в основе каждой модели, какие гиперпараметры нужно специфицировать, и на что они влияют. Научились строить прогнозы с помощью не одной модели, а целого набора, а также интерпретировать модели и оценивать их качество.
Анализ данных и машинное обучение - практические области, поэтому настоятельно советуем дополнить полученные теоретические знания практическими навыками. Для этого рекомендуется изучить одну из самых популярных библиотек на питоне scikit-learn по отличной документации [1] с объяснением и примерами использования основных методов. Существует и неофициальный перевод этой документации на русский язык [2], правда, для более старой версии.
Рекомендуем ознакомиться с сайтом kaggle.com, на котором регулярно выкладываются прикладные задачи машинного обучения из разных областей с необходимыми данными, а также поучаствовать в kaggle-соревнованиях [3]. Это даст вам практические навыки работы с данными и опыт решения реальных задач! При этом стоит активно пользоваться форумом, на котором участники обсуждают задачу (раздел Discussion) и делятся своими решениями (раздел Code). Стоит отметить, что сайт содержит и собственные обучающие материалы [4] по практической работе с данными.
На этом ваше путешествие в мир машинного обучения на нашем сайте не заканчивается! В задачах машинного обучения всё больше начинают доминировать нейросети, позволяющие эффективно обрабатывать сложные и многомерные типы данных, такие как изображения, тексты и графы. Поэтому приглашаем прочитать второй учебник, посвящённый нейросетям.
Желаем успехов!