Перейти к основному содержимому

Эмбеддинги слов и параграфов

В этом разделе вы изучите классические способы представления слов текста в виде вещественных векторов фиксированной длины (эмбеддингов). Это важно для нейросетевой обработки текста, поскольку нейросетевые модели не умеют работать с категориальными объектами (такими, как слова), зато отлично справляются с обработкой вещественных векторов. Изученные методы применимы не только для представления слов в тексте, но и для представления любых дискретных объектов в последовательностях (нуклеотидов в последовательности ДНК, действий пользователя на сайте, товаров, купленных в интернет-магазине и т.д.)