Перейти к основному содержимому

Вопросы для самопроверки

  • Проинтерпретируйте по смыслу каждый элемент сингулярного разложения, применённого к матрице совстречаемости слов.
  • Для чего применяются модели Word2vec?
  • Сколько эмбеддингов строится для каждого слова в моделях Word2vec? В чём разница между этими эмбеддингами, и какие именно лучше использовать?
  • Как эффективно настроить модель skip-gram, используя негативное сэмплирование? Почему в негативном сэмплировании не следует сэмплировать отрицательные пары слов из их априорного распределения?
  • В чем преимущество модели fastText по сравнению с Word2vec?