Оценка качества языковых моделей
Языковая модель (language model) - это модель, предсказывающая вероятности появления слов или других токенов, из которых состоит текст.
В предыдущей главе мы рассмотрели языковую модель, которая с помощью рекуррентной сети генерировала текстовые данные за счёт итеративного предсказания следующих слов текста по предыдущим. В этой главе мы рассмотрим методы оценки качества работы языковых моделей, генерирующих тексты.
Для этого языковую модель применяют к реальным текстам и смотрят, насколько реальные слова текста оказываются вероятны согласно предсказанному распределению вероятностей слов, либо насколько согласовываются некоторые характеристики реальных и сгенерированных текстов.
Далее будем обозначать реальный текст как последовательность из слов: