Почему качество классификации измеряют F-мерой, а не средним арифметическим от точности (precision) и полноты (recall)?
Приведите пример задачи, в которой мера precision ва жнее recall. И наоборот, где recall важнее precision.
Рассмотрим задачу ранжирования документов по релевантности поисковому запросу. Чем мера precision@K лучше и хуже меры Average Precision для оценки качества ранжирования?
Чему равна ROC-кривая и площадь под ней для случайного угадывания? Существуют ли классификаторы, дающие ещё более низкую меру AUC?
Будет ли изменяться ROC-кривая и площадь под ней после применения монотонно возрастающего преобразования к относительной дискриминантной функции классификатора?