📊 Метрики качества в задаче мультиклассовой классификации [2/2]🎯 Расширяя ваш кругозор в решении задачи
мультиклассовой классификации из
первой части, сегодня поговорим про то, как в подобных задачах правильно
оценивать качество работы нашей модели.
☑️ Метрики, используемые для оценки качества модели в задачах с
множеством классов, никак не отличаются от задачи с бинарными метками: все также используется
Accuracy,
Recall,
Precision,
F1-measure,
ROC-AUC.
Однако, из-за наличия нескольких классов меняется подход к их расчету, где существует:
micro-усреднение,
macro-усреднение и
weighted-усреднение.
Разберем каждый по порядку:
1.
Micro-average:
Означает долю верных срабатываний по всем классам, что аналогично метрике
accuracy. Потому
micro-усреднение любой метрики будет выдавать одинаковое значение равное
accuracy.
Подходит, когда важно общее количество правильных предсказаний без учета дисбаланса классов.
2.
Macro-average:
Вычисляет конкретную метрику, например,
recall для каждого класса отдельно и затем берет среднее арифметическое, что и будет финальной величиной метрики по
macro-усреднению. Работает аналогично для любой другой метрики классификации.
Подходит для оценки производительности модели одинаково по всем классам, независимо от дисбаланса классов в датасете.
3.
Weighted-average:
Также вычисляет целевую метрику для каждого класса отдельно, как в
п.2, но усреднение происходит по
взвешенному способу, в зависимости от количества объектов в каждом классе.
Применяется, когда классы несбалансированы и важно учесть их численность в итоговой оценке.
❗️Чтобы поменять подход к расчету метрики в
sklearn, требуется использовать параметр
average (default="
binary"), передав в него один из следующих аргументов
{‘micro’, ‘macro’, ‘samples’, ‘weighted’, ‘binary’}:
from sklearn.metrics import precision_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]
precision_score(y_true, y_pred, average='macro’)
# Output: 0.22...
📚 В каких местах ещё можно погрузиться в эту тему:- База по метрикам в любых задачах, включая по multiclass, от
ЯндексУчебника- Отличная
визуализация принципов усреднения различных F-мер для нескольких классов
- Про все разновидности метрик классификации читай
тут- Очень доступное объяснение на русском языке для новичков на
YouTube- Обширная
лекция по метрикам качества в многоклассовой задаче
Ставьте
❤️ и
🔥 если данная информация была вам полезна!
Пишите свои комментарии и вопросы под постом
👇