Предсказательная аналитика
Предсказательная аналитика — следующий шаг после описательной и диагностической. Она требует чистых данных, понятной целевой переменной и грамотной валидации моделей.
Типичные задачи
- Прогноз спроса, продаж, остатков на складе.
- Оценка вероятности оттока клиентов (churn prediction).
- Скоринг лидов, кредитов, страховых рисков.
- Обнаружение аномалий и мошеннических операций.
Где особенно осторожно
- Модель учится на прошлом — если поведение клиентов резко поменялось, прогноз ломается.
- Качество всегда измеряется на отложенной выборке, а не на обучающей.
- Цена ошибки разных типов часто несимметрична: пропустить мошенника обычно дороже, чем заподозрить честного клиента.
Когда применять и когда нет
Применять
- Описательная аналитика уже на месте и данные надёжны
- Задача про будущее имеет понятную целевую переменную
- Есть кому поддерживать модель в продакшне и обновлять её на свежих данных
Не применять
- Данные грязные или их слишком мало
- Задача требует чёткого объяснения каждого решения регулятору или клиенту
- Нет ресурсов на поддержку модели и она быстро устареет
Примеры применения
Интернет-магазин строит модель прогноза спроса по SKU на следующие 2 недели. На исторических данных за два года модель предсказывает заказы с точностью ±15% по большинству позиций. Закупки и логистика начинают опираться на прогноз, остатки на складе падают на 20%, при этом доля отказов «нет в наличии» снижается. На уровне витрины пользователь ничего не видит, но юнит-экономика заметно улучшается.
Часто задаваемые вопросы
ML — основной инструмент предсказательной аналитики, но не равен ей. Предсказательная аналитика — это конкретный класс бизнес-задач (прогноз), а ML — широкий набор методов, который их решает. Внутри предсказательной аналитики бывают и не-ML подходы: статистические модели, эконометрика, прямой расчёт по эмпирическим формулам.
Зависит от того, как быстро меняется поведение, которое она предсказывает. В рознице — иногда ежедневно. В B2B-моделях оттока — раз в месяц или квартал. Сигнал к переобучению — заметное падение качества на свежих данных.