Корреляция и причинность
Аналитика регулярно показывает корреляции, бизнес-решения требуют причинных выводов. Между этими двумя вещами легко запутаться, и именно тут чаще всего рождаются дорогие ошибки.
Откуда берётся ложная корреляция
- Общая причина (confounder): обе переменные зависят от третьей.
- Обратная причинность: следствие путают с причиной.
- Эффект отбора: данные собраны так, что связь возникла на этапе выборки.
- Случайность: при достаточно большом числе сравнений где-то обязательно получится «значимая» связь.
Как доказать причинность
- Рандомизированные эксперименты (A/B-тесты).
- Естественные эксперименты и квазиэкспериментальные методы (difference-in-differences и др.).
- Аккуратное моделирование с учётом всех известных confounder-ов.
Когда применять и когда нет
Применять
- Перед любым выводом вида «X влияет на Y»
- При интерпретации корреляционных карт и матриц
- Когда хочется превратить аналитику в управленческое решение
Не применять
- В разведочной аналитике — там корреляции часто полезны для генерации гипотез, даже если ещё нельзя говорить о причинности
Примеры применения
Аналитик заметил: клиенты, заходившие в раздел справки в первую неделю, чаще остаются на сервисе через 3 месяца. Естественный вывод — «надо чаще водить новых пользователей в справку». При ближайшем рассмотрении оказалось, что в справку чаще ходят более вовлечённые пользователи, и именно вовлечённость объясняет и заход в справку, и удержание. Принудительные показы справки в эксперименте не дали никакого эффекта на retention.
Часто задаваемые вопросы
Это короткое напоминание: даже если две величины тесно связаны в данных, нельзя автоматически делать вывод, что одна влияет на другую. Связь может объясняться третьей переменной, отбором данных или случайностью.
Иногда да — есть наблюдательные методы вроде difference-in-differences, regression discontinuity и причинных графов. Но они требуют аккуратной работы и понятных предпосылок. Если есть возможность поставить честный эксперимент, обычно это самый надёжный способ установить причинность.