<div><img src="https://mc.yandex.ru/watch/56654995" style="position:absolute; left:-9999px;" alt="" /></div>
Попробовать бесплатно

Корреляция и причинность

Аналитика регулярно показывает корреляции, бизнес-решения требуют причинных выводов. Между этими двумя вещами легко запутаться, и именно тут чаще всего рождаются дорогие ошибки.

Откуда берётся ложная корреляция

  • Общая причина (confounder): обе переменные зависят от третьей.
  • Обратная причинность: следствие путают с причиной.
  • Эффект отбора: данные собраны так, что связь возникла на этапе выборки.
  • Случайность: при достаточно большом числе сравнений где-то обязательно получится «значимая» связь.

Как доказать причинность

  • Рандомизированные эксперименты (A/B-тесты).
  • Естественные эксперименты и квазиэкспериментальные методы (difference-in-differences и др.).
  • Аккуратное моделирование с учётом всех известных confounder-ов.

Когда применять и когда нет

Применять

  • Перед любым выводом вида «X влияет на Y»
  • При интерпретации корреляционных карт и матриц
  • Когда хочется превратить аналитику в управленческое решение

Не применять

  • В разведочной аналитике — там корреляции часто полезны для генерации гипотез, даже если ещё нельзя говорить о причинности

Примеры применения

Аналитик заметил: клиенты, заходившие в раздел справки в первую неделю, чаще остаются на сервисе через 3 месяца. Естественный вывод — «надо чаще водить новых пользователей в справку». При ближайшем рассмотрении оказалось, что в справку чаще ходят более вовлечённые пользователи, и именно вовлечённость объясняет и заход в справку, и удержание. Принудительные показы справки в эксперименте не дали никакого эффекта на retention.

Часто задаваемые вопросы

Это короткое напоминание: даже если две величины тесно связаны в данных, нельзя автоматически делать вывод, что одна влияет на другую. Связь может объясняться третьей переменной, отбором данных или случайностью.

Иногда да — есть наблюдательные методы вроде difference-in-differences, regression discontinuity и причинных графов. Но они требуют аккуратной работы и понятных предпосылок. Если есть возможность поставить честный эксперимент, обычно это самый надёжный способ установить причинность.

Готовы применить теорию на практике?

Соберите команду в Shtab — единое пространство для проектов, целей и задач. Бесплатно до 5 человек.