Попробовать бесплатно

Корреляция и причинность

Аналитика регулярно показывает корреляции, бизнес-решения требуют причинных выводов. Между этими двумя вещами легко запутаться, и именно тут чаще всего рождаются дорогие ошибки.

Откуда берётся ложная корреляция

  • Общая причина (confounder): обе переменные зависят от третьей.
  • Обратная причинность: следствие путают с причиной.
  • Эффект отбора: данные собраны так, что связь возникла на этапе выборки.
  • Случайность: при достаточно большом числе сравнений где-то обязательно получится «значимая» связь.

Как доказать причинность

  • Рандомизированные эксперименты (A/B-тесты).
  • Естественные эксперименты и квазиэкспериментальные методы (difference-in-differences и др.).
  • Аккуратное моделирование с учётом всех известных confounder-ов.

Когда применять и когда нет

Применять

  • Перед любым выводом вида «X влияет на Y»
  • При интерпретации корреляционных карт и матриц
  • Когда хочется превратить аналитику в управленческое решение

Не применять

  • В разведочной аналитике — там корреляции часто полезны для генерации гипотез, даже если ещё нельзя говорить о причинности

Примеры применения

Аналитик заметил: клиенты, заходившие в раздел справки в первую неделю, чаще остаются на сервисе через 3 месяца. Естественный вывод — «надо чаще водить новых пользователей в справку». При ближайшем рассмотрении оказалось, что в справку чаще ходят более вовлечённые пользователи, и именно вовлечённость объясняет и заход в справку, и удержание. Принудительные показы справки в эксперименте не дали никакого эффекта на retention.

Часто задаваемые вопросы

Готовы применить теорию на практике?

Соберите команду в Shtab — единое пространство для проектов, целей и задач. Бесплатно до 5 человек.