Понятия и инструменты работы с данными: виды аналитики, статистические основы, A/B-тестирование, продуктовые метрики, дашборды и BI, инфраструктура данных, качество и управление данными.
ARPU — средняя выручка на пользователя. ARPPU — средняя выручка на платящего пользователя.
Совокупность процессов и инструментов сбора, хранения и визуализации данных для принятия бизнес-решений.
Количество уникальных активных пользователей за день, неделю и месяц соответственно.
Два подхода к перемещению и подготовке данных: ETL (extract-transform-load) и ELT (extract-load-transform).
Метрика, выбранная как ключевой индикатор успеха роли, команды или направления и используемая в оценке работы.
Два типа баз данных: OLTP — для быстрых транзакций продукта, OLAP — для аналитических запросов по большим объёмам данных.
Вероятность получить наблюдаемые или более экстремальные данные при условии, что между группами нет реальной разницы.
Систематическая работа с данными для понимания прошлого, прогноза будущего и принятия решений.
Последовательность наблюдений по одной величине во времени и методы её анализа: тренд, сезонность, прогноз.
Диапазон значений, в котором с заданной уверенностью лежит истинная величина параметра.
Визуальная сводка ключевых метрик, помогающая быстро понять состояние процесса или продукта.
Корреляция — связь двух величин в данных. Причинность — то, что одна величина действительно влияет на другую.
Свойство данных, при котором они полны, актуальны, точны, непротиворечивы и пригодны для принятия решений.
Числовой показатель, по которому можно отслеживать изменения и сравнивать состояние процесса во времени.
Эксперимент, в котором одновременно проверяется несколько элементов и их комбинаций, а не одно изменение.
Ответ на вопрос «что произошло»: отчёты, дашборды, регулярные срезы данных без интерпретации причин.
Опережающие индикаторы предсказывают будущий результат, запаздывающие фиксируют уже случившееся.
Ошибка I рода — признать эффект, которого нет. Ошибка II рода — не заметить реальный эффект.
Хранилище сырых данных в исходных форматах: логов, файлов, выгрузок — без жёсткой схемы.
Использование статистики и машинного обучения для прогноза будущих событий и значений метрик.
Самый верхний уровень аналитики: модели не только прогнозируют, но и рекомендуют конкретные действия с учётом ограничений.
Последовательность шагов, по которой данные двигаются от источника до конечного потребителя — отчёта, модели или системы.
Количество наблюдений, на основе которых делаются статистические выводы. Чем оно больше, тем точнее оценки.
Метод количественной оценки связи между одной зависимой переменной и одной или несколькими независимыми.