TL;DR
6 практических ситуаций: для каждой — контекст, выбор метода, что проверять и типичная ошибка.
Контекст: Запуск оффлайн-рекламы в 5 городах из 20. Нужно оценить прирост продаж.
Unit: город. Treatment: запуск рекламы. Outcome: revenue/день.
Метод: DiD. 5 treated городов vs 15 контрольных, 8 недель до и 8 после.
Типичная ошибка: не учитывать сезонность (launch совпал с праздниками в treated городах).
Контекст: Маркетплейс повышает комиссию для категории "Электроника" с 10% до 15%. Остальные категории — контроль.
Unit: продавец-категория. Treatment: повышение комиссии. Outcome: GMV, число активных продавцов.
Метод: DiD. Но с нюансом: объявление было за 2 недели до вступления в силу.
Типичная ошибка: использовать дату вступления в силу как treatment date и получить "эффект до treatment".
Контекст: Новый UI раскатывается по 3 регионам из 12. A/B невозможен: фича влияет на все показы в регионе.
Unit: регион-день. Treatment: новый UI. Outcome: CTR, sessions/user.
Метод: Geo DiD. 3 treated региона vs 9 контрольных.
Типичная ошибка: мало кластеров (3 treated) → SE занижены, ложная значимость. Решение: randomization inference.
Контекст: Банк одобряет кредит при score ≥ 650. Нужно оценить эффект кредита на потребление.
Unit: заявитель. Treatment: получение кредита. Outcome: потребительские расходы через 6 месяцев.
Метод: Fuzzy RDD. Порог 650 резко увеличивает вероятность одобрения, но не до 100%.
Типичная ошибка: если кредитный менеджер может "подтянуть" score до 650 для знакомых — manipulation invalidates RDD.
Контекст: Конкурент закрыл сеть в одном регионе. Нужно оценить эффект на продажи ритейлера.
Unit: регион. Treatment: уход конкурента. Outcome: monthly revenue.
Метод: Synthetic Control. 1 treated регион, 25 donor-регионов, 24 месяца pre-period.
Типичная ошибка: плохой pre-fit (treated регион нетипичен), но автор всё равно интерпретирует разрыв как каузальный.
Контекст: Платформа тестирует новый рекомендательный алгоритм. Но рекомендации одного пользователя зависят от поведения других (collaborative filtering).
Unit: пользователь. Treatment: новый алгоритм. Outcome: engagement, time-on-platform.
Проблема: SUTVA нарушена. Treatment-пользователи генерируют сигналы, которые используются для рекомендаций контрольной группы.
Типичная ошибка: user-level рандомизация при сетевых эффектах → diluted treatment effect, невалидные CI.
Термины, которые уже есть в глоссарии:
Термины для добавления в глоссарий (TODO):
rdd — Regression Discontinuity Designiv — Instrumental Variablessutva — SUTVA (Stable Unit Treatment Value Assumption)parallel-trends — Parallel Trendsevent-study — Event Studypsm — Propensity Score Matchinglate — LATE (Local Average Treatment Effect)att — ATT (Average Treatment Effect on the Treated)twfe — TWFE (Two-Way Fixed Effects)