Causal Inference.

12 заметок · 7 компаний.

Сводка по 12 заметкам из AB/, где обсуждаются методы причинно-следственного анализа за пределами рандомизированных A/B. 6 «ядра» (≥14 упоминаний) — основные источники.

§ 01 В чём область

Causal Inference (CI) — семейство методов оценки эффекта воздействия в ситуациях, когда рандомизированный A/B невозможен или некорректен:

Базовый фреймворк — Rubin Causal Model / Potential Outcomes (PO): оцениваем разницу Y(i|t=1) − Y(i|t=0), где невозможно одновременно наблюдать обе версии у одного объекта. Альтернатива — Structural Causal Model (SCM) с графами причинности.

Главная сложность — конфаундеры: переменные, влияющие и на treatment, и на outcome. Если их не контролировать, оценка эффекта будет смещена. Решение — балансировать группы по этим переменным.

§ 02 Как применяют в компаниях

компанияособенность
HH (Kochnev)Главная методичка (93 упоминания): PO vs SCM, propensity score matching (PSM), IPW, пакеты CausalML (Uber) и DoWhy (Microsoft)
X5 (Tech)Doubly Robust модель в офлайн-ритейле: propensity score + linear regression; гарантия корректной оценки если хотя бы одна модель специфицирована верно. Эволюция за 4 года от классического A/B
X5 (балансировка)Полный обзор PSM, Exact Matching, Coarsened Exact Matching (CEM), Mahalanobis Distance Matching (MDM), IPW, регрессия как методы балансировки
X5 (Nazarov)Отдельная статья про Diff-in-Diff — интуиция, формальное изложение, когда заменяет рандомизацию
LamodaКвазиэксперимент для контент-продукта (Discovery): Simple Matching → PSM → Diff-in-Diff в комбинации
UzumCausalImpact (Google): байесовские структурные временные ряды, синтетический контрольный ряд; кейс «введение минимальной стоимости заказа»
expf (Лоладзе)Обзор семьи: DiD, Causal Impact, Jacknife estimator, PSM; концепция confounders + SUTVA
ODS (Бабаев)«Лестница доказательств причинно-следственного анализа» — позиционирует CI ниже классических A/B
CitymobilCausal Inference на стыке со switchback для сетевых эффектов

§ 03 Где работает хорошо

§ 04 Подводные камни

§ 05 Связанные методы

методроль
Propensity Score Matching (PSM)Базовая техника: оценить вероятность попадания в treatment, мэтчить по этой вероятности (HH, X5, Lamoda)
Inverse Probability Weighting (IPW)Альтернатива мэтчингу: вместо отбора — пересчёт весов; «псевдопопуляция» (HH, X5)
Diff-in-Diff (DiD)Сравнение изменений во времени между treated и control: «разность разностей»; подаётся как аналог CUPED для observational (X5 Nazarov, HH)
CausalImpact (Google)Байесовские структурные временные ряды; синтетический контроль из ковариат (Uzum, expf)
Synthetic Control Method (SCM)Раскатка на 100% → сравнение с синтетическим контролем из истории (expf)
Coarsened Exact Matching (CEM)Развитие Exact Matching: непрерывные признаки → категории, потом точное совпадение (X5)
Mahalanobis Distance Matching (MDM)Мэтчинг по расстоянию Махаланобиса (учёт ковариаций) (X5)
Doubly Robust estimationКомпозиция PSM + регрессии: корректна, если хотя бы одна спецификация верна (X5)
Jacknife estimatorLeave-one-out оценка как робастный способ агрегировать ежедневные лифты (expf)
CUPED как методТехнически разные, но HH прямо сопоставляет: DiD = аналог CUPED для observational
CausalML (Uber)Python-пакет: PSM, IPW, uplift modeling (HH)
DoWhy (Microsoft)Python-пакет: создание графа зависимостей + проверка предположений (HH)
SwitchbackАльтернатива observational для сетевых эффектов в реальном времени (Citymobil, expf)

§ Источники

6 ядерных заметок (≥14 упоминаний):

6 контекстных — см. grep -rliE "causal|квазиэксперимент|observational|diff.in.diff|propensity|matching" AB/.