Модуль 6. Instrumental Variables (IV)

TL;DR

Находим переменную Z, которая влияет на treatment D, но на outcome Y — только через D. Три условия: relevance, exclusion, independence. Оценивает LATE (для compliers).

Когда применять

What you estimate

LATE (Local Average Treatment Effect) — эффект для compliers: тех, чей treatment status меняется из-за инструмента. Не ATE (для всех), не ATT (для treated). Compliers — скрытая подгруппа, её характеристики неизвестны.

Assumptions (3 условия)

УсловиеФормальноПроверяемость
1. RelevanceCov(Z, D) ≠ 0✓ Проверяемо: F-stat first stage ≥ 10
2. ExclusionZ → Y только через D✗ Непроверяемо: нужна теория
3. IndependenceZ ⊥ ε✗ Непроверяемо: нужна теория

Дополнительно (для LATE): monotonicity — инструмент сдвигает всех в одну сторону (нет "defiers").

Diagnostics

ПроверкаЧто смотримКрасный флагЧто делать
First stage F-statF ≥ 10 в регрессии D ~ ZF < 10Слабый инструмент → LIML, AR CI, или отказ
Reduced formРегрессия Y ~ Z напрямуюНет эффекта Z на YЕсли Z не влияет на Y → нет эффекта D на Y (через Z)
Balance on ZКовариаты не коррелируют с ZКорреляция Z с XIndependence под вопросом
Over-id (Sargan/Hansen J)Согласованность инструментов (если > 1)Отвержение H₀Хотя бы один Z невалиден

Minimal estimator (2SLS)

# Two-Stage Least Squares:

# First stage:  D_i = π₀ + π₁·Z_i + v_i
# → получаем D̂_i (предсказанные значения)

# Second stage: Y_i = β₀ + β₁·D̂_i + ε_i
# → β₁ = LATE

# Wald estimator (simple IV, 1 instrument):
β_IV = Cov(Y, Z) / Cov(D, Z)
     = (Ȳ_z1 − Ȳ_z0) / (D̄_z1 − D̄_z0)

Примеры инструментов

Слабые инструменты

F < 10: оценка 2SLS смещена к OLS, CI ненадёжны. Решения: Anderson-Rubin CI (robust), LIML estimator, или честно признать, что IV неприменим. Stock & Yogo (2005): F < 10 → "weak instrument problem".

Pitfalls

What to do next

Глубже: over-identification и Sargan test

Если инструментов больше, чем эндогенных переменных — over-identified. Тест Sargan (Hansen J): проверяет, согласованы ли инструменты. Отвержение H₀ = хотя бы один невалиден. Но: низкая мощность, не указывает на конкретный инструмент.

Toy example: IV / Wald estimator

Оцениваем эффект посещения магазина (D) на покупку (Y). Инструмент (Z): дождь (0/1) — влияет на посещение, но не на покупку напрямую.

ДеньДождь (Z)Посещение (D)Покупка (Y)
10150
20145
30155
40010
5105
6108
71148
81012
# Step 1: Reduced form (Y ~ Z)
Ȳ_z0 = mean(50, 45, 55, 10) = 40.0   (без дождя)
Ȳ_z1 = mean(5, 8, 48, 12)   = 18.25  (дождь)

# Step 2: First stage (D ~ Z)
D̄_z0 = mean(1, 1, 1, 0) = 0.75  (без дождя)
D̄_z1 = mean(0, 0, 1, 0) = 0.25  (дождь)

# Step 3: Wald estimator
β_IV = (Ȳ_z0 − Ȳ_z1) / (D̄_z0 − D̄_z1)
     = (40.0 − 18.25) / (0.75 − 0.25)
     = 21.75 / 0.50 = 43.5

# LATE = 43.5 (эффект посещения на покупку для compliers)

Ожидаемый результат: β_IV = 43.5. Это LATE для compliers — людей, которые посещают магазин в хорошую погоду, но не в дождь.

Упражнения

Задача 1: три условия

Инструмент: расстояние от дома до спортзала. Treatment: посещение спортзала. Outcome: здоровье. Проверьте три условия валидности.

Решение

Relevance: ✓ Ближе к залу → чаще ходят (проверяемо, F-stat). Exclusion: ⚠ Сомнительно. Расстояние коррелирует с районом → качество воздуха, парки, инфраструктура → напрямую влияет на здоровье. Exclusion restriction скорее всего нарушена. Independence: ⚠ Сомнительно. Здоровые люди могут выбирать жильё ближе к залу (selection). Z не случаен. Вывод: инструмент, скорее всего, невалиден.

Задача 2: weak instrument

IV regression: first stage F = 4.2, β_IV = +25%, SE = 18%. Что делать?

Решение

F = 4.2 < 10 → слабый инструмент. Оценка β_IV = +25% ненадёжна (смещена к OLS). SE тоже ненадёжны. Действия: (1) построить Anderson-Rubin CI (robust к weak IV), (2) попробовать LIML, (3) если AR CI = [−10%, +60%] — эффект не идентифицирован, нужен другой инструмент или дизайн.