Бутстрап.

31 заметок · 8 компаний.

Сводка по 31 заметке из AB/ с упоминанием бутстрапа. 10 «ядра» (от 10 и более упоминаний) — основные источники; остальные — контекстные ссылки.

§ 01 В чём метод

Бутстрап — непараметрический способ оценить распределение выборочной статистики, ничего не зная о её аналитической форме. Из исходной выборки n раз тянем подвыборку того же размера с возвращением, считаем нужную статистику (медиана, квантиль, ratio, разность средних — любая) — получаем эмпирическое распределение, по которому строим доверительные интервалы и проверяем гипотезы.

Ключевое: бутстрап «притворяется» генеральной совокупностью — он не добавляет информации к выборке, а только показывает изменчивость статистики при её повторном вычислении.

§ 02 Как применяют в компаниях

компанияособенность
X5 (Nazarov)Базовый бутстреп + спецкейс для временных рядов (104 упоминания в одной статье — block/sieve/residual bootstrap, почему обычный не работает); + бутстреп по объектам для ratio-метрик
VKPractitioner's Guide §3.3: Poisson bootstrap для big-data global CTR; reweighted user CTR bootstrap; сравнение с Mann-Whitney
Kuper (Mosin)«Швейцарский нож аналитика» — обобщённая функция, идеология «нет параметрических предположений»; для ratio: семплировать пользователей, а не наблюдения
Avito (Lunin)Бутстрап как универсальный аналог t-test и бутстрап-вариант CUPED; «когда формула страшная — bootstrap»
GlowbyteУчебный роадмэп для новичков, базовый алгоритм
SravniВиджет в DIY-инструментарии; бенчмарки скорости: 10M × 1000 = ~5 минут
expfБутстрап в общей теории Лоладзе + децильный метод как разновидность
OzonУпоминание в обзоре «шесть причин почему AB не работают»

§ 03 Где работает хорошо

§ 04 Подводные камни

§ 05 Связанные методы

методроль рядом с бутстрапом
Дельта-методАналитическая альтернатива для ratio-метрик: быстрее, но требует выводов; бутстрап применим к любой статистике без формул (X5, VK)
Линеаризация ratioПревращает ratio в среднюю поюзерную метрику → можно t-test без бутстрапа (Kuper)
CUPEDБутстрап используется для оценки итогового критерия после CUPED-преобразования (expf, Avito делает бутстрап-аналог CUPED)
Poisson bootstrapМасштабируемая вариация для big data, особенно для global CTR (VK, Google)
Reweighted bootstrapСемплирование с весами пропорционально активности пользователя — для глобальных метрик
Block bootstrap / sieveМодификации для временных рядов, сохраняющие структуру зависимостей (X5)
Перестановочный тестКонцептуально близок (тоже resampling), но без возвращения; альтернатива для проверки гипотез
Monte CarloБутстрап = частный случай MC; expf использует MC и для дизайна (Когда останавливать AB-тест ч.2)

§ Источники

10 ядерных заметок (≥10 упоминаний):

21 контекстных — см. grep -rlE "[Бб]утстр|[Bb]ootstrap" AB/.