Один и тот же тест ведёт себя по-разному при разном давлении.
Эксперимент часто меняет распределение внимания, а не "создаёт ценность".
Ad load — это сколько мы "пытаемся показать". Давление — это как система фактически отбирает внимание и инвентарь. Вытеснение одного формата другим, рост частоты без учёта усталости, ограничения по доступности или latency создают давление даже при низком ad load.
Давление проявляется через механизмы: каннибализацию (переток выручки между сегментами), вытеснение (рост в одном месте ценой падения в другом), накопление усталости (краткосрочный рост через перегруз приводит к долгосрочному ущербу).
Одинаковая "победа" в тесте может означать разное для системы. Важно смотреть на total и поздние эффекты.
| Риск | Как проявляется | Как дизайн помогает |
|---|---|---|
| Shared inventory | Рост в тесте = падение в остальной системе | Смотрим total revenue + decomposition по сегментам. Фиксируем "rest of system" как guardrail. |
| Конкуренция форматов | Один формат вытесняет другой, общий эффект нейтральный | Фиксируем соседние поверхности как guardrail. Смотрим composition shift. |
| Повышение частоты | Краткосрочный рост через перегруз → долгосрочная усталость | Задаём cap на frequency и guardrail на fatigue proxy. Расширяем окно наблюдения. |
| Рост latency | Техническая деградация маскирует денежный эффект | Технические guardrails: latency, error rate, availability. Мониторим отдельно. |
| Окно слишком короткое | Раннее окно показывает рост, позднее — падение | Заранее задаём lag window и late effects window. Не принимаем решение по раннему окну. |
| Непараллельные тесты | Пересечения тестов искажают выводы | Мониторим пересечения. Используем стратификацию или последовательный запуск. |
| Сегменты разные | Разные сегменты реагируют по-разному, средний эффект вводит в заблуждение | Стратификация по сегментам. Смотрим эффект внутри каждого сегмента отдельно. |
| Метрика "красивая" | Среднее растёт, но хвосты деградируют или coverage падает | Проверяем хвосты распределений, квантили, coverage. Не только среднее. |
| Тест меняет микс | Рост за счёт композиционного сдвига, а не улучшения механизма | Смотрим composition: mix shift, quality proxies, сегменты. Разложение по слоям. |
| Рост давления | Система оптимизируется сама, эффект не устойчив | Проверяем long-term proxy: retention, fatigue, risk accumulation. Мониторим после rollout. |
Под давлением система оптимизируется сама. Эксперимент должен это учитывать.