← На главную

Инциденты: диагностика монетизации

Сначала локализуй слой. Потом трогай рычаг.

Инцидент — это не "упала выручка", а "сломался слой механизма". Выручка — это итог, который складывается из нескольких слоёв: спрос, предложение, доставка, давление.

Порядок действий: локализация слоя → проверка целостности → оценка масштаба → решение → мониторинг восстановления.

Основной принцип: не лечить деньги, лечить слой. Если выручка просела, нужно найти, какой множитель в формуле сломался первым.

4 слоя, где обычно ломается
Слой A: Demand (аукцион/цена внимания)
Типичные симптомы: CPM падает, конкуренция снижается, аукцион пустеет.
Быстрая проверка: CPM динамика, fill rate, доступность ответов, сезонность.
Слой B: Supply (инвентарь/возможности)
Типичные симптомы: Inventory падает, coverage сжимается, show opportunities уменьшаются.
Быстрая проверка: Inventory per user, coverage, доступность инвентаря по сегментам.
Слой C: Delivery (доставка/тех)
Типичные симптомы: Requests не конвертируются в responses, responses не доходят до shows, технические ошибки.
Быстрая проверка: Воронка requests → responses → shows, error rate, latency, availability.
Слой D: Pressure & Behavior (давление/поведение)
Типичные симптомы: Frequency растёт, saturation наступает, session depth падает, show rate деградирует.
Быстрая проверка: Frequency, плотность показов, show rate, траектория во времени.
Разложение выручки по множителям

Инцидент почти всегда виден в одном из множителей раньше, чем в итоговой выручке.

Таймлайн инцидента

T0 всегда раньше T1. Поэтому нужен триаж по слоям.

Инцидент → план действий
Runbook: 30 минут
Минуты Действие Метрика/срез Решение/вывод
0–5 Триаж по слоям Revenue, CPM, ShowRate, Requests Определить слой вероятной причины
5–10 Проверка воронки Requests → Responses → Shows Локализовать точку разрыва
10–20 Сегментация По сегментам, площадкам, форматам Найти, где проблема концентрируется
20–30 Оценка масштаба Процент затронутых, траектория Принять решение: откат/фикс/мониторинг
Пост-мортем: что фиксировать
После инцидента зафиксируйте:
  • Таймлайн: t0 (начало деградации механизма), t1 (деньги начали реагировать), t2 (вмешательство)
  • Слой причины: Demand/Supply/Delivery/Pressure
  • Guardrails: какие границы были нарушены
  • Сегменты/плейсменты/форматы: где проблема была сильнее
  • Ранние метрики: какие сигналы появились первыми
  • Что сработало: какие действия помогли
  • Что усугубило: какие действия ухудшили ситуацию
  • План предотвращения: алерты, пороги, окна мониторинга

Инциденты лечатся порядком действий, а не героизмом.