47.5%
доля побед «жадной» стратегии в симуляции 10 000 партий — против 5.9% у «интуитивной» компенсаторной

00 Контекст

Несколько лет назад я написал короткую заметку про то, как тренирую мышление. Там есть абзац про настольные игры — в частности, про «Индустрию» Ивана Лашина. Я писал, что эта игра требует постоянно держать в голове связь нескольких измерений: заводы, ресурсы, варианты обмена, варианты продажи, условия модернизации. И что у неё настолько динамично сбалансированы измерения, что её почти не приходится переделывать самим — в отличие от других настолок в нашем доме, которые мы регулярно превращаем в свои варианты.

Это утверждение я сделал на интуиции — после десятка партий. Захотелось проверить математически. Действительно ли в правилах игры заложены те самые сдвиги между режимами мышления, которые я там вижу? Или это я их туда дочитываю?

Этот текст — попытка препарировать «Индустрию» теми же инструментами, которыми я обычно препарирую продуктовые системы. Тут нет менеджмента, не нужно принимать решений за бизнес. Зато можно проверить, как именно в правилах игры заложен тот самый «динамичный баланс» — и что он делает с поведением рационального игрока.

Спойлер: режимы мышления заложены. Причём измеримо.


01 Данные и методика

В качестве источников использовал три вещи. Первое — официальные правила Furnace 2021 в английской версии (русское издание называется «Индустрия»; правила идентичны базовому Furnace). Второе — фотографии своего экземпляра игры: 36 двухсторонних карт предприятий, 5 стартовых, компоненты ресурсов. Третье — наблюдаемые курсы продажи на 15 разных картах, которые я успел прочитать чётко.

Главное упрощение, которое сделал заранее: не учитываю карты промышленников. В базовой игре их можно отключить — это рекомендуется для первой партии — и при этом игра остаётся полноценной. Но математика без промышленников получается чище, и выводы не теряют силы.

Все симуляции, расчёты и графики — на Python. Код опубликую отдельно.


02 Структура ресурсов

В коробке четыре типа ресурсов: уголь, металл, нефть и жетоны модернизации. Первое наблюдение, которое я сделал, ещё не открывая правила, — соотношение их количества в коробке.

РесурсКоличество в коробкеДоля от общего
Уголь4046%
Нефть2023%
Металл1517%
Жетоны модернизации1214%

Это пропорции дизайнера. Уголь — массовый ресурс, его в три раза больше, чем металла. Жетонов модернизации меньше всего, хотя они одновременно работают как ресурс (можно продавать, тратить, накапливать).

Дальше я пробежался по всем картам продажи, которые видны на моих фото, и собрал таблицу «сколько монет даёт одна единица ресурса». Получилось вот что:

РесурсМинимум $/едМедианаМаксимумРазброс
Уголь0.500.500.501.0×
Нефть2.002.754.002.0×
Металл1.003.505.005.0×
Жетон модернизации1.333.505.003.8×

Любопытная закономерность. Чем меньше ресурса в коробке — тем больше разброс его цены. Уголь продаётся всегда одинаково дёшево: 4 единицы за 2 монеты. Это половина монеты за единицу — буквально мусор.

Чем меньше ресурса в коробке — тем выше разброс его цены. Дизайн через дефицит, а не средние значения.

А вот металл, которого в коробке всего 15 штук, варьируется от 1 монеты за единицу (плохая карта продажи) до 5 монет (отличная). Пятикратный разброс. И это не случайность.

Что это значит как дизайнерское решение. Лашин балансирует игру не через средние значения, а через распределения. Если ресурса много, его цена должна быть низкой и стабильной — иначе игра скатывается в монотонную добычу. Если ресурса мало, его цена может быть высокой, но это компенсируется риском «не встретить нужную карту» среди случайно открытых в раунде.

Это важное наблюдение, к которому я ещё вернусь в финале. Дизайнер рассуждает не «у этого ресурса средняя цена два с половиной» — а «у этого ресурса диапазон цен такой, что игрок принимает решение с риском».

Уголь — детерминированный ресурс. Поведение «качаю уголь и продаю» не работает. Зато его всегда хватает для апгрейдов. Металл — рискованный ресурс. Стратегия «качаю металл» — это казино: повезёт встретить карту продажи 1М→5$, и ты выигрываешь партию. Не повезёт, и металл превращается в обузу. Жетоны модернизации — особый случай: их мало, цена высокая, но они выполняют двойную функцию (продажа или апгрейд), что увеличивает их полезность.

И это всё — только из распределения курсов продажи, без учёта аукциона и динамики раундов. Уже здесь видно, что игра устроена многослойно.


03 Механика аукциона

Каждый раунд начинается с аукциона. На стол выкладывается 6, 7 или 8 карт (в зависимости от числа игроков). У каждого игрока 4 диска со значениями 1, 2, 3 и 4. По очереди игроки кладут диски на карты с двумя ограничениями: нельзя класть свой второй диск на ту же карту, и нельзя класть диск того же значения, что уже стоит. Когда все диски размещены, карты обрабатываются слева направо. У кого на карте самый высокий диск — тот её забирает. Все остальные, кто ставил диск на эту карту, получают компенсацию, указанную сверху, помноженную на номинал своего диска.

Эта механика — главная фишка игры. Все обзорщики о ней пишут одинаково: «иногда выгоднее проиграть аукцион, чем выиграть, — потому что компенсация бывает ценнее самой карты». Дальше типично следует совет: «ставьте диск 3 ради максимальной компенсации, оставляя диск 4 на главную цель раунда».

Я решил проверить это утверждение симуляцией. Написал простой движок аукциона: 4 игрока, 8 карт, у каждого по 4 диска. Каждая карта имеет случайную ценность V (от 8 до 25 монет, зависит от игрока — потому что у каждого свой движок) и случайную компенсацию C (от 0.5 до 5 монет за единицу диска). Размещение дисков по часовой стрелке, четыре круга, правила выкладки соблюдаются.

И четыре стратегии для игроков:

Запустил 10 000 партий. Каждый игрок играет своей стратегией.

СтратегияСредний доходПобед в партии
Greedy60.3 $47.5%
EV (баланс)58.4 $38.4%
Random41.8 $8.2%
Compensation41.7 $5.9%
жадная (Greedy) 47.5% балансированная (EV) 38.4% случайная 8.2% компенсаторная 5.9%
10 000 партий, 4 игрока за столом, у каждого своя стратегия.

Compensation — стратегия, которой учат обзорщики, — проигрывает буквально всё. 5.9% побед, на уровне случайной игры. И средний доход такой же, как у случайного бот-игрока.

Greedy — простая «жадная» стратегия — побеждает в 47.5% партий. EV — балансированная — в 38.4%.

Что произошло. Стратегия «всегда ставлю 3 ради максимальной компенсации» не работает, потому что компенсация — это разовый эффект, а сама карта — это движок, который работает несколько раундов. Пока соперник максимизирует разовые бонусы по 3-9 монет за раунд, ты строишь производственную цепочку, которая даёт 15-30 монет за партию.

Однако в симуляции есть тонкость, которую интересно выделить отдельно. Если посмотреть на парные дуэли (за столом два игрока стратегии A и два игрока стратегии B), картина меняется.

ДуэльABРазница
Greedy vs EV51.457.2EV +5.8
EV vs Compensation65.938.6EV +27.3
Greedy vs Compensation60.541.3Greedy +19.2
Greedy vs Random55.440.7Greedy +14.7

В смешанной партии выигрывает Greedy, но в честной дуэли 2v2 Greedy проигрывает EV. Это важно. Greedy выигрывает в смешанной партии потому, что часто оказывается единственным, кто борется за конкретную карту. Когда за столом двое жадных, они начинают бороться за одни и те же карты, и тут проигрывает тот, кто не умеет ценить компенсации. EV умеет. Greedy — нет.

Перевод этого на язык режимов мышления. Аукцион требует «быстрого мышления»: за один ход надо оценить и V, и C, и состояние ряда, и поведение соперников, и принять решение, на какую карту положить какой диск. Это не «холодный расчёт» в духе классической теории игр, это интуитивная оценка нескольких параметров в моменте. Что заметка называет «быстрым мышлением» — здесь работает буквально.

И при этом в аукционе нет единой выигрышной стратегии. Ни Greedy, ни EV не побеждают всегда. Они лучше других, но проигрывают в специфичных столах. Игра принуждает к гибкости.


04 Динамика по раундам

Игра длится 4 раунда. Каждый раунд = аукцион + производство. Карта, выигранная в раунде r, успеет сработать в раундах r..4 включительно, то есть (5 − r) раз. Карта, купленная в первом раунде, отрабатывает 4 раза. Карта, купленная в четвёртом, — один раз.

Это меняет всё.

Возьмём типичную карту, которая даёт около 5 монет за одно срабатывание. Это средняя карта продажи: продаёт пару единиц ресурса по 2-3 монеты за единицу. С апгрейдом такая карта даёт 80% больше — пусть будет 9 монет за срабатывание. Стоимость апгрейда — один уголь и один жетон модернизации, в сумме около 4 монет (по нашим оценкам из Блока 1).

Двигай слайдер раунда — и увидишь, как ценность карты меняется относительно компенсации. Между третьим и четвёртым раундом происходит математический сдвиг режима: то, что было верным правилом для первых трёх четвертей партии, становится неверным.

1
Карта без апгрейда
20 $
Карта с апгрейдом
32 $
Точка безразличия
5.00 $
В раунде 1 только редкая компенсация (C ≥ 5 $) бьёт владение картой. К раунду 4 граница падает почти в 4 раза.

В раундах 1-3 любая карта выгоднее компенсации. В раунде 4 — наоборот: почти любая компенсация выгоднее карты.

Это и есть «быстрое-медленное» в чистом виде, прошитое в игре. Раунды 1-2 — зона стратегического планирования. Думаешь о синергиях, о цепочках производства, об апгрейдах. Готов уступить компенсацию, потому что держишь горизонт на 3-4 раунда вперёд. Раунд 3 — переходная зона, старые правила перестают работать. Раунд 4 — зона тактической жадности. Никакого планирования. Просто оптимизация «здесь и сейчас»: что лучше — взять карту или взять компенсацию.

Это не интерпретация. Это математическое следствие того, что игра длится ровно 4 раунда и апгрейд тратит ресурсы вперёд. Если бы Лашин сделал игру на 3 раунда, переход случался бы между 2-м и 3-м, и движок не успевал бы полноценно проявиться. Если бы на 5 раундов — раунд 5 терял бы своё напряжение, потому что был бы дальним эхом стратегического планирования.

Четыре раунда — это точная настройка. Достаточно времени для того, чтобы движок имел смысл (3 раунда инвестиций). И обязательный финальный раунд, который ломает стратегию и заставляет переключиться в другой режим мышления.

Кстати, это объясняет наблюдение, которое часто встречается в обзорах «Индустрии»: «ситуации, в которых игрок выигрывает в последнем раунде, — норма для этой игры». Не случайность, а свойство дизайна. Обзорщики заметили эффект, не заметили причины.


05 Невидимый слой: микро-движок аукциона

Это самая тонкая находка из всего разбора. Её нет ни в одном обзоре «Индустрии» или Furnace, которые я прочитал — а я перебрал около пятнадцати на трёх языках.

В правилах есть такая фраза:

Карты в аукционном ряду обрабатываются по одной слева направо. Игрок может получить ресурсы по одной компенсации, а затем потратить их по другой. Для этого карта добычи должна стоять левее карты переработки.

Большинство обзоров проходит мимо этого пункта. А он значит вот что: компенсации внутри одного аукциона — не независимы. Если у тебя диски на двух картах в правильном порядке, ты получаешь не только сами компенсации, но и эффект их связи. Левая карта добывает тебе ресурсы, правая их перерабатывает в более ценные. Ещё до того, как начнётся Production Phase.

Возьмём конкретный пример. Аукцион, в нём две интересующие тебя карты:

Аукционный ряд (resolve слева направо) Карта L (позиция 2) компенсация + 1 уголь extraction за 1 единицу диска уголь поток ресурса Карта R (позиция 5) компенсация 1 уголь → 1 нефть processing до k раз (k = диск) Сценарии (без угля на руках) A. Жадно диск 4 на R L пуста 4 нет входного ресурса для обмена 0 $ B. Цепочка диск 4 на L, диск 3 на R 4 + 4 угля (1 × 4) 3 угля → 3 → 3 нефти + 1 уголь остаток 9.5 $ Прирост от учёта порядка карт в ряду: + 9.5 $ относительно жадной стратегии
Цепочка дисков L → R создаёт мини-производство ещё до Production Phase. Уголь, добытый на левой карте, тут же тратится на правой.

Угля у тебя на руках нет. Ты — игрок, который не собирается побеждать в этом аукционе, тебе важна только компенсация. Что лучше сделать?

Разберу пять сценариев и посчитаю выручку каждого. Уголь по нашим расчётам стоит 0.5 $ за единицу, нефть — 3 $ (медианная цена).

СценарийРазмещениеДоход
A1. ЖадноДиск 4 на R (выгодная компенсация-обмен)0 $
A2. Жадно с углём в карманеДиск 4 на R, на руках 2 угля5 $
B. ЦепочкаДиск 4 на L + диск 3 на R9.5 $
C. Лёгкая цепочкаДиск 4 на L + диск 2 на R7 $
D. Только добычаДиск 4 на L, без участия в R2 $

Жадная стратегия «вижу самую выгодную компенсацию, кладу свой максимальный диск» — даёт ноль. Потому что нет угля, который надо обменять. Компенсация-обмен требует входного ресурса, а его нет.

Цепочечная стратегия «сначала добываю на левой карте, потом перерабатываю на правой» — даёт 9.5 монет. В пять раз больше, чем жадная одиночная добыча. И почти бесконечно больше, чем жадный обмен без угля.

Это и есть «связывание разных фактов в структуру», о котором я писал в исходной заметке. В Furnace оно работает буквально — на уровне правил. Игрок, который видит аукционный ряд как граф потоков ресурсов (L кормит R, R превращает уголь в нефть, нефть продаётся в Production Phase), — получает в разы больше за тот же набор дисков.

Этот слой стратегии не описан в обзорах, потому что обзорщики смотрят на игру через призму отдельных решений: «куда положить диск 4». А правильный вопрос — «как расставить мои четыре диска по аукционному ряду, чтобы компенсации работали как мини-движок до начала Production Phase».

Этот слой требует «структурного мышления». Не быстрого, не стратегического — именно структурного, способного увидеть связи между карточками и посчитать совокупный эффект, а не сумму отдельных компенсаций.

Я считаю, что это лучшая дизайнерская находка в правилах «Индустрии». И именно она делает игру тренажёром того режима мышления, который заметка называет «связыванием воедино самых разных фактов в структуры».


06 Дизайнерская оценка

Если коротко резюмировать всё, что я насчитал:

Лашин балансирует игру не средними значениями, а распределениями. Дешёвый ресурс детерминирован, дефицитный — волатилен. Это не «средняя цена 2 монеты», это «риск 1 ↔ 5 монет в зависимости от карты, которая выпадет». Игроку приходится принимать решения в условиях неопределённости — и это та же логика, что в продуктовой аналитике, когда работаешь с А/B-тестами на маленьких выборках.

Длительность в 4 раунда — это точная настройка. Не три (нет места для движка), не пять (раунд 5 терял бы напряжение). Четыре — минимально необходимое, чтобы стратегическое планирование имело смысл, и обязательно содержащее финальный раунд, который ломает стратегию.

Структура аукциона — слоёная. Поверхностный слой: «выиграй карту дороже соперника, иначе компенсация». Средний слой: «выбирай между картой и компенсацией по EV». Глубинный слой: «расставь диски по ряду так, чтобы компенсации образовали мини-движок». Каждый слой требует своего режима мышления. Хорошо сделанная игра — это та, в которой все слои работают одновременно и игрок переключается между ними естественно.

С аналитической точки зрения «Индустрия» — это компактный пример того, как авторы хороших экономических систем устроены изнутри. Они не пишут правила, чтобы было «честно». Они пишут правила, чтобы поведение рационального игрока было сложным.

И это, кстати, ровно то, что мы пытаемся делать в продукте, когда проектируем системы вознаграждения, рекомендаций или ценообразования. Простые правила → сложное поведение → разные режимы мышления у пользователя. Лашин решил эту задачу для четырёх человек на час игры. Хороший продакт решает её для миллиона пользователей на год.


07 Возврат к режимам мышления

В исходной заметке я писал так:

У этой игры настолько качественно и динамично сбалансированы измерения, что мы почти её не переделывали. Она классно тренирует и скорость решений, и понимание причинно-следственных связей, и стратегическое планирование. Иногда лучше двигаться по заранее выбранной тактике, а иногда — проще расслабиться и погрузиться в хаос несвязанных решений.

Я писал это после десяти партий, на интуиции. После того, как я разобрал её математически, могу сказать конкретнее.

«Скорость решений» — это аукцион. EV-калькуляция в моменте, без долгого обдумывания, потому что соперники не ждут.

«Причинно-следственные связи» — это микро-движок аукциона. Левая карта кормит правую, ресурс перетекает по цепочке. Игрок, видящий эту связь, получает в пять раз больше.

«Стратегическое планирование» — это раунды 1-2. Когда ты выбираешь карты ради будущей синергии, готов уступить компенсации ради движка.

«Иногда лучше двигаться по тактике, а иногда — погрузиться в хаос» — это сдвиг между раундом 3 и раундом 4. В раунде 4 стратегия буквально становится вредной, и ты переключаешься в режим жадной оптимизации.

Все эти переключения — не моя интерпретация. Они математически прошиты в правилах. Если бы Лашин изменил один параметр (число раундов, базовый доход карты, стоимость апгрейда) — переключения сдвинулись бы или исчезли. Игра балансирует по краю.

Теперь я понимаю, почему мы её почти не переделывали. Не потому, что другие наши настолки плохие, а эта хорошая. А потому, что у этой игры правила настолько плотно зашиты в психологию игры — каждый параметр связан с каждым — что переделывать её = ломать. В наших переделках других настолок мы добавляем правила, чтобы вдохнуть в них жизнь. В «Индустрии» жизнь уже встроена в каждое число.

Настольная игра как тренажёр режимов мышления — это не метафора. Это конструкция, которую можно посчитать и доказать, что она работает.


08 Оговорки и ограничения

Несколько вещей, которые сознательно не учитывал, чтобы не размывать выводы:

Если хочется проверить какой-то из выводов на своей игре или в более строгой модели — пишите, @Datalake.


← Все кейсы