Когда рукопись пересекла его стол, Джошуа Плоткин, биолог-теоретик из Пенсильванского университета, был немедленно заинтригован. Физик Фриман Дайсон и ученый-компьютерщик Уильям Пресс, оба очень успешные в своих областях, нашли новое решение знаменитого, многолетнего сценария теории игр, названного дилеммой заключенного, в котором игроки должны решить, обмануть или сотрудничать с партнер. Дилемма заключенного уже давно используется для объяснения того, как сотрудничество может сохраняться в природе. В конце концов, естественный отбор управляется выживанием наиболее приспособленных, поэтому можно ожидать, что эгоистичные стратегии, приносящие пользу индивиду, скорее всего, сохранятся. Но тщательное изучение дилеммы заключенного показало, что организмы могут действовать исключительно в собственных интересах и при этом создавать кооперативное сообщество.

Новое решение проблемы, предложенное Прессом и Дайсоном, поставило под сомнение эту радужную перспективу. Было высказано предположение, что лучшими стратегиями были эгоистичные стратегии, ведущие к вымогательству, а не к сотрудничеству.

Плоткин нашел математику этого дуэта замечательной своей элегантностью. Но результат его встревожил. В природе есть множество примеров кооперативного поведения. Например, летучие мыши-вампиры жертвуют часть своей кровяной муки членам сообщества, которые не могут найти добычу. Некоторые виды птиц и социальных насекомых обычно помогают вырастить чужой выводок. Даже бактерии могут сотрудничать, прилипая друг к другу, так что некоторые из них могут пережить яд. Если царит вымогательство, что движет этими и другими актами самоотверженности?

В статье Пресса и Дайсона рассматривается классический сценарий теории игр - пара игроков участвуют в повторяющейся конфронтации. Плоткин хотел знать, можно ли возродить щедрость, если применить ту же математику к ситуации, более похожей на природу. Поэтому он изменил их подход к популяции, позволив людям играть в серию игр со всеми остальными членами своей группы. Результаты его экспериментов, последний из которых был опубликован в декабре в Proceedings of the National Academy of Sciences., предполагает, что щедрость и эгоизм идут по ненадежной черте. В некоторых случаях сотрудничество одерживает победу. Но сдвиньте только одну переменную, и вымогательство снова возьмет верх. «Теперь у нас есть очень общее объяснение того, когда ожидается или не ожидается развитие сотрудничества в популяциях», - сказал Плоткин, проводивший исследование вместе со своим коллегой Александром Стюартом.

На данный момент работа носит чисто теоретический характер. Но результаты потенциально могут иметь далеко идущие последствия, объясняя явления, варьирующиеся от сотрудничества между сложными организмами до эволюции многоклеточности - формы сотрудничества между отдельными клетками.

Плоткин и другие говорят, что работа Пресса и Дайсона может обеспечить новую основу для изучения эволюции сотрудничества с использованием теории игр, позволяя исследователям выявить параметры, которые позволяют сотрудничеству существовать. «Это в основном возродило эту область, - сказал Мартин Новак, биолог и математик из Гарвардского университета.

Око за око

Обезьяны верветы известны своими тревожными сигналами. Обезьяна будет кричать, чтобы предупредить своих соседей о приближении хищника. Но при этом он привлекает к себе опасное внимание. Ученые, вернувшиеся к Дарвину, изо всех сил пытались объяснить, как возник этот вид альтруистического поведения. Если достаточно высокий процент кричащих обезьян будет убит хищниками, можно ожидать, что естественный отбор погасит крикунов в генофонде. Однако это не так, и предположения о том, почему это привело к десятилетиям (иногда горячих) дебатов.

Исследователи предложили различные возможные механизмы для объяснения сотрудничества. Родственный отбор предполагает, что помощь членам семьи в конечном итоге помогает человеку. Групповой отбор предполагает, что у кооперативных групп больше шансов выжить, чем у не сотрудничающих. А прямая взаимность предполагает, что люди извлекают выгоду из помощи тому, кто помогал им в прошлом.

Дилемма заключенного помогает исследователям понять простые стратегии, такие как сотрудничество с щедрыми членами сообщества и обман мошенников, которые могут создать кооперативное общество в нужных условиях. Классическая дилемма заключенного, впервые описанная в 1950-х годах, связана с парой преступников, которых арестовывают и помещают в отдельные комнаты. Каждому предоставляется выбор: признаться или промолчать. В лучшем случае оба ничего не говорят и уходят на свободу. Но поскольку ни один из них не знает, что сделает другой, молчать - рискованно. Если один стукает, а другой молчит, крыса получает более легкий приговор, а тихий партнер страдает.

Даже простые организмы, такие как микробы, участвуют в подобных играх. Некоторые морские микроорганизмы производят молекулы, которые помогают им собирать железо, жизненно важное питательное вещество. Микробные колонии часто имеют как продуцентов, так и обманщиков - микробы, которые не производят соединение сами, а используют молекулы своих соседей.

В единственном случае дилеммы заключенного лучшая стратегия - отступить - визжать на партнера, и у вас будет меньше времени. Но если игра повторяется снова и снова, оптимальная стратегия меняется. За одну встречу верветка, заметившая хищника, будет в большей безопасности, если будет хранить молчание. Но в течение жизни обезьяна с большей вероятностью выживет, если она предупредит своих соседей о надвигающейся опасности, и они сделают то же самое. «У каждого игрока есть стимул отступить, но в целом они добьются большего успеха, если будут сотрудничать», - сказал Плоткин. «Это классическая проблема того, как может возникнуть сотрудничество».

В 1970-х годах Роберт Аксельрод, политолог из Мичиганского университета, организовал круговой турнир, в котором разные стратегии противопоставлялись друг другу. К удивлению многих соперников победил простейший подход. Просто имитируя предыдущий ход другого игрока, стратегия под названием «око за око» одержала победу над гораздо более сложными программами.

Стратегии «око за око» можно найти в биологическом мире. Например, пары колючек выслеживают ближайших хищников в своего рода дуэте «око за око». Если одна рыба делает рискованный шаг и бросается вперед, другая отвечает тем же храбростью. Если кто-то отступает, надеясь позволить партнеру рискнуть, партнер тоже отступает.

За последние 30 лет ученые исследовали более реалистичные с эволюционной точки зрения версии дилеммы заключенного, чем простая версия Аксельрода. Игроки в большом круговом турнире начинают с разнообразного набора стратегий - воспринимайте это как их генетически обусловленную приспособленность. Чтобы имитировать выживание наиболее приспособленных, победитель каждого взаимодействия порождает еще потомство, которое наследует ту же стратегию, что и его родитель. Таким образом, популярность наиболее успешных стратегий со временем растет.

Подход к победе зависит от множества факторов, включая размер группы, какие стратегии присутствуют на старте и как часто игроки совершают ошибки. Действительно, добавление шума в игру - случайное изменение стратегии, которое действует как замена генетической мутации - положит конец господству «око за око». В этих обстоятельствах восторжествует вариант, известный как щедрый око за око, который включает в себя время от времени прощать предательство другого человека.

Общий вид этих симуляций оптимистичен - доброта окупается. «Наиболее успешными стратегиями часто становятся те, которые не пытаются использовать преимущества другого человека», - сказал Новак.

Входят Пресс и Дайсон с темной долей отчаяния.

Триумф Кооператора

Несмотря на свои впечатляющие резюме, Пресс и Дайсон были относительными новичками в теории игр. Это сделало их новое решение дилеммы 60-летнего заключенного, опубликованное в Proceedings of the National Academy of Sciences в 2012 году, еще более неожиданным. «Это замечательная статья, которую вполне можно было написать 30 лет назад», - сказал Плоткин. «Математическая идея, лежащая в основе их статьи, была проигнорирована, несмотря на то, что сотни ученых изучали теорию игр и ее приложения».

В повторяющейся дилемме заключенного два игрока соревнуются друг с другом в серии раундов. Затем исследователи могут определить, какая стратегия будет наиболее успешной в долгосрочной перспективе. Ниже игрок в левом столбце применяет щедрую стратегию, пытаясь побудить своего оппонента помочь, иногда помогая даже тогда, когда оппонент отступает. Эгоистичный игрок справа склонен к дезертирству, лишь помогая достаточно часто, чтобы не дать своему противнику навсегда отступить. Каждый раунд подсчитывается с использованием матрицы, как в примере с летучей мышью выше:

В очной схватке эгоистичная стратегия побеждает щедрого. Тем не менее, одни и те же стратегии дают разные результаты при применении к более реалистичной с точки зрения эволюции сеттингу. На видео ниже группа игроков участвует в серии личных встреч, очень похожих на круговой турнир. Игрок, который «побеждает» в каждой встрече, порождает больше потомков, использующих аналогичные стратегии. Здесь один игрок, использующий щедрую стратегию, будет стремиться распространить свою стратегию среди населения: в конечном итоге все население переходит от эгоистичных стратегий к великодушным. Биологи используют подобные модели, чтобы объяснить, как совместное поведение сохраняется в дикой природе.

Пресс и Дайсон обрисовали в общих чертах подход, получивший название вымогательства, при котором один игрок всегда может выиграть, выбрав отступление в соответствии с заданным набором вероятностей. Стратегия Пресса и Дайсона примечательна тем, что позволяет одному игроку контролировать исход игры. «Основное нововведение состоит в том, чтобы подсчитать, как часто вы можете дезертировать, не демотивируя полностью вашего партнера», - сказал Кристиан Хильбе, исследователь группы Новака в Гарварде. Более того, выигравшему игроку нужно запомнить только один предыдущий ход, но стратегия работает так же хорошо, как и те, которые включают в себя многие предыдущие раунды игры.

Второй игрок вынужден сотрудничать с вымогателем, потому что это вариант, обеспечивающий наилучший выигрыш. «Если я вымогатель, то время от времени я буду дезертировать, даже если мы сотрудничаем, в точно такой степени, что независимо от того, что вы делаете, я получу больший выигрыш, чем вы», - сказал Плоткин. Ситуация напоминает групповой проект в неполной средней школе. Если один из членов команды расслабится, у сознательных учеников не останется иного выбора, кроме как усерднее работать, чтобы получить хорошую оценку.

Оригинальная статья Пресса и Дайсона была помещена в контекст классической теории игр - серии взаимодействий между единственной парой игроков. Но Плоткин и Стюарт хотели знать, что произойдет, если они применит тот же математический подход к развивающейся группе, такой как мартышки-верветки или летучие мыши-вампиры, которые размножаются и выживают в зависимости от их индивидуальной приспособленности. Они исследовали более широкий класс успешных стратегий, называемых стратегиями с нулевой детерминантностью, которые определили Пресс и Дайсон.

Этот класс стратегий включает моральную противоположность вымогательства: щедрость. В общем, игрок, использующий щедрую стратегию, всегда будет сотрудничать, когда это делает его или ее противник. Если противник откажется, первый игрок все равно будет сотрудничать с определенной вероятностью, пытаясь уговорить оппонента вернуться к щедрости.

К облегчению Плоткина и Стюарта, щедрые стратегии, а не вымогательства, были наиболее успешными при применении к развивающимся популяциям. «Мы обнаружили гораздо более радужную картину», - сказал Плоткин, опубликовавший результаты в 2013 году в Proceedings of the National Academy of Sciences . «Самые надежные стратегии, те, которые нельзя заменить другими, щедры».

Основная интуиция проста. «Вымогательство хорошо работает с одним оппонентом», - сказал Плоткин. «Но в большой популяции вымогатель со временем объединится с другим вымогателем». Тогда оба дезертируют, получив меньший выигрыш. «Плоткин улучшил нашу модель, перевернув ее вверх дном», - сказал Дайсон. «Если вы хотите, чтобы кто-то сотрудничал с вами, лучше подкупить человека краткосрочными выгодами, чем сразу же его наказывать».

Хильбе подтвердил эти открытия в реальном мире, противопоставив людей-игроков компьютерам, используя либо щедрые, либо вымогательские стратегии. Как и предполагалось, люди получали большие выплаты, играя против щедрых компьютеров, чем против эгоистичных. Но люди также были склонны наказывать противников-вымогателей, отказываясь сотрудничать, даже если это было бы в их интересах. Это, в свою очередь, уменьшило выигрыш как для человека, так и для компьютера. В конце концов, щедрый компьютер выиграл большую выплату, чем компьютер-вымогатель.

Месть вымогателя

Учитывая эти результаты, Плоткин надеялся, что вымогателей удастся удержать в страхе. Но этот оптимизм был недолгим. Следуя своему исследованию 2013 года, Плоткин изменил выплаты, которые можно получить за счет сотрудничества или отступничества. Игроки передали свою стратегию и стратегические выгоды своим потомкам; обе величины могут подвергаться случайным мутациям.

С этой встряской в ​​системе, которая могла соответствовать изменению условий окружающей среды, результат вернулся на темную сторону. Щедрость больше не была излюбленным решением. «По мере того как мутации, которые увеличивают искушение дефекта, охватывают группу, популяция достигает критической точки», - сказал Плоткин. «Искушение отступить непреодолимо, и отступничество правит днем».

Плоткин сказал, что результат был неожиданным. «Это удивительно, потому что это те же рамки - теория игр - которые люди использовали для объяснения сотрудничества», - сказал он. «Я думал, что даже если вы позволите игре развиваться, сотрудничество все равно восторжествует».

Вывод заключается в том, что небольшие изменения условий могут иметь большое влияние на победу сотрудничества или вымогательства. «Приятно видеть, что это приводит к качественно другим результатам», - сказал Джефф Гор, биофизик из Массачусетского технологического института, который не участвовал в исследовании. «В зависимости от ограничений вы можете развивать качественно разные виды игр».

Крис Адами, вычислительный биолог из Университета штата Мичиган, утверждает, что не существует такой вещи, как оптимальная стратегия - победитель зависит от условий.

Действительно, исследование Плоткина вряд ли станет концом истории. «Я уверен, что найдутся люди, которые посмотрят, как результат зависит от предположений», - сказал Хилбе. «Возможно, сотрудничество можно как-то спасти».

Будущее заключенного

Дилемма заключенного, очевидно, представляет собой сильно упрощенную версию реальных взаимодействий.

Итак, насколько хороша эта модель для изучения эволюции сотрудничества? Дайсон не оптимистичен. Ему нравятся исследования Плоткина и Хильбе, но в основном потому, что они связаны с интересной математикой. «Конечно, как описание возможных миров, это довольно интересно, но мне не кажется, что это мир биологии», - сказал Дайсон.

Итан Акин, математик, который исследовал стратегии, аналогичные стратегиям Пресса и Дайсона, сказал, что, по его мнению, результаты более применимы к принятию социологических решений, чем к развитию сотрудничества.

Но некоторые биологи-экспериментаторы не согласны с этим, утверждая, что и дилемма заключенного, и теория игр в более широком смысле оказали глубокое влияние на их сферу. «Я думаю, что вклад теории игр в сотрудничество между микробами огромен, - сказал Уилл Ратклифф, биолог-эволюционист из Технологического института Джорджии.

Например, ученые, изучающие устойчивость к антибиотикам, используют сценарий теории игр, называемый игрой в снежный занос, в которой игрок всегда выигрывает от сотрудничества. (Если вы застряли в многоквартирном доме после метели, вы извлечете выгоду, расчистив подъездную дорожку, но то же самое сделает и все, кто там живет и не занимается лопатой.) Некоторые бактерии могут вырабатывать и выделять фермент, способный дезактивировать антибиотики. Производство фермента обходится дорого, и ленивые бактерии, которые его не производят, могут извлечь выгоду, используя ферменты, произведенные их более трудолюбивыми соседями. В сценарии строгой дилеммы заключенного бездельники в конечном итоге убивают производителей, нанося вред всему населению. Но в игре в снежный занос производители имеют больший доступ к ферменту, что улучшает их физическую форму, и два типа бактерий могут сосуществовать.

Микробы в лаборатории могут имитировать сценарии теории игр, но точно ли эти контролируемые среды отражают то, что происходит в природе, - это другой вопрос. «Мы задаем динамику игры, предполагая определенную экологию», - сказал Рэтклифф. Но эти параметры могут не отражать нормальную среду обитания микроба. «Чтобы показать, что динамика эксперимента соответствует дилемме заключенного или другим играм, не обязательно означает, что эти механизмы управляют им в природе», - сказал Рэтклифф.