Дилемма заключенного

Будут ли заключенные друг друга предавать, следуя своим эгоистическим интересам, или будут молчать, тем самым минимизируя общий срок?

В теории игр дилемма заключённого (реже употребляется название «дилемма бандита») — некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Содержание

1 Классическая дилемма заключённого
2 Обобщённая форма
3 Похожая, но другая игра
4 Примеры из реальной жизни
5 Повторяющаяся дилемма заключённого
- 5.1 Психология обучения и теория игр
- 5.2 Восточная философия
6 Генетика
7 Примечания
8 См. также
9 Ссылки
10 Литература

Классическая дилемма заключённого

Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название — «дилемма бандита»).

Классическая формулировка дилеммы заключённого такова:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок (10 лет). Если оба молчат, дело проходит по другой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:

	Заключённый Б хранит молчание	Заключённый Б даёт показания
Заключённый А хранит молчание	Оба получают полгода.	А получает 10 лет, Б освобождается
Заключённый А даёт показания	А освобождается, Б получает 10 лет тюрьмы	Оба получают 2 года тюрьмы
«Дилемма заключённого» в нормальной форме.

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесию Нэша.

Обобщённая форма

	Сотрудничать	Предать
Сотрудничать	C, C	c, D
Предать	D, c	d, d
Каноническая матрица выигрышей ДЗ

Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключённых. Обобщённая форма игры часто используется в экспериментальной экономике. Следующие правила дают типичную реализацию игры.

В игре — два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой — «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования^[1]). Банкир открывает карты и выдаёт выигрыш.
Если оба выбрали «сотрудничать», оба получают C. Если один выбрал «предать», другой «сотрудничать» — первый получает D, второй с. Если оба выбрали «предать» — оба получают d.
Значения переменных C, D, c, d могут быть любого знака (в примере выше все меньше либо равны 0). Обязательно должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой ДЗ.
Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда один предаёт, а другой — нет, то есть 2C > D + c (объяснение см. ниже).

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.

Похожая, но другая игра

Хофштадтер^[2] предположил, что люди проще понимают задачи, как задача ДЗ, если она представлена в виде отдельной игры или процесса торговли. Один из примеров — «обмен закрытыми сумками»:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.

В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.

Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймёт значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какова стратегия каждого из них? Как агенты с разными стратегиями распределены и что определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может обескураживать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

Проделана некоторая работа по моделированию этого. Разные программисты и математики утверждают, что стратегия «око за око» (см. ниже) — наилучшая общая стратегия, однако не было сделано серьёзных академических усилий, чтобы классифицировать разные типы и распределения обучающихся агентов с разными стратегиями.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии ещё не упоминались возможность формировать коалиции и рядиться коллективно. А как насчёт агентов, которые бы за плату организовывали переговоры? Или агентов, которые бы накапливали информацию о самих сделках?

Примеры из реальной жизни

Примеры с заключёнными, карточной игрой и обменом закрытыми сумками могут показаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющие такую же матрицу выигрышей. Поэтому ДЗ представляет интерес социальным наукам, таким как экономика, политика и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключённого. Такая широкая применимость ДЗ придаёт этой игре значительную важность.

В политологии, к примеру, сценарий ДЗ часто используется для иллюстрации проблемы двух стран, вовлечённых в гонку вооружений. Обе будут заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, либо сокращать вооружения. Ни одна из сторон не может быть уверена, что другая будет соблюдать договорённость, следовательно, обе будут стремиться к военной экспансии. Это можно считать теоретическим объяснением политики устрашения. Похожие явления наблюдаются и в автоспорте — «Формула-1», где последние 20 лет происходит гонка бюджетов команд. Из-за этого число машин-участников сократилось с 36 в 1990 году до 20 в 2003.

В велогонках дилемма заключённого возникает, когда два сильных гонщика оторвались от общей группы. Каждый из них может либо предоставить соседу слипстрим («сотрудничать»), либо ехать сзади («предать»). Для обоих идеалом будет, когда они по очереди «висят» друг у друга на хвосте — но всегда есть желание не дать соседу слипстрима (тогда тот постепенно устаёт и «скатывается» в пелотон, а ты финишируешь с большим отрывом).

Случай дилеммы заключённого может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объёмы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов — прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.

В олигополистических рынках ценовая политика — это повторяющаяся ДЗ. Обычно олигополисты сотрудничают друг с другом и не доводят ситуацию до «ценовой войны».

Уильям Паундстоун в книге о дилемме заключённого описывает ситуацию в Новой Зеландии, где газетные ящики оставляют открытыми. Газету можно взять, не заплатив за неё, но мало кто так делает, потому что большинство осознаёт вред, который был бы, если бы все воровали газеты. Поскольку ДЗ в чистом виде одновременна для всех игроков (никто не может повлиять на решения других), эта распространённая линия рассуждений называется «магическое мышление»^[3].

Теоретическое заключение ДЗ — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДЗ повторяется очень точно: в интересах обоих подозреваемых сознаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае невиновный вряд ли сознаётся в чём либо, а виновный пойдёт на это и даст показания против невиновного.

Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Ардена можно рассматривать как обобщение ДЗ для множества игроков. Каждый житель общины выбирает — пасти ли скот на общем пастбище и получить выгоду, истощая его ресурсы, либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища — низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.

Повторяющаяся дилемма заключённого

В книге «Эволюция кооперации» (1984) Роберт Аксельрод en:Robert Axelrod исследовал расширение сценария ДЗ, которое он назвал повторяющаяся дилемма заключённого (ПДЗ). В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда в любом случае сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

Добрая: важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника.
Мстительная: успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.
Прощающая: другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.
Не завистливая: последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «доброй» стратегии, то есть добрая стратегия никогда не может набрать больше очков, чем оппонент).

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощающими и не завистливыми.

Рассмотрим снова модель гонки вооружений. Был дан вывод, что единственная рациональная стратегия — вооружаться, даже если обе страны хотели бы тратить ВВП на масло, а не пушки^[4] Интересно, что попытки продемонстрировать, что вывод ДЗ работает на практике (делая анализ «высоких» и «низких» военных расходов между периодами, на основе предположений ПДЗ), часто показывают, что такого поведения не происходит (например, греческие и турецкие военные расходы меняются не в соответствии со стратегией «око за око», а вероятнее всего следуют внутренней политике). Это может быть примером рационального поведения, отличающегося от одноразовой и многоходовой игр.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. К примеру, если среди населения все друг друга обманывают, а один ведёт себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать. Если же число исповедующих принцип «око за око» больше, то результат уже зависит от их доли в обществе.

Определить оптимальную стратегию можно двумя путями:

Равновесие Байеса-Нэша: если определено статистическое распределение встречаемого поведения (например, 33 % «око за око», 33 % всегда обманывают и 33 % всегда сотрудничают), то стратегию можно вычислить математически^[5]. Этим детально занимается теория эволюционной динамики.
По методу Монте-Карло делались симуляции популяций, где индивиды с низкими результатами вымирали, а с высокими воспроизводились (использовался генетический алгоритм поиска оптимальной эволюционно стабильной стратегии). Структура поведения в конечной популяции зависит от структуры в начале.

Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса [1]) представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5-10 ходах. Узнав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате ^[6] эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

Хотя эта эволюционно стабильная стратегия оказалась более эффективной в соревновании, это было достигнуто за счёт того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшей. Она также соблюдает правило запрета на коммуникации между игроками. То, что саутгемптонские программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.

Если ПДЗ играется ровно N раз (некая известная константа N), есть ещё один интересный факт. Равновесие Нэша — всегда предавать. Доказываем по индукции: если оба сотрудничают, на последнем ходу выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходу в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалось выгодным, необходимо, чтобы будущее было неопределённым для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышу за ход.

Дилемма заключённого — фундаментальная для некоторых теорий о взаимодействии людей и доверии. Из предположения модели ДЗ, что транзакция между двумя людьми требует доверия, доверительное поведение в популяциях может быть смоделировано при помощи многоигроковой повторяющейся версии игры. Это годами вдохновляло многих учёных. В 1975 году Грофман и Пул оценивали число работ, посвящённых этой теме, в количестве около 2000.

Психология обучения и теория игр

Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов. Ранние розыгрыши сильнее влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы к немотивированной агрессии, иногда сами становясь такими же.

Можно уменьшить вероятность предательства в популяции при помощи сотрудничества в ранних играх, позволив укрепить доверие^[7]. Следовательно самопожертвование может в некоторых ситуациях усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит индивидов на дальнейшее сотрудничество. Это связано с ещё одной дилеммой, что хорошее отношение без причины — это потакание, которое может ухудшить моральные качества.

Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, семейного отбора и этики.

Восточная философия

В боевых искусствах изучается даосская пословица, которая говорит, что:

Отвечать добром на добро — даёт добро
Отвечать злом на зло — даёт добро
Отвечать злом на добро — даёт зло
Отвечать добром на зло — даёт зло

Второе и четвёртое утверждения кажутся спорными, особенно с позиций христианства, но дилемма заключённого объясняет их. В древнем Китае «добро» и «зло» считались непреложными истинами (например, их нельзя поменять местами), таким образом, эту пословицу можно прочитать ещё и как «плюс на минус даёт минус». Есть усиленный вариант этой пословицы, где в двух последних строках получается «двойное зло».

Генетика

Теория естественного отбора долго не публиковалась, так как в неё не укладывался генетический альтруизм, то есть генетически вложенная в организм программа заботиться о себе подобных даже в ущерб себе[2]. Так называемый ген любви.

Примечания

↑ Подсказка, что, например, красный игрок собирается играть картой «сотрудничать» не меняет того факта, что «предать» является строго доминирующей стратегией. Если рассматривать только игру, возможность коммуникации не играет какой-либо роли. Однако если игра играется в реальной жизни, рассуждения, лежащие вне самой игры, могут привести к тому, что сотрудничество произойдёт. Это очень важный момент в выводах игры, что если нам не нужно принимать во внимание посторонние факторы, одноразовая ДЗ не меняется от коммуникации.
↑ Хофштадтер, Дуглас Глава 29 // Метамагические вопросы: в поиске сущности сознания и шаблона = Metamagical Themas: questing for the essence of mind and pattern. — Bantam Dell Pub Group, 1985. — ISBN 0-465-04566-9
↑ Будучи объяснением отсутствия мелкого воровства, магическое мышление объясняет добровольное голосование на выборах (когда неголосующий считается зайцем. В качестве альтернативы, это поведение может объясняться ожиданием будущих действий (и не требовать связи с «магическим мышлением»). Моделирование будущих действий требует добавление измерения времени, что делается в повторяющейся ДЗ (см. соответствующий подраздел этой статьи).
↑ В экономических учебниках кривая производственных возможностей иллюстрируется выбором между всего двумя товарами: маслом и пушками.
↑ Например см. исследование 2003 года «Равновесие Байеса-Нэша; статистический тест гипотезы»
↑ Результаты турнира по Дилемме заключённого 2004 (англ.) показывают, что команда Университета Саутгемптона заняла первые три места, хотя имела меньше выигрышей, чем стратегия GRIM (обратите внимание, в турнире нужно было выигрывать не отдельные матчи. Это достижимо и простым частым предательством). Следует заметить, что и без подразумеваемого сговора между стратегиями, которым злоупотребила саутгемптонская команда, «око за око» не всегда является абсолютным победителем любого соревнования. Точнее сказать, в долгосрочном периоде в ряде разных чемпионатов она покажет лучшие результаты, чем соперники. А в отдельно взятом чемпионате стратегию можно немного лучше подстроить к соревнованию, чем «око за око». То же самое относится и к ОЗО с прощением: в отдельно взятом соревновании она может проиграть специально заточенным стратегиям. Альтернативой является использование симуляции эволюции. В ней ОЗО придёт к доминированию, а злые стратегии будут от случая к случаю появляться и исчезать из популяции. Ричард Докинз показал, что нет статической комбинации стратегий, которая была бы стабильным равновесием, и система будет колебаться между границами.
↑ Аргумент о развитии сотрудничества через доверие приводится в книге «Мудрость толп» Джеймса Суровецки, где утверждается, что в долгосрочном периоде капитализм смог организоваться вокруг ядра квакеров, которые всегда работали честно со своими партнёрами (вместо того, чтобы обманывать и нарушать обещания — явление, которое останавливало более ранние долгосрочные добровольных международных контактов). Утверждается, что сделки с надёжными купцами позволили культуре честного поведения (сотрудничества) распространиться среди других торговцев, которые распространяли её дальше, пока не стало выгодно вообще быть честным.

См. также

Ссылки

Онлайновая повторяющаяся дилемма заключённого
Ещё одна онлайновая повторяющаяся дилемма заключённого
Отчёт об исследовании по дилемме заключённого (англ.)
Критика(англ.) экономистов, включая школу контракта, которые использовали некоторые теоретические результаты ДЗ, чтобы оправдать необходимость вмешательства государства, чтобы «улучшить» результат.
Симуляция дилеммы заключённого в пространстве

Литература

(источники, названные в английской статье)

Axelrod, Robert and Hamilton, William D. (1981). «The Evolution of Cooperation». Science, 211 : 1390—1396.
Эволюция сотрудничества, Роберт Акселрод, Basic Books, ISBN 0-465-02121-2
Axelrod, Robert (1997). The Complexity of Cooperation. Princeton University Press. ISBN 0-691-01567-8.
Эгоистичный ген, Ричард Докинз (1990), второе издание — включает две главы об эволюции сотрудничества, ISBN 0-19-286092-5
Grofman and Pool (1975). «Bayesian Models for Iterated Prisoner’s Dilemma Games». General Systems 20 : 185—94.
Hardin, Garrett (1968). «The Tragedy of the Commons». Science, 162 : 1243—1248.
Kreps, David, Robert Wilson, Paul Milgrom, and John Roberts (1982). «Rational Cooperation in the Finitely Repeated Prisoners' Dilemma.» Journal of Economic Theory 27(2) : 245—52.
Milgrom, Paul (1984). «Axelrod’s The Evolution of Cooperation.» Rand Journal of Economics 15(2) : 30—59.
Poundstone, William (1992). Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. Doubleday. ISBN 0-385-41567-2. Обширное популярное введение, как отмечено в заголовке.
Rapoport, Anatol and Chammah, Albert M. (1965). Prisoner’s Dilemma. University of Michigan Press. Расчёт множества экспериментов, в которых игралась ДЗ.
Verhoeff, Tom (1998). «The Trader’s Dilemma: A Continuous Version of the Prisoner’s Dilemma». Computing Science Notes 93/02, Кафедра математики и вычислительных систем, Технический Университет Эйндховена, Нидерланды.
New Tack Wins Prisoner’s Dilemma (из Wired.com)

Теория игр
Определения	Некооперативная игра · Кооперативная игра · Антагонистическая игра · Стохастическая игра · Дифференциальные игры · Игрок · Стратегия · Доминирование стратегий
Принципы оптимальности	Равновесие Нэша · Эффективность по Парето · Равновесие в доминирующих стратегиях · Решение по доминированию · Равновесие дрожащей руки · Равновесие, совершенное по под-играм · Собственное равновесие · Сильное равновесие · Эпсилон-равновесие · Коррелированное равновесие · Секвенциальное равновесие · Доминирование по риску
Примеры игр	Дилемма заключённого · Трагедия общин · Модель Бертрана · Модель Курно · Модель Штакельберга

Мысленные эксперименты
Главные статьи	Мысленный эксперимент ·
Люди	Зенон Элейский · Шрёдингер · Эйнштейн ·
Персонажи	Демон Лапласа · Демон Максвелла · Кот Шрёдингера · Чайник Рассела · Ахиллес и черепаха ·
Физические мысленные эксперименты	Демон Лапласа · Демон Максвелла · Квантовое бессмертие · Квантовое самоубийство · Кот Шрёдингера · Парадокс Белла · Парадокс субмарины · Парадокс Эйнштейна — Подольского — Розена · Парадокс близнецов · Микроскоп Гейзенберга · Пушечное ядро Ньютона · Парадокс Эренфеста ·
Апории Зенона	Ахиллес и черепаха · Дихотомия · Стадион · Стрела Зенона ·
Кибернетические мысленные эксперименты	Задача двух генералов · Китайская комната · Имитация реальности · Мозг в колбе ·
Другие мысленные эксперименты	Теорема о бесконечных обезьянах · Парадокс Ньюкома · Парадокс заключённых · Комната Марии ·

Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Полезное

Смотреть что такое "Дилемма заключенного" в других словарях:

Дилемма заключенного — [prisoner s dilemma] объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности… … Экономико-математический словарь
дилемма заключенного — Объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности сговора и поставили… … Справочник технического переводчика
Дилемма Заключенного — метод, применяемый в теории игр, анализа задачи и определения результата ее решения путем его выбора двумя равноправными партнерами. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов
Дилемма заключенного — PRISONER’S DILEMMA Основополагающая концепция теории игр. Наилучшей иллюстрацией концепции является притча о двух заключенных, вместе совершивших преступление. Шериф помещает подозреваемых в разные камеры. Он предоставляет каждому из них… … Словарь-справочник по экономике
Дилемма заключенного (prisoner's dilemma) — Д. з. это название интерперсональной игры, широко использовавшейся в исследованиях соц. психологов, интересовавшихся природой и разрешением соц. конфликта. Под «игрой» в этом смысле понимается соц. ситуация с принятием взаимозависимых решений, т … Психологическая энциклопедия
ДИЛЕММА ЗАКЛЮЧЕННОГО — в теории игр это метод анализа решений (выбора) и результатов, в ходе которого результат определяется выбором, осуществляемым двумя равноправными партнерами … Большой экономический словарь
ДИЛЕММА, ЗАКЛЮЧЕННОГО — Игра, основанная на классической детективной ситуации. В типичном варианте каждому игроку (заключенному) в отдельности сообщают, что, хотя имеются некоторые прямые доказательства его вины, у него есть два варианта: признаться или не признаться.… … Толковый словарь по психологии
ЗАКЛЮЧЕННОГО ДИЛЕММА — ЗАКЛЮЧЕННОГО ДИЛЕММА (дилемма узника; англ. prisoner s dilemma) интеллектуальная модель (предложенная А, У. Такером), позволяющая анализировать и демонстрировать различные варианты рациональности решений при необходимости кооперации частных… … Философская энциклопедия
ЗАКЛЮЧЕННОГО, ДИЛЕММА — См. дилемма заключенного … Толковый словарь по психологии
КОНФЛИКТ МЕЖЛИЧНОСТНЫЙ — – наиболее деструктивный способ развития и завершения значимых противоречий, возникающих в процессе межличностного взаимодействия. Для возникновения К. м. необходимо одновременное наличие трех условий: противоречия в межличностном взаимодействии … Энциклопедический словарь по психологии и педагогике

Словари и энциклопедии на Академике

Дилемма заключенного

Содержание

Классическая дилемма заключённого

Обобщённая форма

Похожая, но другая игра

Примеры из реальной жизни

Повторяющаяся дилемма заключённого

Психология обучения и теория игр

Восточная философия

Генетика

Примечания

См. также

Ссылки

Литература

Полезное

Смотреть что такое "Дилемма заключенного" в других словарях:

Поделиться ссылкой на выделенное

Словари и энциклопедии на Академике

Википедия

Дилемма заключенного

Содержание

Классическая дилемма заключённого

Обобщённая форма

Похожая, но другая игра

Примеры из реальной жизни

Повторяющаяся дилемма заключённого

Психология обучения и теория игр

Восточная философия

Генетика

Примечания

См. также

Ссылки

Литература

Полезное

Смотреть что такое "Дилемма заключенного" в других словарях:

Поделиться ссылкой на выделенное

Прямая ссылка: