Равновесие Нэша: различия между версиями
[отпатрулированная версия] | [непроверенная версия] |
Gandvik (обсуждение | вклад) |
0442A403 (обсуждение | вклад) отмена правки 141521606 участника 188.170.78.194 (обс.) Метка: отмена |
||
(не показано 48 промежуточных версий 26 участников) | |||
Строка 1: | Строка 1: | ||
{{Концепция решения |
{{Концепция решения |
||
|название = Равновесие Нэша |
|название = Равновесие Нэша |
||
|надмножества = [[ |
|надмножества = [[Рационализируемость]]<br>[[Коррелированное равновесие]]<br>[[ε-равновесие]] |
||
|подмножества = [[Равновесие, совершенное по подыграм]]<br |
|подмножества = [[Равновесие, совершенное по подыграм]]<br>[[Равновесие дрожащей руки]]<br>[[Эволюционно стабильная стратегия]]<br>[[Сильное равновесие]] |
||
|авторство = [[Нэш, Джон Форбс|Джон Нэш]] |
|авторство = [[Нэш, Джон Форбс|Джон Нэш]] |
||
|применение = Все [[Некооперативная игра|некооперативные игры]] |
|применение = Все [[Некооперативная игра|некооперативные игры]] |
||
}} |
}} |
||
'''Равнове́сие Нэ́ша''' — [[концепция решения]], одно из ключевых понятий [[Теория игр|теории игр]]. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют<ref>[http://univertv.ru/video/matematika/d957bd15/teoriya_igr/teoriya_igr/ravnovesie_nesha_shopping_reputaciya_golosovanie/ Univertv — Равновесие Нэша: шоппинг, репутация, голосование]</ref>. Джон Нэш доказал существование такого равновесия в смешанных стратегиях в любой конечной игре. |
'''Равнове́сие Нэ́ша''' — [[концепция решения]], одно из ключевых понятий [[Теория игр|теории игр]]. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют<ref>[http://univertv.ru/video/matematika/d957bd15/teoriya_igr/teoriya_igr/ravnovesie_nesha_shopping_reputaciya_golosovanie/ Univertv — Равновесие Нэша: шоппинг, репутация, голосование] {{Wayback|url=http://univertv.ru/video/matematika/d957bd15/teoriya_igr/teoriya_igr/ravnovesie_nesha_shopping_reputaciya_golosovanie/ |date=20091213125122 }}.</ref>. [[Нэш, Джон Форбс|Джон Нэш]] доказал существование такого равновесия в смешанных [[Стратегия (теория игр)|стратегиях]] в любой [[Конечная игра|конечной игре]]. |
||
== История == |
== История == |
||
⚫ | |||
Эта концепция впервые использована [[Курно, Антуан Огюст|Антуаном Огюстом Курно]]. Он показал, как найти то, что мы называем равновесием Нэша, в [[игра Курно|игре Курно]]. Нэш первым доказал, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. Это было сделано в его диссертации по [[Некооперативная игра|некооперативным играм]] в 1950 |
Эта концепция впервые использована [[Курно, Антуан Огюст|Антуаном Огюстом Курно]]. Он показал, как найти то, что мы называем равновесием Нэша, в [[игра Курно|игре Курно]]. Нэш первым доказал, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. Это было сделано в его диссертации по [[Некооперативная игра|некооперативным играм]] в 1950 году. |
||
До Нэша это было доказано только для игр с 2 участниками с [[антагонистическая игра|нулевой суммой]] [[Нейман, Джон фон|Джоном фон Нейманом]] и [[Моргенштерн, Оскар|Оскаром Моргенштерном]] (1947). |
До Нэша это было доказано только для игр с 2 участниками с [[антагонистическая игра|нулевой суммой]] [[Нейман, Джон фон|Джоном фон Нейманом]] и [[Моргенштерн, Оскар|Оскаром Моргенштерном]] (1947). |
||
== Математическая формулировка == |
|||
== Формулировка == |
|||
[[Файл:Концепции решения.png|thumb|250px|Соотношение равновесных концепций решения. Стрелками обозначено направление от рафинирований к менее требовательным концепциям]] |
|||
⚫ | |||
Допустим, <math>(S,H)</math> |
Допустим, <math>(S, H)</math> — [[некооперативная игра]] {{mvar|n}} лиц в нормальной форме, где {{mvar|S}} — набор чистых стратегий, а {{mvar|H}} — набор выигрышей. Когда каждый игрок <math>i \in \{1, ..., n\}</math> выбирает стратегию <math>x_i \in S</math> в профиле стратегий <math>x = (x_1, ..., x_n),</math> игрок {{mvar|i}} получает выигрыш <math>H_i(x).</math> Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии <math>x_i</math>, выбранной самим игроком {{mvar|i}}, но и от чужих стратегий <math>x_{-i}</math>, то есть всех стратегий <math>x_j</math> при <math>j \ne i</math>. Профиль стратегий <math>x^* \in S</math> является равновесием по Нэшу, если изменение своей стратегии с <math>x_i^*</math> на <math>x_i</math> не выгодно ни одному игроку <math>i</math>, то есть для любого <math>i</math> |
||
<math>H_i(x^*) \ |
: <math>H_i(x^*) \geqslant H_i(x_i, x^*_{-i}).</math> |
||
Игра может иметь равновесие Нэша в чистых стратегиях или в [[смешанная стратегия|смешанных]] (то есть при выборе чистой стратегии [[Стохастичность|стохастически]] с фиксированной частотой). |
Игра может иметь равновесие Нэша в чистых стратегиях или в [[смешанная стратегия|смешанных]] (то есть при выборе чистой стратегии [[Стохастичность|стохастически]] с фиксированной частотой). Нэш доказал, что если разрешить ''смешанные стратегии'', тогда в каждой игре {{mvar|n}} игроков будет хотя бы одно равновесие Нэша. |
||
== Примеры использования понятия == |
|||
== В социлогии == |
|||
⚫ | В социологической [[Теория рационального выбора|теории рационального выбора]] отдельно подчёркивается, что устойчивое состояние общества (социальное равновесие) может отличаться от оптимального (социальный оптимум). Такие |
||
=== Социология === |
|||
⚫ | |||
⚫ | В социологической [[Теория рационального выбора|теории рационального выбора]] отдельно подчёркивается, что устойчивое состояние общества (социальное равновесие) может отличаться от оптимального (социальный оптимум). Такие неоптимальные, но устойчивые состояния и называют в социологии равновесием Нэша. |
||
⚫ | |||
!colspan="2" rowspan="2" | |
!colspan="2" rowspan="2" | |
||
!colspan="2" |Актор B |
!colspan="2" |Актор B |
||
Строка 33: | Строка 36: | ||
!rowspan="2" style="width:70px" |Актор A |
!rowspan="2" style="width:70px" |Актор A |
||
!style="width:20px" |1 |
!style="width:20px" |1 |
||
|A: +1, B: +1 |
|||
|A: −1, B: +2 |
|||
|- align="center" |
|- align="center" |
||
!|2 |
!|2 |
||
|A: +2, B: −1 |
|||
|A: 0, B: 0 |
|||
|} |
|} |
||
В таблице слева приведена структура действия в терминах [[Теория игр|теории игр]], составленная для двух действующих [[Субъект (философия)|субъектов]] ([[Актор (общественные науки)|акторов]]). Каждый актор имеет два варианта действия, обозначенных цифрами 1 и 2. Коэффициенты вознаграждения получаемые ими при выборе определённых вариантов действия указаны в соответствующих ячейках таблицы. Предположим, что в данный момент оба актора используют действие 2, а их вознаграждения равны нулю. Выбрав действие 1 актор A ухудшит собственную ситуацию на одну позицию (A |
В таблице слева приведена структура действия в терминах [[Теория игр|теории игр]], составленная для двух действующих [[Субъект (философия)|субъектов]] ([[Актор (общественные науки)|акторов]]). Каждый актор имеет два варианта действия, обозначенных цифрами 1 и 2. Коэффициенты вознаграждения, получаемые ими при выборе определённых вариантов действия, указаны в соответствующих ячейках таблицы. Предположим, что в данный момент оба актора используют действие 2, а их вознаграждения соответственно равны нулю. Выбрав действие 1, актор A ухудшит собственную ситуацию на одну позицию (A: −1, B: +2). Аналогично актор B самостоятельно выбрав вариант 1, в то время когда актор A продолжает использовать действие 2, только ухудшит свою ситуацию (A: +2, B: −1). Таким образом, несмотря на то, что оба актора понимают, что оптимальным для них была бы ситуация, когда оба они используют действие 1 (вознаграждение — A: +1, B: +1), ни у одного из них нет [[Мотивация|мотива]] к изменению ситуации, а равновесие становится результатом отсутствия таких мотивов. Если система уже находится в оптимальном состоянии (когда оба актора выбрали действие 1), то у обоих из них всегда будет искушение начать использовать действие 2, которое принесёт им вознаграждение за счёт другого игрока. Этот пример иллюстрирует возможность существования двух социальных состояний: устойчивого, но неоптимального (оба актора используют вариант 2); а также второго оптимального, но неустойчивого (оба актора используют вариант 1).<ref name="koleman">{{статья |
||
|автор = [[Коулман, Джеймс|Джеймс С. Коулман]] |
|||
|заглавие = Экономическая социология с точки зрения теории рационального выбора |
|||
|ссылка = https://ecsoc.hse.ru/data/2011/12/08/1208204958/ecsoc_t5_n3.pdf |
|||
|язык = ru |
|||
|издание = Экономическая социология |
|||
|тип = электронный журнал |
|||
|место = |
|||
|издательство = |
|||
|год = 2004 |
|||
|том = 5 |
|||
|номер = 3 |
|||
|страницы = 35—44 |
|||
| страницы = 35-44 |
|||
|issn = |
|||
|archivedate = 2017-08-09 |
|||
|archiveurl = https://web.archive.org/web/20170809212113/https://ecsoc.hse.ru/data/2011/12/08/1208204958/ecsoc_t5_n3.pdf |
|||
}}</ref> |
}}</ref> |
||
=== Политология === |
|||
== Примеры == |
|||
Для объяснения различных явлений в [[Политология|политической теории]] часто используется понятие ''ядра́'', являющееся более слабым вариантом равновесия Нэша. [[Ядро (экономика)|Ядром]] называют набор состояний, в каждом из которых ни одна группа акторов, способных выстроить новое (отсутствующее в данном ядре) состояние, не улучшит своей ситуации по сравнению с их состоянием в данном ядре.<ref name="koleman" /> |
|||
⚫ | |||
=== Экономика === |
|||
⚫ | В отрасли имеются две фирмы № 1 и № 2. Каждая из фирм может установить два уровня цен: «высокие» и «низкие». Если обе фирмы выберут высокие цены, то каждая будет иметь прибыль по 3 млн. Если обе выберут низкие, то каждая получит по 2 млн. Однако, если одна выберет высокие, а другая низкие, то вторая получит 4 млн, а первая только 1 млн. Наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние (при отсутствии [[Картельный сговор|картельного сговора]]) нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей вероятностью выберут низкие цены. Хотя этот вариант и не даёт максимального суммарного выигрыша (сумма = 4 млн), он исключает относительный выигрыш конкурента, который тот мог бы получить за счёт отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу»<ref>[http://www.economist.com/blogs/freeexchange/2015/05/archives «Nash’s Nobel prize»] {{Wayback|url=http://www.economist.com/blogs/freeexchange/2015/05/archives |date=20150526160108 }}, The Economist, 24 May 2015.</ref>. |
||
В [[Модель Штакельберга|модели олигополии Штакельберга]] для двух фирм-участников бескоалиционной игры можно принять, что существует две стратегии: 1. дуополист Курно (K) и дуополист Штакельберга (S), то есть S-стратег. Таким образом для двух игроков возможны следующие стратегии: |
|||
(K1;K2) (K1;S2);(K2;S1);(S1;S2). Как следует из построения модели прибыль при выборе стратегии S: <math>\pi^1=\frac{(a-c)^2}{8b} </math>, а при выборе стратегии K: <math>\pi^2=\frac{(a-c)^2}{16b} </math>, видно, что максимальный выигрыш первого игрока реализуется в ситуации (S1;K2), а второго (K1;S2). Так как эти ситуации несовместимы, то есть не могут реализоваться одновременно, то получить максимальный выигрыш оба игрока одновременно не могут. В данном случае оптимальным поведением обоих игроков будет выбор стратегии S, так как в этом случае стратегия S лучше стратегии K с точки зрения минимального возможного выигрыша. В данном случае выбор (S1;S2) является равновесием по Нэшу. Односторонее отклонение от данной стратегии автоматически уменьшает выигрыш любого из игроков, при этом суммарный выигрыш в данном типе равновесия меньше суммарного выигрыша при выборе стратегии (K1;K2) обоими игроками. Однако в условиях данной модели при отсутствии обмена информацией между игроками отклонение от равновесия по Нэшу не будет реализовано в виду повышенного риска того, что второй игрок может воспользоваться ситуацией и не выбрать стратегию K. |
|||
=== Военное дело === |
|||
Концепция [[Взаимное гарантированное уничтожение|взаимного гарантированного уничтожения]]. Ни одна из сторон, владеющих [[Ядерное оружие|ядерным оружием]], не может ни безнаказанно начать конфликт, ни разоружиться в одностороннем порядке. |
|||
== См. также == |
== См. также == |
||
Строка 69: | Строка 84: | ||
== Литература == |
== Литература == |
||
# ''Васин А. А., Морозов |
# ''[[Васин, Александр Алексеевич|Васин А. А.]], Морозов {{comment|В. В.|Владимир Викторович}}'' Теория игр и модели математической экономики. — М.: МГУ, 2005, 272 с. ISBN 5-317-01388-7. |
||
# ''Воробьёв Н. Н.'' Теория игр для экономистов-кибернетиков. — М.: Наука, 1985 |
# ''[[Воробьёв, Николай Николаевич (математик)|Воробьёв Н. Н.]]'' Теория игр для экономистов-кибернетиков. — М.: Наука, 1985 |
||
# ''Мазалов В. В.'' Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 |
# ''[[Мазалов, Владимир Викторович|Мазалов В. В.]]'' Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 с. |
||
# ''[[Петросян, Леон Аганесович|Петросян Л. А.]], Зенкевич Н. А., Шевкопляс Е. В.'' Теория игр. — СПб: БХВ-Петербург, 2012, 432 |
# ''[[Петросян, Леон Аганесович|Петросян Л. А.]], Зенкевич Н. А., Шевкопляс Е. В.'' Теория игр. — СПб: БХВ-Петербург, 2012, 432 с. |
||
{{math-stub}} |
|||
{{econ-stub}} |
|||
{{Теория игр}} |
{{Теория игр}} |
Текущая версия от 08:55, 18 ноября 2024
Равновесие Нэша | |
---|---|
Концепция решения в теории игр | |
Связанные множества решений | |
Надмножества |
Рационализируемость Коррелированное равновесие ε-равновесие |
Подмножества |
Равновесие, совершенное по подыграм Равновесие дрожащей руки Эволюционно стабильная стратегия Сильное равновесие |
Факты | |
Авторство | Джон Нэш |
Применение | Все некооперативные игры |
Равнове́сие Нэ́ша — концепция решения, одно из ключевых понятий теории игр. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют[1]. Джон Нэш доказал существование такого равновесия в смешанных стратегиях в любой конечной игре.
История
[править | править код]Эта концепция впервые использована Антуаном Огюстом Курно. Он показал, как найти то, что мы называем равновесием Нэша, в игре Курно. Нэш первым доказал, что подобные равновесия должны существовать для всех конечных игр с любым числом игроков. Это было сделано в его диссертации по некооперативным играм в 1950 году.
До Нэша это было доказано только для игр с 2 участниками с нулевой суммой Джоном фон Нейманом и Оскаром Моргенштерном (1947).
Математическая формулировка
[править | править код]Допустим, — некооперативная игра n лиц в нормальной форме, где S — набор чистых стратегий, а H — набор выигрышей. Когда каждый игрок выбирает стратегию в профиле стратегий игрок i получает выигрыш Заметьте, что выигрыш зависит от всего профиля стратегий: не только от стратегии , выбранной самим игроком i, но и от чужих стратегий , то есть всех стратегий при . Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии с на не выгодно ни одному игроку , то есть для любого
Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегии стохастически с фиксированной частотой). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.
Примеры использования понятия
[править | править код]Социология
[править | править код]В социологической теории рационального выбора отдельно подчёркивается, что устойчивое состояние общества (социальное равновесие) может отличаться от оптимального (социальный оптимум). Такие неоптимальные, но устойчивые состояния и называют в социологии равновесием Нэша.
Актор B | |||
---|---|---|---|
1 | 2 | ||
Актор A | 1 | A: +1, B: +1 | A: −1, B: +2 |
2 | A: +2, B: −1 | A: 0, B: 0 |
В таблице слева приведена структура действия в терминах теории игр, составленная для двух действующих субъектов (акторов). Каждый актор имеет два варианта действия, обозначенных цифрами 1 и 2. Коэффициенты вознаграждения, получаемые ими при выборе определённых вариантов действия, указаны в соответствующих ячейках таблицы. Предположим, что в данный момент оба актора используют действие 2, а их вознаграждения соответственно равны нулю. Выбрав действие 1, актор A ухудшит собственную ситуацию на одну позицию (A: −1, B: +2). Аналогично актор B самостоятельно выбрав вариант 1, в то время когда актор A продолжает использовать действие 2, только ухудшит свою ситуацию (A: +2, B: −1). Таким образом, несмотря на то, что оба актора понимают, что оптимальным для них была бы ситуация, когда оба они используют действие 1 (вознаграждение — A: +1, B: +1), ни у одного из них нет мотива к изменению ситуации, а равновесие становится результатом отсутствия таких мотивов. Если система уже находится в оптимальном состоянии (когда оба актора выбрали действие 1), то у обоих из них всегда будет искушение начать использовать действие 2, которое принесёт им вознаграждение за счёт другого игрока. Этот пример иллюстрирует возможность существования двух социальных состояний: устойчивого, но неоптимального (оба актора используют вариант 2); а также второго оптимального, но неустойчивого (оба актора используют вариант 1).[2]
Политология
[править | править код]Для объяснения различных явлений в политической теории часто используется понятие ядра́, являющееся более слабым вариантом равновесия Нэша. Ядром называют набор состояний, в каждом из которых ни одна группа акторов, способных выстроить новое (отсутствующее в данном ядре) состояние, не улучшит своей ситуации по сравнению с их состоянием в данном ядре.[2]
Экономика
[править | править код]В отрасли имеются две фирмы № 1 и № 2. Каждая из фирм может установить два уровня цен: «высокие» и «низкие». Если обе фирмы выберут высокие цены, то каждая будет иметь прибыль по 3 млн. Если обе выберут низкие, то каждая получит по 2 млн. Однако, если одна выберет высокие, а другая низкие, то вторая получит 4 млн, а первая только 1 млн. Наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние (при отсутствии картельного сговора) нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей вероятностью выберут низкие цены. Хотя этот вариант и не даёт максимального суммарного выигрыша (сумма = 4 млн), он исключает относительный выигрыш конкурента, который тот мог бы получить за счёт отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу»[3].
В модели олигополии Штакельберга для двух фирм-участников бескоалиционной игры можно принять, что существует две стратегии: 1. дуополист Курно (K) и дуополист Штакельберга (S), то есть S-стратег. Таким образом для двух игроков возможны следующие стратегии:
(K1;K2) (K1;S2);(K2;S1);(S1;S2). Как следует из построения модели прибыль при выборе стратегии S: , а при выборе стратегии K: , видно, что максимальный выигрыш первого игрока реализуется в ситуации (S1;K2), а второго (K1;S2). Так как эти ситуации несовместимы, то есть не могут реализоваться одновременно, то получить максимальный выигрыш оба игрока одновременно не могут. В данном случае оптимальным поведением обоих игроков будет выбор стратегии S, так как в этом случае стратегия S лучше стратегии K с точки зрения минимального возможного выигрыша. В данном случае выбор (S1;S2) является равновесием по Нэшу. Односторонее отклонение от данной стратегии автоматически уменьшает выигрыш любого из игроков, при этом суммарный выигрыш в данном типе равновесия меньше суммарного выигрыша при выборе стратегии (K1;K2) обоими игроками. Однако в условиях данной модели при отсутствии обмена информацией между игроками отклонение от равновесия по Нэшу не будет реализовано в виду повышенного риска того, что второй игрок может воспользоваться ситуацией и не выбрать стратегию K.
Военное дело
[править | править код]Концепция взаимного гарантированного уничтожения. Ни одна из сторон, владеющих ядерным оружием, не может ни безнаказанно начать конфликт, ни разоружиться в одностороннем порядке.
См. также
[править | править код]Примечания
[править | править код]- ↑ Univertv — Равновесие Нэша: шоппинг, репутация, голосование Архивная копия от 13 декабря 2009 на Wayback Machine.
- ↑ 1 2 Джеймс С. Коулман. Экономическая социология с точки зрения теории рационального выбора // Экономическая социология : электронный журнал. — 2004. — Т. 5, № 3. — С. 35—44. Архивировано 9 августа 2017 года.
- ↑ «Nash’s Nobel prize» Архивная копия от 26 мая 2015 на Wayback Machine, The Economist, 24 May 2015.
Литература
[править | править код]- Васин А. А., Морозов В. В. Теория игр и модели математической экономики. — М.: МГУ, 2005, 272 с. ISBN 5-317-01388-7.
- Воробьёв Н. Н. Теория игр для экономистов-кибернетиков. — М.: Наука, 1985
- Мазалов В. В. Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 с.
- Петросян Л. А., Зенкевич Н. А., Шевкопляс Е. В. Теория игр. — СПб: БХВ-Петербург, 2012, 432 с.