Теория игр

Теория игр изучает ситуации стратегического взаимодействия, в которых результат для каждого участника зависит не только от его собственных действий, но и от действий других игроков. Ключевые понятия — стратегии, наилучшие ответы, равновесие Нэша и Парето-оптимальность. Такие модели применяются для анализа общественных благ, коллективных действий и проблем безбилетника.

Что почитать?

1. Лекция

Что порешать?

Задача 1.

На необитаемом острове живут Робинзон и Пятница. Всё, что есть в их распоряжении — это кокосы, которые каждый из них собрал на соседней пальме. У каждого есть в запасе по 4 кокоса. Эти кокосы можно съесть, а можно сложить возле дома в виде снеговика.

Пусть

xix_i — количество потребленных кокосов,

g=g1+g2g = g_1 + g_2 — количество сложенных в снеговика кокосов.

Полезность i-ого агента равна

Ui=xi2+g2U_i = x_i^2 + g^2

a) Найдите кривые реакции выбора gig_i одного туземца на выбор другого.

b) Найдите равновесие Нэша, если туземцы выбирают свои gig_i одновременно и независимо.

c) Является ли равновесие Парето-оптимальным?

d) Найдите оптимум, если туземцы максимизируют суммарную полезность. Сравните суммарный g в этом случае и в равновесии. Объясните результат.

Решение

Так как у каждого туземца всего 4 кокоса, выполняется ограничение:

xi+gi=4x_i + g_i = 4

Тогда полезность:

Ui=(4gi)2+(g1+g2)2U_i = (4 − g_i)^2 + (g_1 + g_2)^2

(a) Зафиксируем gjg_j и максимизируем полезность i-го агента:

Ui=(4gi)2+(gi+gj)2max0gi4U_i = (4 − g_i)^2 + (g_i + g_j)^2 → max_{0 ≤ g_i ≤ 4}

Производная по gi:g_i:

2(4gi)+2(gi+gj)=0−2(4 − g_i) + 2(g_i + g_j) = 0

Отсюда кривая реакции:

gi=2gj/2g_i = 2 − g_j / 2

(b) В равновесии Нэшаg1=g2=g g_1 = g_2 = g. Подставляем:

g=2g/2g = 2 − g / 2

g=4/3g = 4 / 3

Тогда:

g1=g2=4/3,g_1 = g_2 = 4 / 3,

g=8/3,g = 8 / 3,

x1=x2=8/3x_1 = x_2 = 8 / 3

(c) Равновесие не является Парето-оптимальным: можно увеличить g1иg2g_1 и g_2 одновременно, пожертвовав частью частного потребления, но увеличив g2g^2 настолько, что полезность обоих агентов возрастет.

(d) Максимизируем суммарную полезность:

W=(4g1)2+(4g2)2+2(g1+g2)2W = (4 − g_1)^2 + (4 − g_2)^2 + 2(g_1 + g_2)^2

В силу симметрии g1=g2=gg_1 = g_2 = g. Тогда:

W=2(4g)2+8g2W = 2(4 − g)^2 + 8g^2

W=3216g+10g2W = 32 − 16g + 10g^2

Максимум достигается на границе g=4g = 4:

g1=g2=4,g_1 = g_2 = 4,

g=8g = 8

В общественном оптимуме вклад в общественное благо больше, чем в равновесии Нэша, из-за проблемы безбилетника.

2. Трое пиратов независимо выбирают вклад xi0x_i ≥ 0 в общий банк. После этого банк увеличивается в n раз и делится поровну между всеми. У пиратов 4, 5 и 8 монет.

a) Найдите равновесие Нэша при n=2.n = 2.

b) Найдите равновесие Нэша при n=10.n = 10.

Решение

(a) При n=2n = 2 прибыль i-го пирата:

πi=2(x1+x2+x3)/3xiπ_i = 2(x_1 + x_2 + x_3)/3 − x_i

Это линейно убывающая функция по x_i, поэтому оптимум:

x1=0,x_1 = 0,

x2=0,x_2 = 0,

x3=0x_3 = 0

Равновесие Нэша: (0; 0; 0).

(b) При n=10n = 10 прибыль i-го пирата:

πi=10(x1+x2+x3)/3xiπ_i = 10(x_1 + x_2 + x_3)/3 − x_i

Функция линейно возрастает по xix_i, поэтому оптимум — максимальный вклад:

x1=4,x_1 = 4,

x2=5,x_2 = 5,

x3=8x_3 = 8

Равновесие Нэша: (4; 5; 8).