Você está na página 1de 55

TEORÍA DE JUEGOS

¿Cómo
Có jjugar??
¿Estrategias puras o mixtas?
Parte I
J g de
Juegos d suma cero
Bart y Lisa aplican
p maximin:

L1 = 0 L2 = 1 L3 = 2
B1 = 0 2 −5 −5
B2 = 1 3 2 −5
B3 = 2 3 3 2

B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2


⎝ j ⎠
( )
i

L * = min max (π ij ) = min (3,3, 2 ) = 2


j i
J g de
Juegos d suma cero
Bart y Lisa aplican
p maximin:

Solución estrategias puras:


B*=B3, L*=L3, Л=2

Punto de Silla :

i ⎝ j ⎠ j
(
max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij )
i
)
J g de
Juegos d suma constante
t t
y Punto de silla: condición necesaria y suficiente
para encontrar equilibrio en estrategias puras

⎧⎪π io , j ≥ π io , jo ∀j = 1K m
∃io , jo / ⎨
⎪⎩π i , jo ≤ π io , jo ∀i = 1K n
Punto de silla
¿Y si no hay un punto de silla?

Lisa
Papel Tijeras Piedra
Bart
Papel 0,0 -1,1
1,1 1,-1
1, 1

Tijeras 1,-1
1, 1 0,0 -1,1
1,1

Piedra -1,1
1,1 1,-1
1, 1 0,0
Definiciones
y Estrategia mixta:
jugada con una probabilidad p
y E t t i pura:
Estrategia
jugada con una probabilidad p=1
y Distribución de probabilidad subjetiva:
un jugador cree que el otro elegirá la estrategia k
con probabilidad лk,
¿Y si no hay un punto de silla?
Estrategia mixta:
y Distribución de pprobabilidad asociada con el conjunto
j
de estrategias puras de un jugador.

P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1;
i

pi es la probabilidad de jugar la estrategia Ai


Estrategias mixtas
y Juego bipersonal
y B jjuega
g Bi con p
probabilidad pi ((P))
y L juega Lj con probabilidad qj (Q)
Def. Valor esperado del juego:

( )
E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j
j i i j

p, q son probabilidades subjetivas


Piedra, papel
Piedra, papel,, tijeras
tijeras::
deja que adivine…
adivine…
"Good ol' rock.
Nuthin' beats
Pb(rock)=1 that!"
TEORÍA DE JUEGOS

¿Cómo
Có jjugar??
Parte II
Ejemplo: cara / cruz
y Fila y Columna escriben cara o cruz en un papel
y Si escriben
ib llo mismo,
i Columna
C l lle paga 1 a Fila
Fil
y Si escriben algo diferente, Fila le paga 1 a
Columna
Ejemplo: cara / cruz
Estrategia mixta:
y Fila juega cara con
probabilidad 2/3
Columna
y Columna juega cruzcru
¿Cuál es el valor Cara Cruz
esperado
d ddell juego dde
Fila? Cara 1,-1 -1,1
Fil
Fila
Cruz -1,1 1,-1
Teorema Minimax (I)
y En un juego bipersonal de suma constante, el valor
p
esperado del juego
j g tiene siempre,
p , al menos un
punto de silla:

P ⎝ Q ⎠
(
Q P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)

Todo juego bipersonal de suma constante tiene


solución
Equilibrio en estrategias mixtas
Teorema:
y En un juego bipersonal de suma constante, El valor esperado del juego
tiene siempre, al menos un punto de silla:

P ⎝ Q ⎠ Q
(
P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)

Todo juego bipersonal de suma constante tiene solución


Juegos
y Cooperativos:
y Coalición
y Negociación de las reglas del juego
y Coordinación
y Amenazas y promesas confiables
y No cooperativos:
y N personas actúan independientemente
y No hay coaliciones posibles
y Acciones racionales
Solución
ó juegos no cooperativos
y Minimax
y Todo juego bipersonal de suma cero tiene una estrategia mixta
óptima
p para
p cada jugador
j g
y Espera lo mejor, prepárate para lo peor
y Equilibrio de Nash
y Solución a una clase más amplia de juegos no cooperativos
y Muestra que puede haber más de una solución
y La extiende a un número finito de jugadores
¿Cómo jugar?
jugar?
¿Cuál es la solución del juego?
juego?

y Minimax
y Equilibrio de Nash
y Equilibrio en estrategias dominantes
y Eliminación de estrategias dominadas
y Inducción hacia atrás
¿Qué
é es un equilibrio?
Columna

Cara Cruz

Cara 2,1 0,0


Fila
Cruz 0,0 1,2
Juego bipersonal,
bipersonal, no cooperativo
Definiciones:
F: conjunto de estrategias mixtas de Fila
pf = probabilidad de jugar la estrategia f Є F
C: conjunto de estrategias mixtas de Columna
pc = probabilidad de jugar la estrategia c Є C

Objetivo:
Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye
un equilibrio
S l ió
Solución pf pc
y Función
F ió pagos Fil
Fila: uf(f,c)
(f )
y Лc , Лf,f son las probabilidades subjetivas
que f y c tienen sobre las decisiones del
otro
y pf,pc: estrategias
t t i mixtas
i t
y pfЛc: probabilidad –desde
desde el punto de
vista de f- de que se juegue la estrategia
(f,c)
S l ió
Solución
y Fila escoge la distribución de probabilidad (pf)
que maximiza el valor esperado de sus pagos:

E[pagosf] = ∑f∑cpfЛcuf(f,c)
(f c)
y Columna busca maximizar:

E[pagosc] = ∑f∑cpcЛfuc(f,c)
Equilibrio de Nash
Equilibrio de Nash: El equilibrio de Nash consiste en las
conjeturas sobre la probabilidad de ocurrencia de las
Лf, ) y la probabilidad de que dichas
estrategias (Лc ,Л
estrategias sean elegidas (pf, pc), tal que:
1
1. L conjeturas
Las j t t pf = Лf, pc = Лc; y
son correctas:
2. Cada jugador escoge (pf) y (pc) de forma que
maximiza su utilidad esperada, dadas sus conjeturas.
E ilib i d
Equilibrio de N
Nash
h
Estrategias puras
Un equilibrio de Nash en estrategias puras es un par (f*,
(f , cc*)) tal que
uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y
uc(f*,
(f* c*)
*) ≥ uc(f*,c)
(f* ) para cada
d estrategia
t t i c dde C C.
¿Cuál es el equilibrio de Nash en
estrategias puras?
Columna

Cara Cruz

Cara 20,80 70,30

Fila

Cruz 90,10 30,70


Teorema Existencia (Nash)
y Suponga que un juego tiene un número finito de estrategias
para cada jugador. Entonces existe al menos un equilibrio de
Nash
as en
e estrategias
est ateg as mixtas
tas
¿Cuál es la estrategia mixta de
equilibrio?
Columna

Cara Cruz

Cara 20,80 70,30

Fila

Cruz 90,10 30,70


Equilibrio en estrategias mixtas
Columna Estrategias
E i
c s Fila:
c 20,80 70,30 Cara, pc; Sello, ps
Fila Columna:
s 90,10 30,70
Cara, Лc; Sello Лs

E[ pagos fila ] = ∑∑ prπ c u (r , c)


r c

fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30)


E[ pagos fila
E[ pagoscol ] = ∑∑ prπ c u (r , c)
r c

E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)


Planteamiento del problema
fila :
max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30)
s.t
pc + p s = 1
pc , p s ≥ 0
columna :
max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)
s.t
πc +πs =1
π c ,π s ≥ 0
Planteamiento del problema (II)
fila :
fil columna :
max max
[ pc (π c * 20 + π s * 70) [π c ( pc * 80 + ps *10)
+ ps (π c * 90 + π s * 30)] + π s ( pc * 30 + ps * 70)]
s.t
s.t
π s = 1− π c
p s = 1 − pc
max
[ pc (π c * 20 + π s * 70)} [π c ( pc * 80 + ps *10)
+ (1 − pc )(π c * 90 + π s * 30)] + (1 − π c )( pc * 30 + ps * 70)]
∂u ∂π ∂u ∂p
≤ 0, =0 ≤ 0, =0
∂pc ∂pc ∂π c ∂π c
− 70π c + 40π s ≤ 0 50 pc − 60 ps ≤ 0
Función de reacción
(Mejor respuesta)
Лs
Mejor respuesta de fila a
cualquier
l i estrategia
t t i d de
columna
-70Л c+40Л s=0

fila :
− 70π c + 40π s = 0
7/11
πc,π s ≥ 0
πc + πs = 1
4/11 Лc

Л c+ Л s=1
Equilibrio en estrategias mixtas
ps
Mejor respuesta de
columna
l a cualquier
l i
estrategia de fila

50p c-60p s=0


columna :
50 pc − 60 ps = 0 5/11
pc + p s = 1
pc , p s ≥ 0 6/11 pc

p c+ p s=1
Equilibrio de Nash
Л c=4/11 Columna

p c=6/11 cara cruz

cara 20,80 70,30

Fila

cruz 90,10 30,70


Batalla de los sexos:
sexos:
¿Cuántos equilibrios de Nash hay?

Ananías

misa fútbol

misa 4,1 0,0


Tola
fútbol 00
0,0 14
1,4
El dilema del prisionero II
y Wally y Dilbert son compañeros de trabajo
y Cada uno debe evaluar el desempeño del otro
y La calificación determinará un aumento de sueldo
y El aumento será mayor si el propio desempeño es superior al del otro

Dilbert Wally
El dilema del prisionero II

Dilbert
“Rat out”
Wally
(denigrar) Alabar

“Rat out”
0,0 5,-1
(denigrar)

Alabar -1,5 1,1


Solución
ó por dominación
ó
y Definiciones:
y Estrategia dominante
y Estrategia débilmente dominante
y Estrategia dominada
y Eliminación iterada de estrategias dominadas
Dominación
ó
y ss’i domina estrictamente a si si y solo sí:

ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i

z s*i domina débilmente a si si y solo sí:

u i ( s * i , s − i ) ≥ u i ( s i , s − i ),
) ∀ s− i ∈ S −i
y
u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i
Dominación
ó estricta
y s’i es una estrategia estrictamente dominante
ppara el jjugador
g i si:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i

s’i es superior a todas las otras estrategias de i


E t t gi estrictamente
Estrategia ti t t dominante
d i t

Dilbert
“Rat out”
W ll
Wally
(denigrar) Alabar

“Rat
Rat out”
out
0,0 5,-1
(denigrar)

Alabar -1,5 1,1

Solución: {Rat-out, Rat-out}


Equilibrio y estrategias dominantes
y Dilema del prisionero II:
y Rat-Out estrictamente dominante para Wally y Dilbert
y {Rat-out, Rat-out} es el equilibrio
y El equilibrio
q en estrategias
g dominantes es el equilibrio
q de Nash
El dilema del prisionero II
Dominación
ó débil
é
y s’i es una estrategia débilmente dominante para el jugador i si
s’i domina débilmente a todas las otras estrategias de i

z s*i domina débilmente a si si y solo sí:


u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i
y
u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i
Ejemplo: estrategia débilmente
dominante
2
1 Izquierda Derecha

Arriba 7,3 5,3

Solución: {Arriba, Izquierda}


Abajo 7,0 3,-1
Estrategias dominantes
y Las estrategias dominantes definen la solución del juego
y Racionalidad:
y Los jugadores prefieren las estrategias dominantes,
dominantes si existen

M h jjuegos no ti
Muchos tienen estrategias
t t i
dominantes
Dominación
ó
Et t i d
Estrategia dominada:
i d s**i es dominada
d i d por s’i si:
i

ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ),) ∀si


ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ),
) ∃sˆ−i
Estrategia no dominada s*i es no dominada si
no existe s’i tal que:

ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i


Solución
ó por dominación
ó
y Estrategias no dominadas preferibles a las dominadas
y Un jugador racional no juega estrategias dominadas
y Un
U jugador
j d racional
i l no espera que los
l otros
t jjuegen
estrategias dominadas

Elimine estrategias indeseables


Ejemplo: eliminación iterativa de
Ejemplo:
estrategias dominadas
Columna
Izquierda Derecha
Fila

Arriba 11
1,1 01
0,1

Medio 0,2 1,0

Abajo 0,-1 0,0


Problemas de la eliminación iterativa de
estrategias dominadas
y Capas de racionalidad
y Una estrategia se vuelve dominada en la ronda de eliminación
#
#15?
y El orden de eliminación importa
y Estrategias débilmente dominantes
y Múltiples resultados
y Estrategias débilmente dominantes
y No existencia de estrategias dominadas
Ejemplo: eliminación iterativa de
estrategias dominadas

Columna
Fil
Fila Izquierda Centro Derecha

Arriba 4,5 1,6 5,6

Medio 3,5 2,5 5,4

Abajo
j 2,5
, 2,0
, 7,0
,
Ejemplo: eliminación iterativa de
Ejemplo:
estrategias dominadas

Columna
Fil
Fila Izquierda Centro Mala

Arriba 1,-1 -1,1 0,-2

Medio -1,1 1,-1 0,-2

Mala -2,0
, -2,0
, -2,-2
,
¿Cuál es la estrategia dominante?
dominante?
Columna

C
Cara S ll
Sello

Cara 1,-1 -1,1

Fila

Sello -1,1 1,-1


¿Porqué podemos determinar las estrategias
dominadas usando únicamente los pagos?
Competencia a la Bertrand
y Dos firmas en un mercado pueden cargar precios alto,
alto
medio, bajo
y Si cargan el mismo precio
precio, comparten el mercado
equitativamente
y Quien cargue el menor precio,
precio gana todo el mercado
Competencia a la Bertrand
Firma 2
Firma 1 Alto Medio Bajo

Alto
o 6,6 0,10
0, 0 0,8

Medio 10,0 5,5 0,8

Bajo 8,0 8,0 4,4

Você também pode gostar