Escolar Documentos
Profissional Documentos
Cultura Documentos
¿Cómo
Có jjugar??
¿Estrategias puras o mixtas?
Parte I
J g de
Juegos d suma cero
Bart y Lisa aplican
p maximin:
L1 = 0 L2 = 1 L3 = 2
B1 = 0 2 −5 −5
B2 = 1 3 2 −5
B3 = 2 3 3 2
Punto de Silla :
i ⎝ j ⎠ j
(
max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij )
i
)
J g de
Juegos d suma constante
t t
y Punto de silla: condición necesaria y suficiente
para encontrar equilibrio en estrategias puras
⎧⎪π io , j ≥ π io , jo ∀j = 1K m
∃io , jo / ⎨
⎪⎩π i , jo ≤ π io , jo ∀i = 1K n
Punto de silla
¿Y si no hay un punto de silla?
Lisa
Papel Tijeras Piedra
Bart
Papel 0,0 -1,1
1,1 1,-1
1, 1
Tijeras 1,-1
1, 1 0,0 -1,1
1,1
Piedra -1,1
1,1 1,-1
1, 1 0,0
Definiciones
y Estrategia mixta:
jugada con una probabilidad p
y E t t i pura:
Estrategia
jugada con una probabilidad p=1
y Distribución de probabilidad subjetiva:
un jugador cree que el otro elegirá la estrategia k
con probabilidad лk,
¿Y si no hay un punto de silla?
Estrategia mixta:
y Distribución de pprobabilidad asociada con el conjunto
j
de estrategias puras de un jugador.
P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1;
i
( )
E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j
j i i j
¿Cómo
Có jjugar??
Parte II
Ejemplo: cara / cruz
y Fila y Columna escriben cara o cruz en un papel
y Si escriben
ib llo mismo,
i Columna
C l lle paga 1 a Fila
Fil
y Si escriben algo diferente, Fila le paga 1 a
Columna
Ejemplo: cara / cruz
Estrategia mixta:
y Fila juega cara con
probabilidad 2/3
Columna
y Columna juega cruzcru
¿Cuál es el valor Cara Cruz
esperado
d ddell juego dde
Fila? Cara 1,-1 -1,1
Fil
Fila
Cruz -1,1 1,-1
Teorema Minimax (I)
y En un juego bipersonal de suma constante, el valor
p
esperado del juego
j g tiene siempre,
p , al menos un
punto de silla:
P ⎝ Q ⎠
(
Q P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
P ⎝ Q ⎠ Q
(
P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
y Minimax
y Equilibrio de Nash
y Equilibrio en estrategias dominantes
y Eliminación de estrategias dominadas
y Inducción hacia atrás
¿Qué
é es un equilibrio?
Columna
Cara Cruz
Objetivo:
Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye
un equilibrio
S l ió
Solución pf pc
y Función
F ió pagos Fil
Fila: uf(f,c)
(f )
y Лc , Лf,f son las probabilidades subjetivas
que f y c tienen sobre las decisiones del
otro
y pf,pc: estrategias
t t i mixtas
i t
y pfЛc: probabilidad –desde
desde el punto de
vista de f- de que se juegue la estrategia
(f,c)
S l ió
Solución
y Fila escoge la distribución de probabilidad (pf)
que maximiza el valor esperado de sus pagos:
E[pagosf] = ∑f∑cpfЛcuf(f,c)
(f c)
y Columna busca maximizar:
E[pagosc] = ∑f∑cpcЛfuc(f,c)
Equilibrio de Nash
Equilibrio de Nash: El equilibrio de Nash consiste en las
conjeturas sobre la probabilidad de ocurrencia de las
Лf, ) y la probabilidad de que dichas
estrategias (Лc ,Л
estrategias sean elegidas (pf, pc), tal que:
1
1. L conjeturas
Las j t t pf = Лf, pc = Лc; y
son correctas:
2. Cada jugador escoge (pf) y (pc) de forma que
maximiza su utilidad esperada, dadas sus conjeturas.
E ilib i d
Equilibrio de N
Nash
h
Estrategias puras
Un equilibrio de Nash en estrategias puras es un par (f*,
(f , cc*)) tal que
uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y
uc(f*,
(f* c*)
*) ≥ uc(f*,c)
(f* ) para cada
d estrategia
t t i c dde C C.
¿Cuál es el equilibrio de Nash en
estrategias puras?
Columna
Cara Cruz
Fila
Cara Cruz
Fila
fila :
− 70π c + 40π s = 0
7/11
πc,π s ≥ 0
πc + πs = 1
4/11 Лc
Л c+ Л s=1
Equilibrio en estrategias mixtas
ps
Mejor respuesta de
columna
l a cualquier
l i
estrategia de fila
p c+ p s=1
Equilibrio de Nash
Л c=4/11 Columna
Fila
Ananías
misa fútbol
Dilbert Wally
El dilema del prisionero II
Dilbert
“Rat out”
Wally
(denigrar) Alabar
“Rat out”
0,0 5,-1
(denigrar)
u i ( s * i , s − i ) ≥ u i ( s i , s − i ),
) ∀ s− i ∈ S −i
y
u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i
Dominación
ó estricta
y s’i es una estrategia estrictamente dominante
ppara el jjugador
g i si:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i
Dilbert
“Rat out”
W ll
Wally
(denigrar) Alabar
“Rat
Rat out”
out
0,0 5,-1
(denigrar)
M h jjuegos no ti
Muchos tienen estrategias
t t i
dominantes
Dominación
ó
Et t i d
Estrategia dominada:
i d s**i es dominada
d i d por s’i si:
i
Arriba 11
1,1 01
0,1
Columna
Fil
Fila Izquierda Centro Derecha
Abajo
j 2,5
, 2,0
, 7,0
,
Ejemplo: eliminación iterativa de
Ejemplo:
estrategias dominadas
Columna
Fil
Fila Izquierda Centro Mala
Mala -2,0
, -2,0
, -2,-2
,
¿Cuál es la estrategia dominante?
dominante?
Columna
C
Cara S ll
Sello
Fila
Alto
o 6,6 0,10
0, 0 0,8