Juegos Comojugar PDF

TEORÍA DE JUEGOS
¿Cómo
Có jjugar??
¿Estrategias puras o mixtas?
Parte I
J g de
Juegos d suma cero
Bart y Lisa aplican
p maximin:
L1 = 0 L2 = 1 L3 = 2
B1 = 0 2 −5 −5
B2 = 1 3 2 −5
B3 = 2 3 3 2
B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2

⎝ j ⎠
( )
i
L * = min max (π ij ) = min (3,3, 2 ) = 2

j i
J g de
Juegos d suma cero
Bart y Lisa aplican
p maximin:
Solución estrategias puras:

B*=B3, L*=L3, Л=2
Punto de Silla :
i ⎝ j ⎠ j
(
max⎛⎜ min (π ij ) ⎟⎞ = min max(π ij )
i
)
J g de
Juegos d suma constante
t t
y Punto de silla: condición necesaria y suficiente
para encontrar equilibrio en estrategias puras
⎧⎪π io , j ≥ π io , jo ∀j = 1K m
∃io , jo / ⎨
⎪⎩π i , jo ≤ π io , jo ∀i = 1K n
Punto de silla
¿Y si no hay un punto de silla?
Lisa
Papel Tijeras Piedra
Bart
Papel 0,0 -1,1
1,1 1,-1
1, 1
Tijeras 1,-1
1, 1 0,0 -1,1
1,1
Piedra -1,1
1,1 1,-1
1, 1 0,0
Definiciones
y Estrategia mixta:
jugada con una probabilidad p
y E t t i pura:
Estrategia
jugada con una probabilidad p=1
y Distribución de probabilidad subjetiva:
un jugador cree que el otro elegirá la estrategia k
con probabilidad лk,
¿Y si no hay un punto de silla?
Estrategia mixta:
y Distribución de pprobabilidad asociada con el conjunto
j
de estrategias puras de un jugador.
P = ( p1 , p2 ,K , pn ) con pi ∈ [1,0] y ∑ pi = 1;
i
pi es la probabilidad de jugar la estrategia Ai

Estrategias mixtas
y Juego bipersonal
y B jjuega
g Bi con p
probabilidad pi ((P))
y L juega Lj con probabilidad qj (Q)
Def. Valor esperado del juego:
( )
E (P, Q ) = ∑ E B L j q j = ∑ E (L Bi )pi = ∑∑ π ij pi q j
j i i j
p, q son probabilidades subjetivas

Piedra, papel
Piedra, papel,, tijeras
tijeras::
deja que adivine…
adivine…
"Good ol' rock.
Nuthin' beats
Pb(rock)=1 that!"
TEORÍA DE JUEGOS
¿Cómo
Có jjugar??
Parte II
Ejemplo: cara / cruz
y Fila y Columna escriben cara o cruz en un papel
y Si escriben
ib llo mismo,
i Columna
C l lle paga 1 a Fila
Fil
y Si escriben algo diferente, Fila le paga 1 a
Columna
Ejemplo: cara / cruz
Estrategia mixta:
y Fila juega cara con
probabilidad 2/3
Columna
y Columna juega cruzcru
¿Cuál es el valor Cara Cruz
esperado
d ddell juego dde
Fila? Cara 1,-1 -1,1
Fil
Fila
Cruz -1,1 1,-1
Teorema Minimax (I)
y En un juego bipersonal de suma constante, el valor
p
esperado del juego
j g tiene siempre,
p , al menos un
punto de silla:
P ⎝ Q ⎠
(
Q P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
Todo juego bipersonal de suma constante tiene

solución
Equilibrio en estrategias mixtas
Teorema:
y En un juego bipersonal de suma constante, El valor esperado del juego
tiene siempre, al menos un punto de silla:
P ⎝ Q ⎠ Q
(
P
)
max⎜⎛ min ( E ( P, Q) ⎟⎞ = min max E ( P, Q) = E ( P*, Q*)
Todo juego bipersonal de suma constante tiene solución

Juegos
y Cooperativos:
y Coalición
y Negociación de las reglas del juego
y Coordinación
y Amenazas y promesas confiables
y No cooperativos:
y N personas actúan independientemente
y No hay coaliciones posibles
y Acciones racionales
Solución
ó juegos no cooperativos
y Minimax
y Todo juego bipersonal de suma cero tiene una estrategia mixta
óptima
p para
p cada jugador
j g
y Espera lo mejor, prepárate para lo peor
y Equilibrio de Nash
y Solución a una clase más amplia de juegos no cooperativos
y Muestra que puede haber más de una solución
y La extiende a un número finito de jugadores
¿Cómo jugar?
jugar?
¿Cuál es la solución del juego?
juego?
y Minimax
y Equilibrio de Nash
y Equilibrio en estrategias dominantes
y Eliminación de estrategias dominadas
y Inducción hacia atrás
¿Qué
é es un equilibrio?
Columna
Cara Cruz
Cara 2,1 0,0

Fila
Cruz 0,0 1,2
Juego bipersonal,
bipersonal, no cooperativo
Definiciones:
F: conjunto de estrategias mixtas de Fila
pf = probabilidad de jugar la estrategia f Є F
C: conjunto de estrategias mixtas de Columna
pc = probabilidad de jugar la estrategia c Є C
Objetivo:
Encontrar la mezcla de estrategias mixtas (pf, pc) que constituye
un equilibrio
S l ió
Solución pf pc
y Función
F ió pagos Fil
Fila: uf(f,c)
(f )
y Лc , Лf,f son las probabilidades subjetivas
que f y c tienen sobre las decisiones del
otro
y pf,pc: estrategias
t t i mixtas
i t
y pfЛc: probabilidad –desde
desde el punto de
vista de f- de que se juegue la estrategia
(f,c)
S l ió
Solución
y Fila escoge la distribución de probabilidad (pf)
que maximiza el valor esperado de sus pagos:
E[pagosf] = ∑f∑cpfЛcuf(f,c)
(f c)
y Columna busca maximizar:
E[pagosc] = ∑f∑cpcЛfuc(f,c)
Equilibrio de Nash
Equilibrio de Nash: El equilibrio de Nash consiste en las
conjeturas sobre la probabilidad de ocurrencia de las
Лf, ) y la probabilidad de que dichas
estrategias (Лc ,Л
estrategias sean elegidas (pf, pc), tal que:
1
1. L conjeturas
Las j t t pf = Лf, pc = Лc; y
son correctas:
2. Cada jugador escoge (pf) y (pc) de forma que
maximiza su utilidad esperada, dadas sus conjeturas.
E ilib i d
Equilibrio de N
Nash
h
Estrategias puras
Un equilibrio de Nash en estrategias puras es un par (f*,
(f , cc*)) tal que
uf(f*,c*) ≥ uf(f,c*) para cada estrategia f de F, y
uc(f*,
(f* c*)
*) ≥ uc(f*,c)
(f* ) para cada
d estrategia
t t i c dde C C.
¿Cuál es el equilibrio de Nash en
estrategias puras?
Columna
Cara Cruz
Cara 20,80 70,30
Fila
Cruz 90,10 30,70

Teorema Existencia (Nash)
y Suponga que un juego tiene un número finito de estrategias
para cada jugador. Entonces existe al menos un equilibrio de
Nash
as en
e estrategias
est ateg as mixtas
tas
¿Cuál es la estrategia mixta de
equilibrio?
Columna
Cara Cruz
Cara 20,80 70,30
Fila
Cruz 90,10 30,70

Columna Estrategias
E i
c s Fila:
c 20,80 70,30 Cara, pc; Sello, ps
Fila Columna:
s 90,10 30,70
Cara, Лc; Sello Лs
E[ pagos fila ] = ∑∑ prπ c u (r , c)

r c
fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30)

E[ pagos fila
E[ pagoscol ] = ∑∑ prπ c u (r , c)
r c
E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)

Planteamiento del problema
fila :
max pc (π c * 20 + π s * 70) + ps (π c * 90 + π s * 30)
s.t
pc + p s = 1
pc , p s ≥ 0
columna :
max π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)
s.t
πc +πs =1
π c ,π s ≥ 0
Planteamiento del problema (II)
fila :
fil columna :
max max
[ pc (π c * 20 + π s * 70) [π c ( pc * 80 + ps *10)
+ ps (π c * 90 + π s * 30)] + π s ( pc * 30 + ps * 70)]
s.t
s.t
π s = 1− π c
p s = 1 − pc
max
[ pc (π c * 20 + π s * 70)} [π c ( pc * 80 + ps *10)
+ (1 − pc )(π c * 90 + π s * 30)] + (1 − π c )( pc * 30 + ps * 70)]
∂u ∂π ∂u ∂p
≤ 0, =0 ≤ 0, =0
∂pc ∂pc ∂π c ∂π c
− 70π c + 40π s ≤ 0 50 pc − 60 ps ≤ 0
Función de reacción
(Mejor respuesta)
Лs
Mejor respuesta de fila a
cualquier
l i estrategia
t t i d de
columna
-70Л c+40Л s=0
fila :
− 70π c + 40π s = 0
7/11
πc,π s ≥ 0
πc + πs = 1
4/11 Лc
Л c+ Л s=1
ps
Mejor respuesta de
columna
l a cualquier
l i
estrategia de fila
50p c-60p s=0

columna :
50 pc − 60 ps = 0 5/11
pc + p s = 1
pc , p s ≥ 0 6/11 pc
p c+ p s=1
Equilibrio de Nash
Л c=4/11 Columna
p c=6/11 cara cruz
cara 20,80 70,30
Fila
cruz 90,10 30,70

Batalla de los sexos:
sexos:
¿Cuántos equilibrios de Nash hay?
Ananías
misa fútbol
misa 4,1 0,0

Tola
fútbol 00
0,0 14
1,4
El dilema del prisionero II
y Wally y Dilbert son compañeros de trabajo
y Cada uno debe evaluar el desempeño del otro
y La calificación determinará un aumento de sueldo
y El aumento será mayor si el propio desempeño es superior al del otro
Dilbert Wally
Dilbert
“Rat out”
Wally
(denigrar) Alabar
“Rat out”
0,0 5,-1
(denigrar)
Alabar -1,5 1,1

Solución
ó por dominación
ó
y Definiciones:
y Estrategia dominante
y Estrategia débilmente dominante
y Estrategia dominada
y Eliminación iterada de estrategias dominadas
Dominación
ó
y ss’i domina estrictamente a si si y solo sí:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i
z s*i domina débilmente a si si y solo sí:
u i ( s * i , s − i ) ≥ u i ( s i , s − i ),
) ∀ s− i ∈ S −i
y
u i ( s *i , s−i ) > u i ( si , s−i )∃ s− i ∈ S −i
Dominación
ó estricta
y s’i es una estrategia estrictamente dominante
ppara el jjugador
g i si:
ui ( s 'i , s−i ) > ui ( si , s−i ), ∀( si , s−i ) ∈ S , si ≠ s 'i
s’i es superior a todas las otras estrategias de i

E t t gi estrictamente
Estrategia ti t t dominante
d i t
Dilbert
“Rat out”
W ll
Wally
(denigrar) Alabar
“Rat
Rat out”
out
0,0 5,-1
(denigrar)
Alabar -1,5 1,1
Solución: {Rat-out, Rat-out}

Equilibrio y estrategias dominantes
y Dilema del prisionero II:
y Rat-Out estrictamente dominante para Wally y Dilbert
y {Rat-out, Rat-out} es el equilibrio
y El equilibrio
q en estrategias
g dominantes es el equilibrio
q de Nash
Dominación
ó débil
é
y s’i es una estrategia débilmente dominante para el jugador i si
s’i domina débilmente a todas las otras estrategias de i
z s*i domina débilmente a si si y solo sí:

u i ( s * i , s − i ) ≥ u i ( s i , s − i ), ∀ s − i ∈ S − i
y
u i ( s *i , s −i ) > u i ( si , s −i )∃ s − i ∈ S −i
Ejemplo: estrategia débilmente
dominante
2
1 Izquierda Derecha
Arriba 7,3 5,3
Solución: {Arriba, Izquierda}

Abajo 7,0 3,-1
Estrategias dominantes
y Las estrategias dominantes definen la solución del juego
y Racionalidad:
y Los jugadores prefieren las estrategias dominantes,
dominantes si existen
M h jjuegos no ti
Muchos tienen estrategias
t t i
dominantes
Dominación
ó
Et t i d
Estrategia dominada:
i d s**i es dominada
d i d por s’i si:
i
ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ),) ∀si

ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ),
) ∃sˆ−i
Estrategia no dominada s*i es no dominada si
no existe s’i tal que:
ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i

Solución
ó por dominación
ó
y Estrategias no dominadas preferibles a las dominadas
y Un jugador racional no juega estrategias dominadas
y Un
U jugador
j d racional
i l no espera que los
l otros
t jjuegen
estrategias dominadas
Elimine estrategias indeseables

Ejemplo: eliminación iterativa de
Ejemplo:
Columna
Izquierda Derecha
Fila
Arriba 11
1,1 01
0,1
Medio 0,2 1,0
Abajo 0,-1 0,0

Problemas de la eliminación iterativa de
y Capas de racionalidad
y Una estrategia se vuelve dominada en la ronda de eliminación
#
#15?
y El orden de eliminación importa
y Estrategias débilmente dominantes
y Múltiples resultados
y Estrategias débilmente dominantes
y No existencia de estrategias dominadas
Columna
Fil
Fila Izquierda Centro Derecha
Arriba 4,5 1,6 5,6
Medio 3,5 2,5 5,4
Abajo
j 2,5
, 2,0
, 7,0
,
Ejemplo:
Columna
Fil
Fila Izquierda Centro Mala
Arriba 1,-1 -1,1 0,-2
Medio -1,1 1,-1 0,-2
Mala -2,0
, -2,0
, -2,-2
,
¿Cuál es la estrategia dominante?
dominante?
Columna
C
Cara S ll
Sello
Cara 1,-1 -1,1
Fila
Sello -1,1 1,-1

¿Porqué podemos determinar las estrategias
dominadas usando únicamente los pagos?
Competencia a la Bertrand
y Dos firmas en un mercado pueden cargar precios alto,
alto
medio, bajo
y Si cargan el mismo precio
precio, comparten el mercado
equitativamente
y Quien cargue el menor precio,
precio gana todo el mercado
Competencia a la Bertrand
Firma 2
Firma 1 Alto Medio Bajo
Alto
o 6,6 0,10
0, 0 0,8
Medio 10,0 5,5 0,8
Bajo 8,0 8,0 4,4

Juegos Comojugar PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Juegos Comojugar PDF

Enviado por

Direitos autorais:

Formatos disponíveis

TEORÍA DE JUEGOS

B * = max ⎛⎜ min (π ij ) ⎞⎟ = max (− 5 , − 5 , 2 ) = 2

L * = min max (π ij ) = min (3,3, 2 ) = 2

Solución estrategias puras:

pi es la probabilidad de jugar la estrategia Ai

p, q son probabilidades subjetivas

Todo juego bipersonal de suma constante tiene

Todo juego bipersonal de suma constante tiene solución

Cara 2,1 0,0

Cara 20,80 70,30

Cruz 90,10 30,70

Cara 20,80 70,30

Cruz 90,10 30,70

E[ pagos fila ] = ∑∑ prπ c u (r , c)

fil ] = pc (π c * 20 + π s * 70) + p s (π c * 90 + π s * 30)

E[ pagoscol ] = π c ( pc * 80 + ps *10) + π s ( pc * 30 + ps * 70)

50p c-60p s=0

p c=6/11 cara cruz

cara 20,80 70,30

cruz 90,10 30,70

misa 4,1 0,0

Alabar -1,5 1,1

ui ( s 'i , s−i ) > ui ( si , s−i ), ∀s−i ∈ S −i

z s*i domina débilmente a si si y solo sí:

s’i es superior a todas las otras estrategias de i

Alabar -1,5 1,1

Solución: {Rat-out, Rat-out}

z s*i domina débilmente a si si y solo sí:

Arriba 7,3 5,3

Solución: {Arriba, Izquierda}

ui ( s 'i , s−i ) ≥ ui ( s *i , s−i ),) ∀si

ui ( s 'i , sˆ−i ) > ui ( s *i , sˆ−i ), ∃sˆ−i

Elimine estrategias indeseables

Medio 0,2 1,0

Abajo 0,-1 0,0

Arriba 4,5 1,6 5,6

Medio 3,5 2,5 5,4

Arriba 1,-1 -1,1 0,-2

Medio -1,1 1,-1 0,-2

Cara 1,-1 -1,1

Sello -1,1 1,-1

Medio 10,0 5,5 0,8

Bajo 8,0 8,0 4,4

Você também pode gostar

E[ pagoscol ] = π c ( pc * 80 + ps 10) + π s ( pc 30 + ps * 70)