Escolar Documentos
Profissional Documentos
Cultura Documentos
Definiciones:
• Una “Estrategia Pura” para i es un elemento del espacio de estrategias de i. Entonces, lo que
hasta este momento hemos denominado como "estrategias" son en realidad "estrategias mixtas".
• Una “Estrategia Mixta” es una distribución de probabilidad sobre el espacio de estrategias de i.
ELLA T F
EL
T (1,2) (0,0)
F (0,0) (2,1)
EUEl=Prob(T,T)*1+Prob(T,F)*0+Prob(F,T)*0+Prob(F,F)*2
⎧ 1
T Con Probabilidad
⎪⎪ 2
Si El juega una estrategia Mixta ⎨
⎪ F Con Probabilidad 1
⎪⎩ 2
y ella Juega (T):
EUEl[(1/2,1/2),T]=1/2*1+0*0+0*0+1/2*2=3/2
⎧ 2
T Con Probabilidad
⎪⎪ 3
Si ella más bien juega ⎨
⎪ F Con Probabilidad 1
⎪⎩ 3
EUella[(1/2,1/2),(2/3,1/3)]=1/2*2/3*1+0*0+0*0+1/2*1/3*2=2/3
Notas de clase de Teoría de Juegos - Marcela Eslava 19
Note que la probabilidad de estar, por ejemplo, en (T,T) (donde la primera componente es lo que El
mueve) es el producto de la probabilidad con que Ella juega T y la probabilidad con que El juega T
porque esas probabilidades son independientes entre sí. Este es el caso porque el juego es estático, de tal
manera que un jugador no puede condicionar su estrategia en la del otro.
({ }{ })
EU i p i1 , p i2 ,..., p ik , p 1−i , p −2i ,..., p −ki = ∑ Pr(s , s i −i ) * U i ( s i , s −i )
( si , s− i )∈Si × S − i
L R
T (2,-2) (0,0)
B (0,0) (1,-1)
Este juego no tiene EN en estrategias puras. ¿Existen EN si se permiten estrategias mixtas? Como ya es
usual, la ruta que seguimos para solucionar este juego es:
• Encontrar la función de reacción de cada jugador.
• Encontrar la intersección de las funciones de reacción.
Notación:
J1 Juega (T) con Probabilidad “p”, y juega (B) con Probabilidad “1-p”. Denotando (p,1-p).
J2 Juega (L) con Probabilidad “q”, y juega (R) con Probabilidad “1-q”.Denotando (q, 1-q).
Al permitir estrategias mixtas, el objetivo del jugador 1 es maximizar el valor esperado de sus utilidades
teniendo como variable de decisión ‘p’.
Max E [U 1 ] = pq 2 + p (1 − q )0 + (1 − p )q 0 + (1 − p )(1 − q )1 = 1 − p − q + 3 pq
p
Como esta utilidad esperada es lineal en p, el p óptimo depende de si E[U1] es creciente o decreciente en
p:
⎧< 0, si q < 1
⎪ 3
∂E [U 1 ] ⎪
= −1 + 3q = ⎨= 0, si q = 1
∂ p ⎪
3
⎪⎩> 0, si q > 13
Pero aún con esas interpretaciones, las estrategias mixtas son menos intuitivas que las estrategias puras.
¿Por qué entonces usarlas? En el ejemplo 2.7 no hay equilibrio de Nash en estrategias puras, pero sí lo hay
en estrategias mixtas. Este resultado es “general”y nos lleva al Teorema de Nash.
Aunque la demostración está más allá del alcance de estas notas, discutiremos su intuición. La
demostración tiene 2 partes:
i (
s = FRi s , s ,..., s , s ,...s
* *
1
*
2
*
i −1
*
i +1
*
N ) para todo i, donde FR simboliza la curva de reacción de i. Uno
i
puede definir una correspondencia que agrupe todas las curvas de reacción como
Γ( s1 , s 2 ,...., s n ) = (FR1 ( s 2 , s 3 ,...., s n ), FR2 ( s1 , s 3 ,...., s N ), ..., FR N ( s1 , s 2 ,...., s N −1 ) )
( ) (
Note que Γ s1 , s 2 ,..., s N = s1 , s 2 ,..., s N , con lo cual
* * * * * *
) (s , s ,..., s )
*
1
*
2
*
N es un punto fijo de la
correspondencia Γ . Un equilibrio de Nash, por tanto, es un punto fijo.
II. Necesitamos ahora demostrar que la correspondencia Γ tiene al menos un punto fijo, cuando el
juego es finito y se permiten estrategias mixtas. Para esto, usamos el siguiente resultado ya bien
conocido:
Teorema del punto fijo de Kakutani: Sea Γ : Ω → Ω una correspondencia “semicontinua desde arriba”
definida en Ω un conjunto no vacío, compacto(cerrado y acotado) y convexo, y donde Ω es y tal que para
todo x ∈ Ω el conjunto Γ( x) ⊂ S (es decir, el recorrido está contenido en el dominio). Entonces Γ tiene
al menos un punto fijo.
Note que, si el juego es finito y se permiten estrategias mixtas, para Γ se cumple lo siguiente:
1. El dominio es el conjunto que reúne las estrategias disponibles a todos los jugadores (S1, S2, ....,
SN) y todas las distribuciones de probabilidad (estrategias mixtas) sobre cada espacio de
estrategias, y el recorrido está contenido en ese mismo conjunto.
2. El dominio es
• Compacto porque el juego es finito, así que (S1, S2, ...., SN) es cerrado y acotado, y estas
propiedades no se afectan al considerar estrategias mixtas (que sólo afectan el "interior"
del conjunto, no sus "bordes").
• Convexo, porque al permitir estrategias mixtas permitimos todas las combinaciones
lineales posibles entre los distintos puntos del conjunto de espacios de estrategias.
3. La función de reacción es semi-continua desde arriba (ver un ejemplo gráfico de "semi-
continuidad desde arriba" más abajo), porque si un jugador tiene dos mejores respuestas en
estrategias puras a una combinación de estrategias de sus oponentes, cualquier estrategia mixta
que "mezcle" las dos mejores respuestas puras, también será mejor respuesta. Esto ocurre porque
Notas de clase de Teoría de Juegos - Marcela Eslava 22
dos estrategias puras de i sólo pueden ser mejores respuestas a una s-i dada si ambas
estrategias le generan a i la misma utilidad dada s-i . De esta forma, si dos puntos dados son
mejor respuesta a s-i , todos los "puntos intermedios" entre esos dos puntos también son mejor
respuesta.