Você está na página 1de 5

Notas de clase de Teoría de Juegos - Marcela Eslava 18

2.3. Estrategias Mixtas

Definiciones:
• Una “Estrategia Pura” para i es un elemento del espacio de estrategias de i. Entonces, lo que
hasta este momento hemos denominado como "estrategias" son en realidad "estrategias mixtas".
• Una “Estrategia Mixta” es una distribución de probabilidad sobre el espacio de estrategias de i.

Entonces, si Si={si1, si2, ..., sik}:


Todo si∈Si es una estrategia pura.
Toda combinación
{p , p }
K
1
i
2
i ,....., p iK Tal que ∑ p ik = 1, p ik ∈ [0,1] ∀k
k =1
es una estrategia mixta. Note que la estrategia mixta {1,0,0,...,0} es la estrategia pura si1

Cálculo de las ganancias esperadas al adoptar una estrategia mixta:


Son “esperadas” porque al jugar una estrategia mixta el jugador no sabe que acción va a tomar, sólo sabe
con qué probabilidad tomará cada acción. Entonces, el jugador no sabe exactamente cuánto ganaría aún
si sabe cuál es la acción que el otro toma.

Por ejemplo, en la batalla de los sexos


Podemos denotar una estrategia mixta de "El" como (p,1-p), donde p es la probabilidad que le asigna a
jugar T, y una estrategia mixta de "Ella" como (q,1-q) donde q es la probabilidadque le asigna a jugar T.

ELLA T F
EL
T (1,2) (0,0)
F (0,0) (2,1)

EUEl=Prob(T,T)*1+Prob(T,F)*0+Prob(F,T)*0+Prob(F,F)*2

⎧ 1
T Con Probabilidad
⎪⎪ 2
Si El juega una estrategia Mixta ⎨
⎪ F Con Probabilidad 1
⎪⎩ 2
y ella Juega (T):

EUEl[(1/2,1/2),T]=1/2*1+0*0+0*0+1/2*2=3/2

⎧ 2
T Con Probabilidad
⎪⎪ 3
Si ella más bien juega ⎨
⎪ F Con Probabilidad 1
⎪⎩ 3
EUella[(1/2,1/2),(2/3,1/3)]=1/2*2/3*1+0*0+0*0+1/2*1/3*2=2/3
Notas de clase de Teoría de Juegos - Marcela Eslava 19

Note que la probabilidad de estar, por ejemplo, en (T,T) (donde la primera componente es lo que El
mueve) es el producto de la probabilidad con que Ella juega T y la probabilidad con que El juega T
porque esas probabilidades son independientes entre sí. Este es el caso porque el juego es estático, de tal
manera que un jugador no puede condicionar su estrategia en la del otro.

De forma general en juegos estáticos con espacios de estrategias finitos,

({ }{ })
EU i p i1 , p i2 ,..., p ik , p 1−i , p −2i ,..., p −ki = ∑ Pr(s , s i −i ) * U i ( s i , s −i )
( si , s− i )∈Si × S − i

Ejemplo 2.7: Solución de un juego usando estrategias mixtas.

L R
T (2,-2) (0,0)
B (0,0) (1,-1)

Este juego no tiene EN en estrategias puras. ¿Existen EN si se permiten estrategias mixtas? Como ya es
usual, la ruta que seguimos para solucionar este juego es:
• Encontrar la función de reacción de cada jugador.
• Encontrar la intersección de las funciones de reacción.

Notación:

J1 Juega (T) con Probabilidad “p”, y juega (B) con Probabilidad “1-p”. Denotando (p,1-p).
J2 Juega (L) con Probabilidad “q”, y juega (R) con Probabilidad “1-q”.Denotando (q, 1-q).

Al permitir estrategias mixtas, el objetivo del jugador 1 es maximizar el valor esperado de sus utilidades
teniendo como variable de decisión ‘p’.

Max E [U 1 ] = pq 2 + p (1 − q )0 + (1 − p )q 0 + (1 − p )(1 − q )1 = 1 − p − q + 3 pq
p
Como esta utilidad esperada es lineal en p, el p óptimo depende de si E[U1] es creciente o decreciente en
p:
⎧< 0, si q < 1
⎪ 3
∂E [U 1 ] ⎪
= −1 + 3q = ⎨= 0, si q = 1
∂ p ⎪
3
⎪⎩> 0, si q > 13

Por lo tanto la curva de reacción del jugador 1 es:


⎧ p = 1, si q > 1
⎪ 3

FR1 = ⎨ p ∈ [0,1], si q = 1
3

⎪⎩ p = 0, si q < 13
Notas de clase de Teoría de Juegos - Marcela Eslava 20

Si seguimos un proceso similar para el jugador 2, llegamos a la siguiente curva de reacción:


⎧q = 0, si p > 1
⎪ 3

FR2 = ⎨q ∈ [0,1], si p = 1
3

⎪⎩q = 1, si p < 3
1

En el plano (p, q), las curvas de reacción se ven de la siguiente manera:

Por lo tanto, el equilibrio de Nash en estrategias mixtas es:


{(p = 13 , 1 − p = 2 3 ), (q = 13 ,1 − q = 2 3 )}, o de manera abreviada (p = 13 , q = 13 ).
¿Tiene sentido hablar de estrategias mixtas? Las estrategias mixtas se pueden ver como una forma de
permitir incertidumbre: si i = 1 desconoce la acción que tomará i = 2, podría suponer cierta distribución
de probabilidad sobre la escogencia del otro (estrategia mixta), y basado en esta “creencia” decide como
actuar. Esto nos da una interpretación intuitiva de las curvas de reacción de arriba. Otra interpretación
asociada a las estrategias mixtas es la siguiente: si se juega de manera independiente por muchas
personas y/o muchas veces, una estrategia mixta (1 3 , 2 3 ) podría leerse como “1/3 de las veces se
jugó A, el resto de las veces se jugó B”. Por ejemplo, la “batalla de los sexos” tiene, además de dos
equilibrios en estrategias puras, el siguiente equilibrio de Nash en estrategias mixtas: Ella juega (T) con
probabilidad 2/3, El juega (F) con probabilidad 2/3. Una lectura sería que 2/3 de las mujeres irá a teatro
y 2/3 de los hombres ira a fútbol.

Pero aún con esas interpretaciones, las estrategias mixtas son menos intuitivas que las estrategias puras.
¿Por qué entonces usarlas? En el ejemplo 2.7 no hay equilibrio de Nash en estrategias puras, pero sí lo hay
en estrategias mixtas. Este resultado es “general”y nos lleva al Teorema de Nash.

2.4. Teorema de Nash


Notas de clase de Teoría de Juegos - Marcela Eslava 21
Todo juego con un número finito de jugadores y acciones disponibles para cada jugador tiene al menos un
equilibrio de Nash, posiblemente en estrategias mixtas.

Aunque la demostración está más allá del alcance de estas notas, discutiremos su intuición. La
demostración tiene 2 partes:

I. Un Equilibrio de Nash es un punto fijo del conjunto de curvas de reacción.


II. Un juego finito con estrategias mixtas tiene los requisitos para generar conjuntos de curvas de
reacción que tienen al menos un punto fijo.

Recuerde que X* es un punto fijo de F(X) si X* = F(X*).

I. Lo primero es mostrar que un EN es un punto fijo de una cierta función o correspondencia. El


conjunto de estrategias (s , s ,..., s )
*
1
*
2
*
N es un equilibrio de Nash si

i (
s = FRi s , s ,..., s , s ,...s
* *
1
*
2
*
i −1
*
i +1
*
N ) para todo i, donde FR simboliza la curva de reacción de i. Uno
i

puede definir una correspondencia que agrupe todas las curvas de reacción como
Γ( s1 , s 2 ,...., s n ) = (FR1 ( s 2 , s 3 ,...., s n ), FR2 ( s1 , s 3 ,...., s N ), ..., FR N ( s1 , s 2 ,...., s N −1 ) )
( ) (
Note que Γ s1 , s 2 ,..., s N = s1 , s 2 ,..., s N , con lo cual
* * * * * *
) (s , s ,..., s )
*
1
*
2
*
N es un punto fijo de la
correspondencia Γ . Un equilibrio de Nash, por tanto, es un punto fijo.

(s , s ,..., s ) = (FR (s , s ,..., s


*
1
*
2
*
N 1
*
1
*
2
*
N )
), FR2 ( s1* , s 2* ,..., s *N ), ..., FR N ( s1* , s 2* ,..., s *N ) .Entonces un EN
es un Punto Fijo.

II. Necesitamos ahora demostrar que la correspondencia Γ tiene al menos un punto fijo, cuando el
juego es finito y se permiten estrategias mixtas. Para esto, usamos el siguiente resultado ya bien
conocido:

Teorema del punto fijo de Kakutani: Sea Γ : Ω → Ω una correspondencia “semicontinua desde arriba”
definida en Ω un conjunto no vacío, compacto(cerrado y acotado) y convexo, y donde Ω es y tal que para
todo x ∈ Ω el conjunto Γ( x) ⊂ S (es decir, el recorrido está contenido en el dominio). Entonces Γ tiene
al menos un punto fijo.

Note que, si el juego es finito y se permiten estrategias mixtas, para Γ se cumple lo siguiente:

1. El dominio es el conjunto que reúne las estrategias disponibles a todos los jugadores (S1, S2, ....,
SN) y todas las distribuciones de probabilidad (estrategias mixtas) sobre cada espacio de
estrategias, y el recorrido está contenido en ese mismo conjunto.
2. El dominio es
• Compacto porque el juego es finito, así que (S1, S2, ...., SN) es cerrado y acotado, y estas
propiedades no se afectan al considerar estrategias mixtas (que sólo afectan el "interior"
del conjunto, no sus "bordes").
• Convexo, porque al permitir estrategias mixtas permitimos todas las combinaciones
lineales posibles entre los distintos puntos del conjunto de espacios de estrategias.
3. La función de reacción es semi-continua desde arriba (ver un ejemplo gráfico de "semi-
continuidad desde arriba" más abajo), porque si un jugador tiene dos mejores respuestas en
estrategias puras a una combinación de estrategias de sus oponentes, cualquier estrategia mixta
que "mezcle" las dos mejores respuestas puras, también será mejor respuesta. Esto ocurre porque
Notas de clase de Teoría de Juegos - Marcela Eslava 22
dos estrategias puras de i sólo pueden ser mejores respuestas a una s-i dada si ambas
estrategias le generan a i la misma utilidad dada s-i . De esta forma, si dos puntos dados son
mejor respuesta a s-i , todos los "puntos intermedios" entre esos dos puntos también son mejor
respuesta.

Ejemplo 2.8: Ilustración de "semicontinuidad desde arriba"