Você está na página 1de 124

Captulo 1

Juegos No-Cooperativos con Informaci


on Sim
etrica1

I.

Introducci
on

La teora de las decisiones interactivas clasica (o teora de juegos cl


asica) analiza,
basicamente, la toma de decisiones racionales en terminos de construcciones competitivas (juegos no-cooperativos) y coalicionales (juegos cooperativos) abstradas
de los juegos de salon (poquer, bridge, monopolio, etc.), en los cuales dos o mas
agentes, considerando las acciones de sus oponentes, deben tomar decisiones en el
esfuerzo por obtener las maximas ganancias posibles. Esta abstraccion ha abierto
el espectro de posibilidades de aplicacion al mundo real: los jugadores pueden ser
seres humanos, instituciones, poblaciones de animales, partidos polticos, agentes de
un mercado, etc., a la vez que las estrategias pueden ser de muy diversa ndole. La
teora de juegos tiene en estos campos una habilidad u
nica: la de ser un sistema
de referencia para el estudio de las interacciones, descrito en terminos simples y
universales.
II.

La Teora de Juegos de von Neumann y Morgenstern


[1944]: una visi
on general

En 1928 el matematico h
ungaro-judo John von Neumann [1903-1957] reporto un
curioso descubrimiento a la Sociedad Matematica de Gotinga: haba encontrado una
estrategia racional al problema al que se enfrentan dos oponentes a la hora de
elegir en el lanzamiento de una moneda al aire. Y aunque esto, a primera vista, no
pareciera un gran logro, era el comienzo de una nueva rama de la ciencia: la teora
de juegos.
La prueba de von Neumann, publicada como Zur Theorie der Gesellschaftspiele, se
extenda a otros juegos como el ajedrez y las cartas, y mostraba que exista, en cada
caso, un mejor metodo posible de juego, que era matematicamente determinable.
La mejor estrategia posible o estrategia racional era aquella que le aseguraba
a un jugador la m
axima ventaja, sin importar lo que los oponentes hicieran. Esta
1

Juli
an Arevalo, Francisco Lozano, Sergio Monsalve y Edgar
Villa.

15

16

Un Curso de Teora de Juegos Clasica

estrategia, obviamente, no lo aseguraba ni de la ruina ni de hacerse rico; solamente le


minimizaba la maxima perdida que podra soportar. La estrategia racional indicada
por von Neumann, desde luego, no siempre es practica. Basta pensar en el juego
del ajedrez o el poquer para observar que un calculo como ese podra tomar siglos.
Sin embargo, al comienzo, estas limitaciones eran de importancia secundaria. Lo
sustancial era que existiera una estrategia optima en cada caso, y que el juego
entonces tuviera solucion.
Von Neumann no estaba interesado en ayudarle a alguien en particular a ganar un
juego. Tena la conjetura que un analisis de la estructura general de los juegos sera
de importante valor matematico, y que la solucion a ciertos problemas de juegos
podra arrojar luz sobre algunas discusiones economicas y sociales. Es evidente que
los juegos de estrategias comparten ciertos elementos con la vida real: se deben
tomar decisiones en cada momento y rara vez un jugador tiene el control total de las
variables que determinan el resultado final. Por estas similitudes, a falta de otras,
el estudio de las teoras de interacciones ha venido teniendo una fructfera relacion
con la comprension del comportamiento cotidiano. Fue el austriaco Oskar Morgenstern (1902-1977) el primer economista que clara y explcitamente reconocio que
los agentes deben tener en cuenta la naturaleza interactiva de la economa cuando
y von Neumann se encontraron en Princeton a finales de
toman sus decisiones. El
la decada de 1930 y comenzaron una colaboracion que culmino en el clasico Theory
of Games and Economic Behavior de 1944. Con la publicacion de este monumental
trabajo, la teora de juegos se recibio como una disciplina cientfica.
Todos los juegos que von Neumann y Morgenstern estudiaron en Theory of Games
and Economic Behavior tenan varios elementos en com
un:
1. Un conjunto finito de jugadores (que, como ya dijimos, pueden ser personas,
animales, entidades, etc.) y cada jugador tiene a su disposicion un conjunto
finito de reglas (o estrategias) para jugar.
2. El juego termina despues de un n
umero finito de etapas.
3. Luego de que el juego termina, se le asigna un pago numerico a cada jugador
(que, en general, es positivo si se ha ganado en el juego y negativo si se ha
perdido), que a su vez es una suma ponderada de los pagos recibidos en cada
una de las etapas previas.
4. Existen posibles movimientos de la naturaleza; es decir, se permiten ciertas
formas de aleatoriedad en las decisiones de los jugadores.
5. Cada jugador tiene conocimiento completo (simetrico) de las reglas del juego
y de los jugadores.
Nuestros autores dieron en clasificar estos elementos con tres criterios: n
umero de
jugadores, caractersticas de los pagos, y acuerdos antes de comenzar el juego. Los
captulos III y IV de Theory of Games se concentran en el estudio de los juegos de

17

Juegos No-Cooperativos con Informacion Simetrica

dos personas y suma cero (es decir, lo que pierde un jugador lo recibe el otro). El
captulo V estudia los juegos de tres personas y suma cero. El VI, VII y VIII, los
juegos generales de n personas y suma cero; de cuatro personas y suma cero; y cinco
o mas personas y suma cero, respectivamente; y, al final, el captulo XI lo dedican a
los juegos generales de suma no-cero. A continuacion presentamos, entonces, algunas
de las ideas basicas del trabajo de von Neumann y Morgenstern.

Juegos de Dos Jugadores y Suma Cero


En los juegos de dos jugadores y suma cero, que son, quizas, el tipo de juego mas
simple que podemos encontrar1 , tenemos dos jugadores, 1 y 2, cada uno con un
conjunto finito de estrategias a su disposicion, C 1 y C2 ; y tambien cada uno con
funciones de pago asociadas, 1 y 2 , que dependen no solo de su eleccion particular
sino tambien de la eleccion del otro; es decir, 1 y 2 son funciones con dominio
C1 C2 (el producto cartesiano de C1 y C2 ) y recorrido en los n
umeros reales. Toda
esta informacion se puede resumir en la siguiente bimatriz 2 :
Jugador 2

Jugador 1

1 , 2
11
11

1 , 2
12
12

1 , 2
21
21

1 , 2
22
22

1 , 2
31
31

1 , 2
32
32

..
.

..
.

..
.

1 , 2
i1
i1

1 , 2
i2
i2

..
.

..
.

..
.

1 , 2
m1
m1

1 , 2
m2
m2

n
1 , 2
1n
1n
1 , 2
2n
2n

1 , 2
3n
3n

..
.

..
.

1 , 2
in
in

..
.

..
.

1 , 2
mn
mn

1 es el pago al jugador 1 cuando


donde C1 { 1, 2, . . . , m }, C2 { 1, 2, . . . , n }; ij
2 es el pago al jugador 2 cuando
juega la estrategia i y su oponente juega j, y ij
juega la estrategia j y su oponente juega i. Pero si ademas asumimos que
1
2
ij
+ ij
=0

(Juego de suma cero)

1 = 2 , y la descripci
para todo i = 1, 2, . . . , m; j = 1, 2, . . . , n, entonces ij
on del
ij
juego dada por la tabla anterior ahora se simplifica:
1
O tal vez son los juegos de un u
nico jugador? El lector podra pensar quiz
as en Robinson
Crusoe o en el juego del solitario para las cartas, pero estos son problemas fundamentales de
elecci
on y no de interacci
on.
2
Esta forma de ilustrar un juego recibe este nombre porque cada celda tiene dos n
umeros; en
una matriz ordinaria cada celda contiene s
olo uno.

18

Un Curso de Teora de Juegos Clasica


Jugador 2

Jugador 1

11

12

1n

21

22

2n

31

32

3n

..
.

..
.

..
.

..
.

..
.

i1

i2

in

..
.

..
.

..
.

..
.

..
.

m1

m2

mn

1 = 2
donde ij ij
ij

El juego entonces consiste en que el jugador 1 escoge entre filas y el jugador 2


(simultaneamente) escoge entre columnas, ambos buscando maximizar sus pagos
(jugadores racionales). Von Neumann y Morgenstern consideraban que los jugadores
(racionales como eran) elegiran de acuerdo con una particular regla:
1. El jugador 1 (jugador fila) escogera la estrategia i que le maximiza el mnimo
pago posible que le permite adquirir el jugador 2; es decir, resolvera
max mn ij
i

encontrando lo que llaman la estrategia de maxmin y que le genera un pago v 1


que corresponde a la ventaja que el jugador 1 obtiene por jugar el juego.
2. Similarmente, el jugador 2 (jugador columna), sabiendo que su oponente seleccionara la fila con maximo pago, tratara de minimizar esto con una adecuada
escogencia de su columna (es decir, minimizara sus perdidas), resolviendo
mn max ij
j

encontrando lo que llaman la estrategia de minmax y que le genera un pago de


v2 , que, a su vez, es la ventaja que el jugador 2 obtiene por jugar el juego.
Von Neumann y Morgenstern consideran que una posible soluci
on consistente
al juego es aquella estrategia ( i, j ) que satisfaga la condicion de maximizacion
de ganancia igual a minimizacion de perdidas; es decir,
v1 = max mn ij = mn max ij = v2
i

A este valor lo llamaron un punto (de equilibrio) de silla 3 del juego o, simplemente, el valor del juego.
3

Podra el lector decir por que el nombre de punto de silla. Una gr


afica sencilla ayudara.

19

Juegos No-Cooperativos con Informacion Simetrica

Ejemplo 1 (Davis [1983]).


Supongamos que en cierto proceso electoral hay un aspecto referente a cual de dos
ciudades (A o B) le sera construido un sistema de transporte masivo. Hay solo dos
candidatos a la presidencia y cada uno de estos debe anunciar a cual de las dos
ciudades se compromete a construirle el sistema de transporte, o evadir el tema en
sus apariciones p
ublicas. Cada candidato busca obtener el mayor porcentaje posible
de los votos de las dos ciudades. Los votantes de las demas ciudades son indiferentes
respecto al tema. Los porcentajes de votos que obtiene el candidato 1 dadas las
elecciones de 1 y 2 aparecen en la matriz de la figura 1. As, por ejemplo, si el
candidato 1 se compromete a construirle el sistema de transporte masivo a la ciudad
A, mientras el candidato 2 se compromete a construrselo a B, cada uno obtendra
el 50 % de los votos. Para encontrar el valor maxmin de este juego, inicialmente
tomemos como dada la eleccion del candidato 1 y encontremos la estrategia de 2
que minimiza el pago de 1; as, independientemente de la eleccion del candidato 1, el
candidato 2 decide evadir el tema, con lo que los pagos mnimos para el candidato 1
(porcentajes de votacion) son 40 %, 50 % o 40 %; como este debe ahora maximizar su
pago mnimo, elegira construirle a By as, la reparticion del electorado sera 50 %50 %, con lo que el valor maxmin es, efectivamente, v 1 = 0,5. (Ver figura 1.)

Figura 1: Problema electoral


Construirle a A

Construirle a B

Evadir el tema

Construirle a A

45 %

50 %

40 %

Construirle a B

60 %

55 %

50 %

Evadir el tema

45 %

55 %

40 %

Encontremos ahora el valor minmax; para las elecciones del candidato 2 Construirle
a A, Construirle a B y Evadir el tema, los maximos pagos para el candidato 1
son 60 %, 55 % y 50 %, respectivamente. Como el candidato 2 debe minimizar estos
pagos, elige Evadir el tema, con lo que el valor minmax es v 2 = 0,5. Observemos
que, en este juego, v1 = v2 = 0,5.
M
Ejemplo 2 (lanzar la moneda).
El juego de lanzar la moneda (matching pennies), originalmente planteado por von
Neumann y Morgenstern en 1944, consiste en dos jugadores que, simultaneamente,
eligen una cara de una moneda. Si en ambas monedas aparece cara, o en ambas
aparece sello, el jugador 1 gana la moneda; pero si en una moneda aparece cara y
en la otra sello, sera el jugador 2 el que la gana. Este juego es uno de dos jugadores
y suma cero que puede representarse mediante la siguiente matriz:

20

Un Curso de Teora de Juegos Clasica


Figura 2: Juego de lanzar la moneda
Jugador 2
Cara

Sello

Cara

-1

Sello

-1

Jugador 1

Aqu, 11 = 1, 12 = 1, 21 = 1, 22 = 1, y
v1 = max mn ij = max{ 12 = 1, 21 = 1 } = 1
i

v2 = mn max ij = mn{ 11 = 1, 22 = 1 } = 1
j

Sin embargo aqu, obviamente, v1 6= v2 y no existe valor minmax para este juego.
Mas adelante discutiremos por que sucede esto.
M
Ejemplo 3 (piedra-papel-tijera).

Este
es el conocido juego infantil piedra-papel-tijera propuesto tambien por von
Neumann y Morgenstern, en el que piedra vence a tijera, tijera vence a papel
y papel vence a piedra, y es un empate en los otros casos. Podemos describir este
juego en una matriz como la de la figura 3.
Figura 3: Piedra-papel-tijera
Jugador 2

Jugador 1

piedra

papel

tijera

piedra

-1

papel

-1

tijera

-1

Aqu,
v1 = max mn ij = max{ 12 = 1, 23 = 1, 31 = 1 } = 1
i

v2 = mn max ij = mn{ 21 = 1, 32 = 1, 13 = 1 } = 1
j

Tambien en este caso v1 6= v2 y no existe un valor minmax.

21

Juegos No-Cooperativos con Informacion Simetrica

Ejemplo 4 (otro ejemplo de von Neumann y Morgenstern).


En la matriz de la figura 4 tenemos que el valor del juego esta bien definido, pues
v1 = 1 = v2 es un punto de silla que se obtiene cuando el jugador 1 juega su
estrategia B y el jugador 2 su estrategia A.
Figura 4: Ejemplo de von Neumann y Morgenstern
Jugador 2
Jugador 1

-2

-1

2
M

Lo sucedido en los ejemplos clasicos de lanzar la moneda y piedra-papel-tijera


obligo a los autores del Theory of Games a tomar una decision: aceptaban el hecho
de que los valores minmax no siempre existen (as que, en general, cierta indeterminacion estara presente en el analisis de m
ultiples situaciones de interaccion entre
agentes racionales) o se deshacan de la indeterminacion mediante una modificacion
ingeniosa del proceso que conduce a la eleccion de la estrategia apropiada.
Hasta ahora los problemas de decision mostrados establecan que cada jugador debera razonar sobre cual de las distintas alternativas posibles era la mas favorable
(estas las llamaron estrategias puras). Ahora modificaron el escenario y colocaron
a disposicion de cada jugador un conjunto de dados que lanzaran para determinar
la estrategia a seguir. As, introdujeron un elemento probabilstico en la toma de
decisiones (estrategias mixtas). Pero no todo se deja a los dados. Von Neumann
y Morgenstern asumen que cada jugador tratara de maximizar el valor esperado
(matem
atico) de sus pagos, en lugar de los pagos seguros, y luego se preguntan si,
con estas modificaciones, el punto de silla existe. Pero esto ya von Neumann lo saba
desde su trabajo de 1928: el punto de silla exista y, por tanto, el problema estaba
bien determinado: las estrategias mixtas no haban sido introducidas en vano!
Formalmente, una estrategia mixta para el jugador 1 es un vector de probabilidades p = ( p1 , p2 , . . . , pm ), donde pi (i = 1, 2, . . . , m) es la probabilidad de que
m
P
el jugador 1 juegue la estrategia i. Obviamente p i 0 para todo i y
pi = 1.
i=1

Similarmente, una estrategia mixta para el jugador 2 es un vector de probabilidades


q = ( q1 , q2 , . . . , qn ), donde qj (j = 1, 2, . . . , n) es la probabilidad de que el jugador 2
n
P
juegue la estrategia j. Desde luego, tambien q j 0 para todo j y
qj = 1. (Notej=1

mos que las estrategias puras pueden verse como casos particulares de las mixtas.
As, por ejemplo, ( 0, 0, 1, 0, . . . , 0 ) es la representaci
on mixta de la tercera estrategia
pura por parte de alguno de los jugadores).

22

Un Curso de Teora de Juegos Clasica

El concepto de valor esperado probabilstico de una estrategia mixta es, simplemente,


una valoracion de los pagos que recibira el jugador en cada una de las estrategias
puras, ponderada por las probabilidades de que estas sean elegidas. El pago esperado
por el jugador 1 bajo la distribucion de probabilidades p = ( p 1 , . . . , pm ) si el jugador
2 juega la estrategia j es
E( p, j ) = p1 1j + p2 2j + + pm mj
Se espera tambien aqu que el jugador 1 escoja las probabilidades p de tal forma que
resuelva
max mn E( p, j )
p

Similarmente, el jugador 2 recibira un pago esperado bajo la distribucion q =


( q1 , . . . , qn ) si el jugador 1 juega la estrategia i igual a
E( i, q ) = q1 i1 + q2 i2 + + qm im ;
y se espera entonces que el jugador 2 escoja las probabilidades q de tal forma que
resuelva
mn max E( i, q )
q

Si p y q son tales que


max mn E( p, j ) = mn max E( i, q )
p

diremos entonces que estas probabilidades son una soluci


on al juego (o un punto de
silla del juego) y a este valor lo llamaremos el valor (minmax) del juego. Veamos
como se aplican los conceptos anteriores en juegos concretos.
Ejemplo 5 (lanzar la moneda, otra vez).
La justificacion de las estrategias mixtas para este juego la dan von Neumann y
Morgenstern de la siguiente manera: puesto que ninguna forma particular de jugar
(cara o sello) es mejor que otra, y si todo lo que importa es averiguar las intenciones
del oponente, no tendremos manera de encontrar una solucion. Pero si el jugador
no solo intenta averiguar lo que el otro jugador va a mover, sino que tambien se
concentra en que no descubran sus intenciones, jugar irregularmente cara y sello
podra ser una estrategia conveniente. Esto u
ltimo es lo que se presenta como 12 de
probabilidad de jugar cara; y 12 de probabilidad de jugar sello. El punto aqu es
que este procedimiento protege de perdidas. De todas formas, el pago esperado de
jugar esta estrategia es cero para ambos.
Para confirmarlo, grafiquemos el primer cuadrante donde el eje X esta determinado
por la probabilidad p y el eje Y esta determinado por el pago esperado E(p) del
jugador 1.

23

Juegos No-Cooperativos con Informacion Simetrica


Figura 5: lanzar la moneda
E(p)

E( p, cara ) = 2p 1

1
2

E( p, sello ) = 2p + 1

Observemos que para el jugador 1,


E( p, cara ) = p( 1 ) + ( 1 p )( 1 ) = 2p 1

E( p, sello ) = p( 1 ) + ( 1 p )( 1 ) = 2p + 1
La lnea resaltada, formada por los dos segmentos, es la grafica de la funcion
E( p ) = mn{ E( p, cara ), E( p, sello ) } =

2p 1
2p + 1

si p 1/2
si p 1/2

y el problema del jugador 1 es encontrar p que haga E( p ) lo maximo posible. Este


valor ocurre en p = 1/2 y v1 = 0 que es el mas alto pago esperado por el jugador
1, independientemente de lo que haga el jugador 2. El jugador 2 tiene un problema
similar que se resuelve mediante el mismo tipo de analisis. Su solucion muestra que,
al igual que el jugador 1, puede dejarle su decision a una moneda; es decir, adoptar
q = 1/2. Luego el valor del juego es v1 = v2 = 0, que se alcanza cuando p = q = 1/2.
M

Ejemplo 6 (piedra-papel-tijera).
La situacion en piedra-papel-tijera es enteramente similar a la de lanzar la moneda.
El sentido com
un dice que la forma correcta de jugar este juego es jugar las tres
alternativas cada una con probabilidad 13 . Y la teora lo corrobora. Decamos antes
que la matriz de pagos en este caso era la de la figura 6.

24

Un Curso de Teora de Juegos Clasica


Figura 6: piedra-papel-tijera
[q1 ]

[q2 ]

[1 q1 q2 ]

piedra (Pi)

papel (Pa)

tijera (Ti)

[p1 ]

piedra (Pi)

-1

[p2 ]

papel (Pa)

-1

[1 p1 p2 ]

tijera (Ti)

-1

All, para el jugador 1, si p = ( p1 , p2 , 1 p1 p2 ) y q = ( q1 , q2 , 1 q1 q2 ) son las


probabilidades de juego de los jugadores 1 y 2, respectivamente, entonces
E( p, P i ) = p1 ( 0 ) + p2 ( 1 ) + ( 1 p1 p2 )( 1 )

E( p, P a ) = p1 ( 1 ) + p2 ( 0 ) + ( 1 p1 p2 )( 1 )
E( p, T i ) = p1 ( 1 ) + p2 ( 1 ) + ( 1 p1 p2 )( 0 )

Luego,
E( p ) = mn{ E( p, P i ), E( p, P a ), E( p, T i ) }
= mn{ p1 + 2p2 1,

p1 + 2p2 1

2p1 p2 + 1

p1 p 2

2p1 p2 + 1, p1 p2 }
si

0 p1 ; p2 13 ; o si
0 p2 23 p1

1
3

p1 23 ,

si

1
3

p1 1,

2
3

p1 p2 1

si

0 p1 13 ,

2
3

p2 1

Pero en tales regiones, las tres funciones p 1 + 2p2 1, 2p1 p2 + 1, y p1 p2 son


negativas o cero. Luego para encontrar max E( p ) debemos buscar donde se anula
E( p ); y esto se logra igualando las tres funciones anteriores:
p1 + 2p2 1 = 2p1 p2 + 1 = p1 p2
De este sistema de ecuaciones con dos incognitas se encuentra, facilmente, que p 1 =
p2 = 13 y, por tanto, tambien 1 p1 p2 = 13 . Similarmente para el jugador 2. De
esta manera, el valor de este juego es v 1 = v2 = 0.
M
Ejemplo 7.
Encontremos el valor del juego de la figura 7.

25

Juegos No-Cooperativos con Informacion Simetrica


Figura 7: Ejemplo 7
Jugador 2
Jugador 1

[p]

[1 p]

Soluci
on
Para el jugador 1 se tiene que
E( p, a ) = 3p + 2( 1 p )
E( p, b ) = 4p

E( p, c ) = p + 3( 1 p )
y estas funciones lineales estan ilustradas en la siguiente figura:
E(p)

E( p, b )
E( p, a )

E( p, c )

1
2

E( p ) = mn{E( p, a ), E( p, b ), E( p, c )}
All, la lnea punteada muestra la funcion E( p ) formada por dos segmentos lineales:
(
4p
si 0 p 1/2
E( p ) =
p + 3( 1 p ) si 1/2 p 1
Claramente, E( p ) es maximo cuando p = 1/2 y, as, v 1 = 2. Similarmente, para el
jugador 2 se tiene que q = 1/2 y v2 = 2. El valor del juego es entonces v1 = v2 = 2.
M
Ejemplo 8.
Los grupos armados irregulares de izquierda y derecha de un pas estan decidiendo de forma independiente sobre el n
umero de comandos que van a enviar a cada
uno de dos frentes de batalla: X e Y . El grupo de derecha cuenta con 2 comandos

26

Un Curso de Teora de Juegos Clasica

armados, mientras que el de izquierda cuenta con 4. El grupo armado que enve
mas comandos a un frente dado gana el combate en ese frente. En caso de que enven
el mismo n
umero de comandos hay un empate. En la matriz de la figura 8 aparecen
las victorias del ejercito de derecha para las posibles decisiones de ambos ejercitos
sobre el n
umero de comandos enviados al frente X.
Figura 8: Victorias de cada ejercito
Ejercito de Izquierda

Ejercito de Derecha

-1

-2

-1

-1

-2

-1

-1

-2

-1

As, por ejemplo, si el ejercito de derecha enva 2 comandos al frente X, y el


ejercito de izquierda enva solo 1, el ejercito de derecha gana en el frente X
pero, entonces, como el ejercito de izquierda enva sus otros 3 comandos al frente
Y , este u
ltimo gana en tal frente, con lo que se genera un empate, otorgando un
pago de cero para el ejercito de derecha.
Para resolver este juego, inicialmente observemos que para el ejercito de izquierda
enviar un comando al frente X genera pagos al menos tan deseables como no enviar
comandos, independientemente de la eleccion de su oponente. De forma similar,
enviar tres comandos genera pagos al menos tan deseables como enviar cuatro. Por
tal razon, el ejercito de izquierda nunca enviara 0 ni 4 comandos al frente X.
Como esta informacion es com
un a ambos ejercitos, el juego puede reducirse a la
matriz de la figura 9.
Figura 9: Juego reducido
Ejercito de izquierda

Ejercito de derecha

[1 q1 q2 ]

[q1 ]

[q2 ]

[p1 ]

-2

-1

[p2 ]

-1

-2

-1

[1 p1 p2 ]

-1

-2

Juegos No-Cooperativos con Informacion Simetrica

27

Con un procedimiento igual al que hemos desarrollado encontramos para el jugador


1, que
E(p, 1) = 2p1 p2

E(p, 2) = 1 p2

E(p, 3) = 2p1 + p2 2
y, para el jugador 2, que
E(0, q) = 2q1 q2

E(1, q) = 1 q2

E(2, q) = 2q1 + q2 2
Buscando los puntos donde E(p) alcanza su valor maximo, que resulta de igualar
los pagos esperados para las tres posibles estrategias de su oponente, se obtiene
p1 = 1/2; p2 = 0; 1 p1 p2 = 1/2; de forma analoga, para el jugador 2, encontramos q1 = 1/2; q2 = 0; 1 q1 q2 = 1/2, luego el valor del juego es v1 = v2 = 1.
La conclusion de lo anterior es que, solo con la informacion de que disponen, el
ejercito de derecha debe optar por lanzar una moneda para determinar si va con
todos sus comandos al frente X o al frente Y , mientras que el ejercito de izquierda
enva 3 comandos a un frente y 1 al otro; para decidir a cual frente enviar mas
comandos tambien debe lanzar una moneda.
M
El Teorema Minmax (von Neumann [1928])
Cuando tenemos dos jugadores, 1 y 2, el primero con m posibles estrategias, y el
segundo con n estrategias, y el juego es de suma cero (lo que pierde un jugador
lo gana el otro), se acostumbra llamarlo un juego de matriz pues, obviamente, la
descripcion del juego es una matriz m n de la forma

11 1n

..
A = ...

.
m1

mn

donde la entrada ij representa el pago recibido por el jugador 1 cuando este escoge
la estrategia i y su oponente, el jugador 2, escoge la estrategia j. Aun as, la existencia
de un punto de equilibrio de silla no es, en absoluto, obvia.

Si el jugador 1 asigna las probabilidades p = ( p 1 , . . . , pm ) sobre sus respectivas


estrategias, y el jugador 2 asigna sobre sus respectivas estrategias las probabilidades
q = ( q1 , . . . , qn ), entonces el pago esperado por el jugador 1 si juega la estrategia
i y su oponente la estrategia j es ij pi qj . As que ex ante, sin
Pncondicionamiento
Pm
sobre las jugadas de los jugadores, el pago esperado total es
j=1
i=1 ij pi qj .

28

Un Curso de Teora de Juegos Clasica

Esto puede escribirse mas facilmente en notacion matricial como qAp T .4 Es decir,
lo que el jugador 1 busca maximizar y el jugador 2 minimizar
Por ejemplo, en el juego de lanzar la moneda,


1 1
A=
1
1
se tiene que


1 1
qAp = ( q, 1 q )
1
1
T



p
1p

= ( q, 1 q ) ( 2p 1, 1 2p )

= 2pq q + 1 2p q + 2pq
= ( 2 + 4q )p 2q + 1;

luego si el jugador 1 quiere minimizar este valor controlando p, entonces hara lo


siguiente:
1. Escoger p = 1 si 2 + 4q > 0; es decir, si q > 1/2.
2. Escoger p = 0 si 2 + 4q < 0; es decir, si q < 1/2.
3. Escoger cualquier p si q = 1/2.
Similarmente, si el jugador quiere minimizar el mismo valor qAp T = ( 2 + 4p )q
2p + 1, hara lo siguiente:
1. Escoger q = 1 si 2 + 4p < 0; es decir, si p < 1/2
2. Escoger q = 0 si 2 + 4p > 0; es decir, si p > 1/2
3. Escoger cualquier q si p = 1/2
Para lograr ambos objetivos, claramente, la solucion es que los dos jugadores escojan
1

2 como su probabilidad; es decir, p = q = 1/2. Observemos que el valor del juego

T
en tal caso es, efectivamente, q Ap = 0.
Regresando al problema general, hemos entonces entendido que el jugador 1 ha
garantizado que ganara al menos la cantidad
max mn qApT
p

y no puede esperar ganar mas; y el jugador 2 hace lo opuesto: escogera de tal manera
que no pierda mas de
mn max qApT
q

Donde pT significa el vector p traspuesto.

Juegos No-Cooperativos con Informacion Simetrica

29

y no espera mejorar mas esta situacion. Luego si queremos asegurar que la cantidad
que 1 busca ganar coincida con la que 2 esta dispuesto a perder, la existencia de p
y q tales que resuelvan
max mn qApT = mn max qApT
p

debera probarse. Como dijimos, la existencia de este punto de silla fue probado
por von Neumann en 1928 (16 a
nos antes de su Theory of Games and Economic
Behavior ) en un artculo que, en su momento, paso desapercibido: Zur Theorie der
Gesellschaftspiele, inicialmente publicado en Mathematische Annalen y traducido al ingles en 1959 en Contributions to the Theory of Games (A. W. Tucker y D.
Luce [eds.]). En version moderna dice as:
Teorema 1 (Teorema Minmax (von Neumann [1928])).
Para cualquier matriz Amn , existen distribuciones de probabilidad p Rn y q
Rm tales que
max mn q ApT = mn max q ApT ;
p

es decir, el valor minmax sobre todas las estrategias mixtas iguala al valor maxmin;
m
as a
un, si el m
aximo en el lado izquierdo se alcanza en p y el mnimo en el lado
derecho se alcanza en q , entonces ninguno querr
a cambiar su estrategia unilateralmente; es decir,
q ApT q ApT qApT
para todos los vectores de probabilidad p, q.
Demostraci
on.
Ver von Neumann [1928]
Sin embargo, debemos hacer aqu la observacion que el teorema minmax haba sido
previamente verificado por Emile Borel en 1924, pero solo para casos especiales:
nunca obtuvo una prueba general como la que von Neumann alcanzo en 1928. Por
muchos a
nos el teorema minmax fue considerado como la pieza maestra de la teora
de juegos. Y no debera reducirse su aporte. De hecho, el concepto fundamental de
la teora de juegos de suma no-cero (el equilibrio de Nash [1950b]) es un resultado
del teorema del minmax, y la prueba original de la existencia del equilibrio de Nash
se model
o imitando la conocida prueba del minmax. Tambien, como veremos, el
concepto de minmax aparece en el estudio de los juegos repetidos y en la teora
de los juegos coalicionales, y es pensable que si un concepto aparece en lugares
aparentemente diferentes en la teora entonces, quizas, deberamos creer que algo
importante hay en el.

30

Un Curso de Teora de Juegos Clasica

Ejercicios 1.
1. Encuentre los valores de los siguientes seis juegos:



0 5
,
1 3

3 2 1
1
0
1,
0 3 1


5 3 2
,
3 4 0

2 1
4
3 2 1 ,
0 3
2

2 1
0 0
0
0
1 2

1
0 1 1
1 2
1 0

4 5 3
1 2 1
5 3 3

1
1

1
2

2. Para que valores de los siguientes juegos tienen un valor en estrategias


puras?



1

,
0 3

0
3

3. Para el juego de la matriz

1
2 2
0
1
2 1
3
2
0

2
1
0 1 2

0
0
2
1
1
1 1
0 2
1
verifique que
p = (5/52, 0, 11/52, 17/26, 1/26)
q = (21/52, 3/13, 0, 3/52, 4/13) y
v = 19/52
es una solucion.
4. Para el juego de la matriz


0 2 3/2
2 0 1/2

encuentre el valor, la estrategia optima para el jugador 1, y dos estrategias


optimas para el jugador 2.

Juegos No-Cooperativos con Informacion Simetrica

31

5. (Ross [2002]) Los jugadores A y B enfrentan el siguiente juego. A escribe el


n
umero 1 o el 2, y B debe elegir entre uno de estos. Si el n
umero que A
ha escrito es i y B adivina correctamente, B recibe i unidades de A. Si B
falla, entonces le paga 3/4 a A. Si B aleatoriza su decision, eligiendo 1 con
probabilidad q y 2 con probabilidad 1 q, determine su ganancia esperada si
a. A escribe 1, y b. A escribe 2. Encuentre el valor de q que maximiza el menor
valor posible de la ganancia de B. Cual es este valor maxmin? Considere
ahora que el jugador A escribe 1 con probabilidad p y 2 con probabilidad
1 p. Encuentre el valor minmax.
6. Suponga que al inicio de una semana hay 2 temas de actualidad que interesan
al p
ublico: el intercambio de rehenes entre los dos bandos de una guerra, y
la nueva poltica gubernamental contra el desempleo. Las dos revistas mas
importantes del pas estan decidiendo cual de las dos noticias exhibiran en su
portada. El 60 % de los compradores de revistas esta interesado principalmente
en el intercambio de rehenes, mientras el 40 % restante en la poltica contra
el desempleo. Los compradores potenciales solo tienen en cuenta la portada
de la revista para realizar su eleccion. En caso de que ambas elijan la misma
portada, se reparten por mitades el porcentaje de la poblacion interesada en
el tema; en caso de que elijan portadas diferentes, cada una vende todas las
revistas a los compradores interesados.
a. Presente la matriz de este juego.
b. Encuentre el valor de este juego.
c. Explique su respuesta.
7. Puede verse que en el juego de suma cero (juego de matriz) de lanzar la
moneda, la matriz A es simetrica: A T = A. Sin embargo, en el juego de
piedra-papel-tijera, la matriz

0 1
1
A= 1
0 1
1
1
0
es antisimetrica, pues AT = A. Esto tiene un significado que no debera
escapar al comentario. Cuando la matriz es antisimetrica los agentes enfrentan
similares decisiones ya que aij = aij y lo que gana 1 por jugar i, mientras 2
juega j, que es aij , es exactamente igual a lo que recibe 2 por jugar i, mientras
1 juega j, que es aij . A este tipo de juegos suele llamarseles juegos justos.
Es natural que el valor esperado en tales casos sea q ApT = 0 y p = q .
Claramente el juego de lanzar la moneda no es justo. Por que?

32

Un Curso de Teora de Juegos Clasica

III.

Juegos Est
aticos con Informaci
on Sim
etrica

Ahora entendemos que el comportamiento estrategico de dos o mas agentes podra


surgir cuando los pagos que estos obtienen y, mas a
un, la decision de cada uno
de ellos, depende de lo que estos esperan que sean las decisiones de los demas.
Despues de von Neumann y Morgenstern (e inspirada en su trabajo) la teora de
juegos modela esta situacion por medio del concepto de juego en forma estrategica
(o forma normal). Un juego en forma estrategica esta conformado basicamente por
tres elementos:
a. Los jugadores (agentes)
b. Las estrategias disponibles
c. El pago que cada jugador recibe por cada posible combinacion de estrategias
Identificar a los jugadores es, en principio, facil. Determinar las estrategias disponibles
para cada jugador (tambien llamadas estrategias puras) es el paso clave en la construccion del modelo, ya que el rango de acciones disponibles para cada jugador
puede ser muy amplio y en muchas ocasiones no es totalmente conocido. La seleccion de las acciones conocidas por los agentes depende del proposito del estudio.
Para seleccionar la estructura de pagos (o funcion de utilidad) se debe examinar cada una de las posibles combinaciones de estrategias disponibles para los jugadores y
especificar que le sucede a cada jugador en cada caso, asignandole cierto valor. Esta
valoracion numerica algunas veces resulta complicada, razon por la cual deben hacerse un par de aclaraciones a este respecto: primero, el caracter de los pagos (como
en cualquier funcion de utilidad) se refiere (dentro de la tradicion von NeumannMorgenstern-Savage) a la representacion numerica de un ordenamiento previo de las
preferencias respecto a los posibles estados resultantes del juego; as, por ejemplo,
cualquier transformacion lineal de los pagos no altera el resultado del juego. Por otro
lado, un juego debe considerarse, a priori, como una descripcion cualitativa de cierta situacion, por lo cual sus resultados cuantitativos no establecen m
as que ciertas
relaciones entre probabilidades, porcentajes de poblaci
on, creencias, etc. En general,
no deberan extraerse conclusiones numericas de los fen
omenos modelados de esta
forma; o, al menos, esto es cierto, seguramente, en los casos m
as elementales.
Con base en las nociones de jugadores, espacios de estrategias y funciones de pago
podemos, entonces, definir formalmente lo que es un juego en forma estrategica.
Definici
on 1. (Juego finito en forma estrat
egica [Borel [1921], von Neumann [1928]])
a. Un juego finito en forma estrategica (o normal) es una 3n-tupla
= (N, (Ci )iN , (ui )iN )
donde:

33

Juegos No-Cooperativos con Informacion Simetrica


- N = {1, . . . , n} es el conjunto de jugadores

- Ci es el conjunto finito5 de estrategias puras para el jugador i N

- ui : ni=1 Ci R es la funcion de pagos (utilidad) para el jugador i N que


asigna un pago (n
umero real) a cada combinacion de estrategias (c 1 , . . . , cn ),
donde el producto cartesiano ni=1 Ci = C1 C2 ... Cn es el conjunto de
estrategias conjuntas6
b. Un juego finito en forma estrategica = (N, (C i )iN , (ui )iN ) es un juego con
informaci
on simetrica7 o completa8 si es conocimiento com
un9 . Es decir, todos los
jugadores conocen , cada uno sabe que los demas conocen , cada uno sabe que
los demas saben que el conoce , etc.
La representacion mas tpica de un juego es aquella que comprende solo dos jugadores
que escogen entre un n
umero peque
no de estrategias diferentes descritas mediante
una bimatriz. En la bimatriz, las celdas contienen los pagos de cada jugador para
las posibles combinaciones de estrategias.
La figura 10, utilizando una bimatriz, ilustra un juego particular conformado por
dos jugadores, pas grande y pas peque
no, cada uno de los cuales dispone de
dos estrategias: armarse (a) y permanecer desarmado (pd).

Figura 10: Dilema de seguridad


Pas peque
no
a

pd

0,-2

5,-5

pd

-2,2

3,3

Pas grande

a armarse;

pd permanecer desarmado

Por convencion, el primer puesto en cada celda corresponde al pago del jugador fila
(en este caso, pas grande) y el segundo corresponde al pago del jugador columna
(en este caso, pas peque
no).
5

De all la condici
on de finitud del juego.
Observemos c
omo la funci
on de utilidad captura la noci
on de interacci
on estrategica; es decir,
el pago que un agente recibe al realizar su propia acci
on depende tambien de las acciones de los
dem
as.
7
Una interpretaci
on est
andar subyacente a la definici
on de un juego finito en forma estrategica
con informaci
on completa es la de que el grupo de jugadores elijan sus estrategias simult
aneamente;
o, secuencialmente pero sin que ninguno de los dos jugadores sepa que estrategia eligi
o su adversario
en el momento de hacer su elecci
on.
8
Termino acu
nado por Luce y Raiffa [1957].
9
Termino acu
nado por D.K. Lewis [1964].
6

34

Un Curso de Teora de Juegos Clasica

Todo juego en bimatriz es, a menos que se diga algo distinto, un juego con informaci
on completa pero imperfecta. La imperfecci
on en la informacion proviene de
la hipotesis implcita de que los agentes toman sus decisiones, o bien simultaneamente, o sin que ninguno conozca la decision del otro, hasta tanto ambas decisiones
hayan sido tomadas. La completitud en la informacion proviene de la hipotesis de
conocimiento com
un del juego por parte de los jugadores.
Teniendo presente esto, analicemos, entonces, el dilema de seguridad. Si ambos
pases eligen armarse, pas grande no resulta afectado ni beneficiado, pero pas
peque
no incurre en una perdida porque, digamos, podra haber asignado los recursos destinados a armarse a una actividad diferente que generara mayor bienestar
para la sociedad del que genera haberse armado, dado que su vecino grande tambien lo hizo. En caso de que ambos decidan permanecer desarmados, ambos se
ven beneficiados por haber detenido una eventual costosa carrera armamentista. En
caso de que uno de los dos se arme y el otro no, el pas que se arma obtiene un
beneficio igual a la perdida del otro.

Ejercicios 2.
Para cada uno de los juegos finitos en forma estrategica que se presentan a continuacion, describa, si es posible, alguna situacion que se ajuste al juego presentado:

IV.

10,10

0,0

0,0

3,3

4,4

4,10

-2,0

3,3

1,1

-5,-5

5,-5

-10,-10

4,4

1,5

5,1

2,2

Principios-Soluci
on Fundamentales

Una vez reducida la interaccion entre los agentes a un juego en forma estrategica,
el siguiente paso es resolver el conflicto; es decir, resolver el juego. Hacer esto
significa establecer los principios que seguiran los agentes al escoger las estrategias
e indicar, en consecuencia, las acciones que los agentes podran tomar.

Juegos No-Cooperativos con Informacion Simetrica

35

Todo principio de solucion dentro de la vasta literatura en teora de juegos cl


asica
esta sustentado en la siguiente hipotesis: los agentes son racionales, en el sentido
de que siempre prefieren resultados con pagos altos a aquellos con pagos bajos. Este
principio de racionalidad esta en el corazon del modo de analisis de la teora de juegos
clasica y dice, esencialmente, que cada agente toma la decision que le de mayores
pagos, dada su creencia sobre lo que haran los otros agentes.
Los principios de solucion mas utilizados en la teora clasica pueden resumirse de la
siguiente forma.
a. Primer principio de soluci
on: estrategias estrictamente dominantes
Una estrategia estrictamente dominante para un jugador es aquella que al ser elegida
le otorga un mayor pago que cualquier otra estrategia de su conjunto de estrategias
posibles, sin importar que eleccion hagan los demas jugadores. De forma similar, una
estrategia es estrictamente dominada para un jugador si existe otra que le genera
mayores pagos, independientemente de las acciones que tomen sus oponentes.
Definici
on 2 (Dominancia estricta en estrategias puras).
En un juego finito en forma estrategica = (N, (C i )iN , (ui )iN ), la estrategia pura
ci del jugador i domina estrictamente a otra estrategia c 0i del mismo jugador si, y
solo si, ui (ci , ci ) > ui (c0i , ci ) para cualquier ci de los demas jugadores, donde
ci = (c1 , . . . , ci1 , ci+i , . . . , cn )10 .
Definici
on 3 (Dominancia debil en estrategias puras).
En un juego finito en forma estrategica = (N, (C i )iN , (ui )iN ), cuando la utilidad
proveniente de elegir la estrategia c i es mayor o igual que la utilidad proveniente de
elegir la estrategia c0i dado cualquier ci (es decir, cuando ui (ci , ci ) ui (c0i , ci )
para todo ci ) decimos que la estrategia ci domina debilmente a la estrategia c 0i y,
por tanto, esta u
ltima es una estrategia debilmente dominada.
Con base en estas nociones, podramos describir el primer principio basico as:
Siempre que sea posible, un jugador escoger
a estrategias estrictamente
dominantes y no elegir
a ninguna que sea estrictamente dominada.
Ejemplo 9 (Dominancia en el dilema de seguridad).
Analicemos, con el criterio de dominancia estricta, el juego de pas grande y pas
peque
no discutido en la seccion anterior (ver figura 10). Una vez asumimos que
el comportamiento de los individuos es racional en el sentido dicho, podramos
predecir la estrategia que pas grande escogera. En este juego, dado que pas
grande siempre obtiene un mayor beneficio arm
andose que permaneciendo desarmado (armandose obtiene 0 o 5; y permaneciendo desarmado -2 o 3), es posible
predecir que jugara la estrategia armarse ya que esta es mejor para el sin importar
que haga pas peque
no. Diremos aqu que la estrategia armarse domina estrictamente a la estrategia permanecer desarmado desde el punto de vista de pas
10

Observese que en ci se ha retirado la entrada de i, ci .

36

Un Curso de Teora de Juegos Clasica

grande. Notemos, sin embargo, que todava no podemos afirmar nada acerca del
comportamiento de pas peque
no ya que ninguna de sus estrategias domina a la
otra: su mejor eleccion depende de la eleccion de pas grande.
M
Ejemplo 10.
Consideremos el siguiente ejemplo que describe alguna situacion interactiva que es
representada por la siguiente bimatriz:
Jugador 2
a2

b2

a1

8,5

6,4

b1

7,3

5,2

Jugador 1

Aqu,
N = {1, 2}, C1 = {a1 , b1 }, C2 = {a2 , b2 }

u1 (a1 , a2 ) = 8, u1 (a1 , b2 ) = 6, u1 (b1 , a2 ) = 7, u1 (b1 , b2 ) = 5


u2 (a1 , a2 ) = 5, u2 (a1 , b2 ) = 4, u2 (b1 , a2 ) = 3, u2 (b1 , b2 ) = 2
Este juego muestra que tanto el jugador 1 como el jugador 2 tienen una estrategia
estrictamente dominante. Si el jugador 1 elige su estrategia a 1 siempre obtendra un
pago mayor que si elige su estrategia b 1 , independientemente de la eleccion que
realice el jugador 2. Haciendo el mismo analisis para el jugador 2, encontramos que
su estrategia a2 domina estrictamente a su estrategia b 2 . As, se podra se
nalar que
el resultado del juego sera la eleccion de las estrategias (a 1 , a2 ).
M
Ejemplo 11 (El Dilema del Prisionero [Albert W. Tucker [1950]). ]
Uno de los juegos mas importantes de la teora de juegos clasica es el dilema del
prisionero. El juego consiste, en su version estandar, en lo siguiente: dos sospechosos
de un delito son detenidos y ubicados en celdas diferentes de tal manera que no
puedan comunicarse. La pena para el delito son cinco a
nos de prision. La u
nica
forma en que las autoridades pueden condenar a los sospechosos es haciendo que
al menos uno de ellos confiese. La descripcion del juego es la siguiente: si ambos
sospechosos confiesan, la sentencia sera de cuatro a
nos de carcel para cada uno. Si
ninguno de los dos confiesa, la sentencia sera de tan solo un a
no en la carcel para
cada uno, dada la falta de pruebas para realizar una condena. Y si uno confiesa y el
otro no, el que confiesa sera puesto en libertad por colaborar con la justicia mientras
el otro sera sentenciado a los cinco a
nos de prision. El juego en su forma estrategica
es como aparece en la bimatriz de la figura 11.

37

Juegos No-Cooperativos con Informacion Simetrica


Figura 11: Dilema del Prisionero
Sospechoso 2
c

nc

-4,-4

0,-5

nc

-5,0

-1,-1

Sospechoso 1

c confesar; nc no confesar
Para resolver el juego, bastara eliminar estrategias estrictamente dominadas: observemos que para ambos jugadores confesar domina estrictamente a no confesar.
De modo que la soluci
on predecible por eliminacion de estrategias estrictamente
dominadas es (confesar, confesar) con pagos de -4 para cada uno (es decir, 4 a
nos
de carcel), que no es necesariamente la mejor eleccion de los jugadores: si ninguno
confesara obtendran ambos solo un a
no de carcel, en lugar de los cuatro a
nos a que
son condenados a raz de su confesion. Sobre esta aparente paradoja volveremos mas
adelante.
M
Ejemplo 12 (Juego del Ultimatum).
Este es un juego de dos individuos, uno de los cuales debe hacer una oferta al otro
acerca de la reparticion de 4 unidades monetarias 11 . Las propuestas que el oferente puede hacer son una reparticion equitativa (E) o una en la que el se vea mas
favorecido (F ). En caso de que la oferta sea equitativa, es llevada a cabo independientemente de lo que planee hacer el jugador 2 quien, en caso de que deba jugar,
solo puede decidir si acepta (A) o no acepta (N ) la oferta recibida. Con el fin de
eliminar del juego su apariencia secuencial, supongamos, por ahora, que cada uno
debe tomar su decision de antemano y que los resultados estan determinados por la
combinacion de sus elecciones. Representamos este juego por medio de la bimatriz
de la figura 12.
En este juego, la estrategia A del jugador 2 domina debilmente a su estrategia N .
Si eliminamos esta estrategia, la prediccion es (F, A) y reciben pagos de 3 para el
jugador 1 y de 1 para el jugador 2; sin embargo, como veremos, no es conveniente
eliminar por dominancia debil ninguna de las estrategias de este juego. Ya veremos
por que resolver un juego a traves de este criterio nos puede conducir a descartar
soluciones tambien factibles.
M
El principio de solucion de dominancia estricta es bastante debil ya que, por ejemplo, en el caso de pas grande y pas peque
no (figura 10) solo nos dice lo que
11

Imaginemos cuatro millones de pesos.

38

Un Curso de Teora de Juegos Clasica


Figura 12: Juego del ultimatum
Jugador 2
A

2,2

2,2

3,1

0,0

Jugador 1

A Acepta

N No acepta

E Oferta equitativa
F Oferta favorable

hara pas grande. Recordemos que en tal caso no es posible utilizar este concepto
para predecir el comportamiento de pas peque
no; como dijimos, ninguna de las
estrategias disponibles a pas peque
no domina estrictamente a la otra; cualquier
accion de este pas podra ser mejor o peor que la otra, dependiendo de lo que haga
pas grande. Basados en esto, establecemos el segundo principio-solucion.
b. Segundo principio de soluci
on: eliminaci
on iterada de estrategias
estrictamente dominadas
Podemos refinar el primer principio de solucion y asumir, no solo que cada agente
adoptara estrategias estrictamente dominantes y desechara las estrictamente dominadas, sino que cada agente sabe que los otros har
an lo mismo y actuar
an en consecuencia. De esta forma:
Todo jugador aplica el primer principio de soluci
on en su decisi
on. Y
cada jugador sabe que los otros tambien aplicar
an ese principio, y los
otros saben que los otros tambien aplicar
an ese principio; etc.
Como su nombre lo indica, el proceso de eliminacion iterada de estrategias estrictamente dominadas consiste en eliminar a traves de rondas las estrategias que son
dominadas por otras. Observemos que bajo este supuesto, podramos predecir que
pas peque
no sabe que pas grande se armara y, actuando en consecuencia,
tambien se armara ya que en tal caso su pago sera 2, en lugar de permanecer
desarmado, caso en el cual su pago sera 5.
Ejemplo 13 (Solucion por rondas de eliminacion).
Consideremos el juego de la figura 13. En la primera ronda de eliminacion iterada
del juego de la figura 13, podemos eliminar la estrategia c 2 del jugador 2 ya que su
estrategia b2 la domina estrictamente. De esta forma, el juego queda reducido a un
juego de dos estrategias para cada jugador, como se muestra en la figura 14.
Ahora: como el jugador 1 preve que el 2 nunca jugara c 2 , elimina su estrategia b1 ya

39

Juegos No-Cooperativos con Informacion Simetrica


Figura 13: Eliminacion por rondas
Jugador 2
a2

b2

c2

a1

2, 4

3, 2

3, 1

b1

0, 3

1, 6

7, 5

Jugador 1

Figura 14: Primera ronda de eliminacion


Jugador 2
a2

b2

a1

2, 4

3, 2

b1

0, 3

1, 6

Jugador 1

que a1 la domina estrictamente12 , con lo que el juego se reduce al de la figura 15.


Eliminamos luego la estrategia b2 del jugador 2 por estar dominada estrictamente
por la estrategia a2 , quedando como solucion al juego el par de estrategias (a 1 , a2 )
con pagos de 2 para el jugador 1 y de 4 para el jugador 2.
Figura 15: Segunda ronda de eliminacion
Jugador 2
Jugador 1
a1

a2

b2

2, 4

3, 2

Ejercicios 3.
1. La Guardia Imperial de Napoleon Bonaparte se enfrenta a las tropas inglesas
del general Wellington. Para esta contienda, hay diez campos de batalla con
valores militares a1 < ... < a10 . Cada jugador (Bonaparte y Wellington) es
dotado con ni < 10 escuadrones (i = 1, 2). La estrategia de cada jugador es
12

N
otese que a1 no domina a b1 a menos que la estrategia c2 haya sido eliminada en una ronda
de eliminaci
on previa.

40

Un Curso de Teora de Juegos Clasica


la decision de enviar sus escuadrones a estos campos de batalla. Un jugador
puede enviar, maximo, un escuadron a cada campo de batalla. Cuando la pelea
empieza, cada jugador gana aj por cada campo de batalla en el que tenga un
escuadron pero su oponente no. El ganador de la guerra es el ejercito cuyo
territorio ocupado represente el mayor valor militar total. Muestre que este
juego tiene una u
nica solucion en estrategias dominantes.
2. Para cada uno de los siguientes juegos finitos en forma estrategica, resuelva
seg
un el principio-solucion de eliminacion iterada de estrategias estrictamente
dominadas:
J. 2

J. 2

8,2

6,4

3,9

4,2

J. 1

10,5

1,2

6,10

10,7

J. 1

J. 2

J. 2

5,4

3,8

1,5

6,6

6,-2

-5,-3

J. 1

8,8

6,-2

2,1

0,-2

4,8

0,1

J. 1

3. Considere un juego con n-jugadores en el que cada jugador anuncia, simultaneamente, un n


umero entero entre 1 y 1.000. El ganador es el jugador cuyo anuncio
es el n
umero mas cercano a 1/2 del promedio de todos los anuncios. En caso
de empate, el premio es entregado de manera aleatoria entre los ganadores.
a. Utilizando la eliminacion iterada de estrategias dominadas determine la
solucion de este juego. Si los jugadores son racionales y la racionalidad es
conocimiento com
un cual sera la u
nica estrategia que sobrevivira?
b. Cree usted que la solucion encontrada en a es consistente con lo observado en la realidad? Si no lo es, como cree usted que razonara la gente
en un juego de este estilo?
4. Resuelva los siguientes juegos con el principio-solucion de eliminacion de estrategias estrictamente dominadas.

41

Juegos No-Cooperativos con Informacion Simetrica


J. 2

J. 1

73, 25

57, 42

66, 32

80, 26

35, 12

32, 54

28, 27

63, 31

54, 29

J. 2

J. 1

V.

63,-1

28,-1

-2,0

-2,45

-3,19

32,1

2,2

2,5

33,0

2,3

54,1

95,-1

0,2

4,-1

0,4

1,-33

-3,43

-1,39

1,-12

-1,17

-22,0

1,-13

-1,88

-2,-57

-3,72

Principio-Soluci
on de Equilibrios de Nash en
Estrategias Puras

En la mayora de los juegos estudiados en la teora sucede, sin embargo, que asumir
solo el segundo principio de solucion nos puede dejar, todava, con muchas predicciones posibles. Es el caso del juego de la figura 16 en donde, adicional a la situacion
descrita en la figura 10, cada pas tiene una nueva estrategia (anunciar el problema
ante una comision internacional (ap), y unos nuevos pagos (debido a la penalizacion
que tal comision impone sobre los pases en caso de encontrar armamento). Se puede
observar que ninguno de estos tiene una estrategia estrictamente dominante.
Una forma con la que podemos resolver este tipo de juegos esta fundamentada en el
siguiente principio:
La combinaci
on de estrategias que los jugadores predeciblemente escoger
an
es aquella en la cual ning
un jugador podra mejorar su pago escogiendo
unilateralmente una estrategia diferente, si supone que los otros siguen
eligiendo la estrategia previamente escogida.
El concepto-solucion basado en este principio se conoce como equilibrio de Nash
del juego. Fue introducido por John Nash [1950b] 13 en su artculo Equilibrium
13

Premio Nobel en Economa de 1994.

42

Un Curso de Teora de Juegos Clasica


Figura 16: Dilema de seguridad extendido
Jugador 2

Jugador 1

a armarse

pd

ap

0, 2

5, 5

5, 2

pd

2, 2

4, 4

0, 0

ap

2, 5

0, 0

3, 3

pd permanecer desarmado

ap anunciar el problema

Points in n-Person Games, y se ha posicionado como el concepto soluci


on central
en la teora de juegos cl
asica. Esta es la definicion:
Definici
on 4 (Equilibrio de Nash en Estrategias Puras (Nash [1950b])).
Sea = (N, (Ci )iN , (ui )iN ) un juego finito en forma estrategica. Una combinacion
de estrategias puras c = (ci )iN es un equilibrio de Nash en estrategias puras para
el juego si, y solo si,
ui (ci , ci ) ui (ci , ci )
para todo ci Ci y para todo i N
Ejemplo 14.
Consideremos el juego de la figura 17 y encontremos sus equilibrios de Nash.

Figura 17: B
usqueda de equilibrios de Nash
Jugador 2
t

3, 1

1, 3

5, 5

4, 2

Jugador 1

Para buscar los equilibrios de Nash de este juego, procederemos tomando cada posible combinacion de estrategias, y verificaremos si, en cada una de estas, al menos
un jugador tiene incentivos unilaterales para desviarse. Para empezar, tomemos la
combinacion de estrategias en la que el jugador 1 juega la estrategia k y el jugador
2 juega la estrategia t. Si el jugador 1 espera que el 2 juegue t, para el sera mejor

Juegos No-Cooperativos con Informacion Simetrica

43

desviarse de la estrategia establecida y jugar m ya que, de esta forma, obtiene un


pago de 5, superior al pago de 3 que obtendra de mantenerse jugando k. De manera similar, el jugador 2 tambien se desviara a jugar s para obtener un pago de 3
en vez de 1; por lo tanto, la combinacion de estrategias (k, t) no es un equilibrio
de Nash. Tomemos ahora la combinacion de estrategias (k, s); el jugador 2 no tendra incentivos para desviarse unilateralmente ya que reducira su pago de 3 a 1. Sin
embargo, el jugador 1 s tendra incentivos para desviarse, ya que si cree que el 2
seguira jugando s, escoger m en vez de k le genera un pago de 4 en vez de 1. As,
esta combinacion de estrategias tampoco constituye un equilibrio de Nash. Tomemos
ahora la combinacion (m, t). Si el jugador 1 se desva de su estrategia m a k, pasa
de ganar 5 a ganar solo 3, luego sera mejor que no lo haga; por su parte, si es el
jugador 2 quien se desva de t a s, pasa de recibir un pago de 5 a recibir un pago de
2, luego tampoco se desviara; Como ninguno de los jugadores tiene incentivos para
desviarse unilateralmente, la combinacion de estrategias puras (m, t) constituye un
equilibrio de Nash de este juego. Para terminar, consideremos la estrategia conjunta
(m, s); el jugador 1 no tiene incentivos para desviarse ya que obtendra un pago de 1
en vez de 4, pero el jugador 2 s tendra incentivos para hacerlo ya que ganara 5 en
vez de 2. As, el u
nico equilibrio de Nash de este juego est
a dado por la combinaci
on
de estrategias (m, t).
M
Ejemplo 15. (La Batalla de los Sexos [Luce y Raiffa (1957)])
En este juego, un matrimonio esta tratando de decidir que hacer el fin de semana. Las
posibilidades que tienen son: ir al f
utbol (F ) o ir al teatro (T ). El esposo prefiere ir
al f
utbol con su esposa, y la esposa ir al teatro con su esposo. Los pagos estan dados
por la bimatriz de la figura 18. No es posible resolver este juego por dominancia
iterada ya que ninguna estrategia pura es estrictamente dominada. Ahora bien: el
juego tiene dos equilibrios de Nash en estrategias puras: (F, F ) y (T, T ). Veamos:
si la esposa cree que su esposo ira al f
utbol (F ) lo mejor que ella puede hacer es
tambien ir al f
utbol (F ), ya que esta eleccion la deja con un mayor pago que su
estrategia ir al teatro (T ), en la que estara sola. A su vez, si el esposo cree que su
esposa ira al f
utbol, lo mejor que puede hacer es tambien ir al f
utbol (F ).
Figura 18: La batalla de los sexos
Esposa
F

2,1

0,0

0,0

1,2

Esposo

F F
utbol;

T Teatro

44

Un Curso de Teora de Juegos Clasica

De manera que (F, F ) es un equilibrio de Nash del juego que deja a cada uno de los
jugadores (esposo, esposa) con pagos (2, 1). Si, por el contrario, la esposa cree que
su esposo ira al teatro (T ), lo mejor que puede hacer es ir al teatro (T ), ya que esta
eleccion la dejara con un pago de 2 mientras que ir al f
utbol la dejara con un pago
de cero. De igual forma, si el esposo piensa que su esposa ira al teatro (T ), lo mejor
que puede hacer es ir al teatro (T ). Por lo tanto (T, T ) tambien es un equilibrio de
Nash del juego y deja a cada uno de los jugadores (esposo, esposa) con pagos (1, 2),
respectivamente. De esta manera, seg
un Nash, que ambos vayan juntos al f
utbol o
al teatro son posibilidades predichas por la teora.
M
Ejemplo 16 (El Dilema de Seguridad, otra vez).
Habamos visto que en el dilema de seguridad extendido no haba solucion por medio
del concepto de eliminacion de estrategias estrictamente dominadas, sin embargo
podemos ver que s hay solucion por medio del concepto de equilibrio de Nash. Notemos que la combinacion de estrategias (ap, ap) es estrategicamente estable; esto es,
si ambos jugadores eligen su estrategia anunciar el problema, ninguno tendra incentivos unilaterales para desviarse, ya que los pagos que obtendran por hacerlo son
estrictamente menores a los que obtendran por seguir fieles a su estrategia: en ap
cada uno de los jugadores obtiene un pago de 3; desviarse a pd le genera un pago de
0, mientras que desviarse a a le genera un pago de -5. As, (ap, ap) es un equilibrio de
Nash. Notese, sin embargo, que la combinacion de estrategias (pd, pd) genera pagos
estrictamente mayores y, no obstante, no es un equilibrio de Nash. Es decir, tenemos
una situacion similar a la observada en el dilema del prisionero. El analisis de estos
dos casos lo veremos en breve.
M
Ejemplo 17 (Juego de Coordinacion Schelling [1957]).
Consideremos el juego de la figura 19.
Figura 19: Juego de coordinacion
Jugador 2
D

10,10

0,0

0,0

1,1

Jugador 1

D Derecha;

I Izquierda

Este juego tampoco se puede resolver por dominancia estricta ya que ninguna estrategia pura es estrictamente dominada. Sin embargo, el juego tiene dos equilibrios
de Nash en estrategias puras: (D, D) y (I, I). Si el jugador 1 cree que el jugador 2
escogera su estrategia D, su mejor-respuesta a esta eleccion es la estrategia D. De

Juegos No-Cooperativos con Informacion Simetrica

45

igual forma, si el jugador 2 cree que el jugador 1 escogera su estrategia D, la mejorrespuesta a esta eleccion es su estrategia D. Por lo tanto, (D, D) es un equilibrio
de Nash del juego que deja a cada uno de los jugadores con un pago de 10. Ahora:
si el jugador 1 cree que el jugador 2 elegira la estrategia I, su mejor-respuesta es
la estrategia I, y si el jugador 2 cree que el jugador 1 escogera la estrategia I, su
mejor-respuesta es tambien escoger I. Entonces (I, I) es otro equilibrio de Nash del
juego que deja a cada uno de los jugadores con un pago de 1. Observese que para
los dos jugadores es mejor jugar el primer equilibrio porque los deja con un pago
mas alto. Este juego se conoce como un juego de coordinacion porque los jugadores
podran alcanzar el pago mas alto posible del juego cuando act
uan coordinadamente
y eligiendo, en concordancia, la estrategia del pago mas alto.
Un ejemplo claro de un juego de coordinacion como el de la figura 19 se refiere
a la decision cotidiana sobre el lado de la calle por el cual deben desplazarse dos
conductores que se dirigen en sentido contrario. Si cada uno escoge la derecha, pasan
sin ning
un problema y tienen acceso facil a la se
nalizacion de la calle. Si ambos
escogen la izquierda, la se
nalizacion se hace mas difcil, pero tampoco se accidentan,
por lo cual ninguno tiene incentivos a desviarse. Caso contrario ocurre cuando uno
de los conductores decide irse por la derecha y el otro por la izquierda; en tal caso,
el pago que obtienen es el menor posible. Este u
ltimo caso no es un equilibrio de
Nash ya que, por ejemplo, asumiendo como dada la eleccion del conductor 2, el
conductor 1 tendra incentivos a cambiar de estrategia. Los dos tipos de equilibrio
(todos conducen por la derecha o todos conducen por la izquierda) se ven claros
en pases como Colombia y Gran Breta
na.
Sin embargo, el campo de aplicacion de los juegos de coordinacion es mucho mas
amplio que lo que hemos mostrado, hasta el punto en que se han constituido en un
destacado tema de estudio en las ciencias sociales. Supongamos, por ejemplo, que
dos amigos estan perdidos en la selva y quieren encontrarse, a donde deben ir? y,
en caso de que contaran con radios para comunicarse, que frecuencia elegiran para
hacerlo? Por otro lado, si una sociedad reconoce que llevar a cabo sus transacciones
por medio del trueque es demasiado costoso, y cada individuo es consciente de que
utilizar un metal como medio de pago solucionara el problema, que metal elegira?
Suponga ahora que mientras un par de amigos hablan por telefono la llamada se
interrumpe, quien debera realizar la nueva llamada y quien debera esperar?
Este es el tipo de situaciones que se pueden analizar por medio de los juegos de
coordinacion; observemos que en cada uno de los ejemplos anteriores, para cada
jugador no hay una mejor eleccion y, mas a
un, no hay ning
un procedimiento
formal que determine que se debe hacer. Esta en el interes de cada jugador intentar
descifrar lo que los otros piensan que el hara, y actuar en consecuencia. Es decir, para
obtener el mejor resultado para s mismo, y para el grupo, cada jugador debe hacer
parte del proceso social; esto es, prescindir de un calculo aislado sobre posibles
estados del mundo y sustituirlo por normas que considere determinantes no solo
para su toma de decisiones sino, principalmente, para la toma de decisiones de los
demas; tengamos en cuenta que en estos juegos un jugador gana si los demas ganan,

46

Un Curso de Teora de Juegos Clasica

y pierde si los demas pierden, luego su interes esta en buscar actuar de tal forma
que sus acciones sean compatibles con las de los demas.
Aspectos externos a los juegos, de la manera en que los hemos presentado, pueden
servir para ayudar a coordinar a los jugadores en ciertos equilibrios. Siguiendo a
Schelling [1960]:
...entre todas las opciones posibles suele haber alguna en particular que
parece ser el punto focal de una seleccion coordinada, y, muy a menudo,
la parte para quien es relativamente desfavorable la elige, simplemente,
porque sabe que la otra espera que lo haga.
As, aspectos como la moda, las convenciones sociales, las normas, la tradicion o
cualquier otra informacion externa al juego, pueden determinar puntos focales,
que cada jugador perseguira en los juegos de coordinacion, dado que haciendolo
reduce la incertidumbre frente a lo que los otros esperan que el haga, y esto es de
su beneficio.
Algunas preguntas importantes, respecto a los juegos de coordinacion son entonces,
por ejemplo, que determina el surgimiento de cierto curso de acci
on en estos juegos;
de forma similar, sera interesante determinar como la informacion externa afecta la
coordinacion en uno u otro de los posibles equilibrios y, tal vez, lo mas interesante:
que equilibrio es seleccionado por los agentes. Schelling [1960] responde parcialmente
a esto diciendo que [una] parte esencial del estudio de los juegos de motivacion
mixta es necesariamente emprica.
Y si bien actualmente la teora de juegos no-clasica ofrece algunas respuestas interesantes a estos interrogantes, algunas otras pueden ofrecerse desde escenarios
elementales, como los que hemos estudiado hasta ahora, analizando las dinamicas
de interaccion entre individuos que deben enfrentar algunos juegos de coordinacion.
M
Ahora: regresando al curso central de la discusion, podramos preguntarnos: como
se relacionan los distintos principios de solucion que estudiamos al comienzo de la
seccion anterior? La respuesta la tenemos en los siguientes teoremas que, de paso,
muestran la importancia central del concepto de equilibrio de Nash en un problema
de decision interactiva.
Teorema 2 (Un agente racional no utiliza estrategias estrictamente
dominadas).
Ninguna estrategia pura estrictamente dominada para un jugador puede hacer parte
del perfil de estrategias de un equilibrio de Nash en estrategias puras.
Demostraci
on.

Si ci es estrictamente dominada por alg


un c 0i para alg
un jugador i, entonces
ui (ci , ci ) < ui (c0i , ci )
Luego (ci , ci ) no puede ser un equilibrio de Nash.

Juegos No-Cooperativos con Informacion Simetrica

47

Teorema 3 (Eliminacion por Rondas que conduce a equilibrios de Nash). Cuando


el proceso de eliminaci
on iterada de estrategias estrictamente dominadas arroja un
u
nico perfil de estrategias puras c = (ci , ci ), este es el u
nico equilibrio de Nash del
juego.
Demostraci
on.
Sin perdida de generalidad, asumamos que solo es necesaria una ronda para todos
los jugadores. El caso general es similar (apoyados en el teorema 2). Debemos probar
que c = (c1 , . . . , cn ) es un equilibrio de Nash y que es u
nico.
a. Es un equilibrio de Nash. Sea ci 6= ci , entonces ci es estrictamente dominada
por ci , para todo i. As, ui (ci , ci ) > ui (ci , ci ), para todo ci Ci . Luego,
en particular si ci = ci , entonces, ui (ci , ci ) > ui (ci , ci ) para todo i. Por
tanto, c = (c1 , . . . , cn ) es un equilibrio de Nash.
b. Es u
nico. Es consecuencia del teorema 2.

Teorema 4.
Si la combinaci
on de estrategias c = (ci , ci ) es un equilibrio de Nash, entonces
sobrevive al proceso de eliminaci
on iterada de estrategias estrictamente dominadas.
Demostraci
on.
Es una aplicacion directa del teorema 2.
Ejemplo 18 (El Dilema del Prisionero, otra vez).
Como ilustracion de los teoremas que acabamos de establecer, retomemos el juego del
dilema del prisionero de la figura 11. Cuando resolvimos por estrategias dominantes,
encontramos que la soluci
on predecible era (confesar, confesar). Ahora, resolviendo
por equilibrios de Nash, encontramos que si el sospechoso 1 cree que el sospechoso 2
va a confesar, la mejor decision que el puede tomar es tambien confesar, con lo que
se quedara con un pago de -4. Si a su vez, el sospechoso 2 cree que el sospechoso 1
va a elegir su estrategia, confesar, lo mejor que puede hacer es confesar y recibir un
pago de -4. De manera que el par de estrategias (confesar, confesar ) es un equilibrio
de Nash en estrategias puras del juego y entrega a los jugadores un pago de -4 a
cada uno. Observemos que, tal como establece el teorema 2, el par de estrategias
dominadas no confesar no hacen parte del equilibrio de Nash. Como resultado
del teorema 3, notemos que la u
nica combinacion de estrategias que sobrevive a la
eliminacion iterada de estrategias estrictamente dominadas es el equilibrio de Nash
del juego. Y, finalmente, notemos, como aplicacion del teorema 4, que el equilibrio
de Nash sobrevive al proceso de eliminacion de estrategias.
Es importante destacar aqu que en este juego es imposible alcanzar, a traves de
estos principios de solucion, la asignacion cooperativa resultante de la combinacion
de estrategias (no confesar, no confesar ) ya que los jugadores no tienen incentivos

48

Un Curso de Teora de Juegos Clasica

para mantenerse en esta eleccion. Cada uno de ellos hace lo mejor que puede independientemente de lo que el otro jugador haga. Hara falta, en este caso, alg
un
mecanismo externo que hiciera a los jugadores jugar cooperativamente, haciendo de
esta eleccion lo mejor para ellos. La moraleja es importante: el concepto de equilibrio
de Nash muestra que una sociedad podra, s
olo a traves de incentivos individuales,
llegar a estados que no son o
ptimos socialmente. O, como afirma Aumann [1987b]:
la gente que no coopera porque busca su propio beneficio no es necesariamente
est
upida o irracional: puede estar actuando de manera perfectamente racional. En
efecto: en este ejemplo, un equilibrio de Nash no es necesariamente optimo de Pareto14 : (4, 4) son los pagos correspondientes al u
nico equilibrio de Nash y (1, 1)
los correspondientes al u
nico optimo de Pareto. De hecho, se considera el dilema del
prisionero como piedra filosofal en muchas discusiones de la economa moderna y
como una metodologa u
til para abordar problemas en poltica y sociologa. Ejemplos de esto son dos partidos polticos considerando su voto frente a un incremento en
los impuestos: conjuntamente sera mejor para ambos votar favorablemente por tal
propuesta, pero en caso de que uno de ellos decida apoyarla, es mejor para el otro no
hacerlo con el animo de ganar popularidad. Especficamente, no apoyar la propuesta
es una estrategia dominante para cada partido. Otro ejemplo lo ilustran los pases
miembros de la OPEP: para todos sera deseable que el precio del petroleo fuera
alto, lo que se lograra si todos recortaran su produccion. No obstante, esta en el
interes de cada pas miembro aumentar su produccion, y esto hara que el precio descendiera y afectara negativamente los ingresos de todos. Otro ejemplo es el dilema
de la seguridad extendido que estudiamos antes.
M
Una Nota sobre Evidencia Experimental
a. El dilema del prisionero
En los experimentos realizados para jugar el dilema del prisionero una sola
vez se ha encontrado un nivel de cooperacion que vara de acuerdo con las
manipulaciones experimentales de cada caso. Entre los factores manipulables
se destacan los ensayos que cada jugador tiene antes de enfrentar el juego
verdadero, y sus caractersticas personales (sexo, edad, raza, religion, etc.).
El nivel de cooperacion observado se encuentra suficientemente alejado de 0 %
y 100 %. Esto ha llevado a muchos investigadores a conjeturar que hay cierta
evidencia de altruismo en los agentes que juegan el Dilema del Prisionero. Para
verificar esta hipotesis, Shafir y Tversky [1992] compararon el juego original con
una modificacion de este en la cual uno de los jugadores deba jugar primero,
y el otro era informado de la eleccion de su oponente; el analisis era llevado a
cabo sobre los jugadores de la segunda etapa. Se encuentra en estos juegos un
menor nivel de cooperacion que en el juego original, tanto en el caso en que se
informa de una defeccion, como cuando se informa de una previa cooperacion.
14

Es decir, existe alguna otra elecci


on tal que al menos un jugador puede mejorar sin que el otro
empeore.

49

Juegos No-Cooperativos con Informacion Simetrica

Con base en estos resultados, Shafir y Tversky argumentan que la cooperacion


en el juego original no se alcanza gracias al altruismo de los agentes (que al
menos generara cooperacion cuando se informa de una previa cooperacion)
sino por la dificultad de evaluar acciones cuando sus consecuencias no son
claras. Es decir, cuando un agente no conoce la eleccion de su oponente, no es
capaz de evaluar todos sus pagos posibles, y esto hace que busque la accion
cooperativa.
b. Juegos de coordinaci
on
Los tipos de experimentos que presentamos a continuacion tienen como proposito
atacar tres interrogantes respecto a los juegos de coordinacion; en principio,
determinar que equilibrio se elige dada cierta estructura de interaccion; segundo, analizar como aspectos historicos inciden en la eleccion de un equilibrio;
y finalmente, determinar si aspectos exogenos, en particular, los pagos en estados que no seran alcanzados por agentes racionales, determinan la eleccion
de uno u otro equilibrio.
En un primer experimento, van Huyck, Battalio y Beil [1990] se proponen
recopilar evidencia experimental para determinar si la dominancia en el sentido
de Pareto, as como ciertos aspectos historicos, determinan los equilibrios que
seran seleccionados por los agentes en juegos de coordinacion pura. Para esto
dise
nan experimentos con sesiones de alrededor de 15 jugadores que deben
elegir aisladamente un n
umero entero de 1 a 7. Los pagos de cada jugador estan
determinados por la eleccion que este realice y por el menor valor seleccionado
por los miembros del grupo: especficamente, los pagos para cada jugador en
los dos escenarios dise
nados, son como aparecen en las figuras 20 y 21.
Figura 20: Escenario A

Valor escogido

7
6
5
4
3
2
1

Menor
7
6
1.3 1.1
1.2
-

valor
5
0.9
1.0
1.1
-

escogido
4
3
0.7 0.5
0.8 0.6
0.9 0.7
1.0 0.8
0.9
-

2
0.3
0.4
0.5
0.6
0.7
0.3
-

Observemos que, en ambos escenarios, la situacion en la que todos los individuos eligen el mismo n
umero constituye un equilibrio de Nash, independientemente de cual sea tal n
umero. De forma similar, observemos que estos
equilibrios de Nash estan ranqueados en el sentido de Pareto de acuerdo con
el n
umero que sea elegido por todos; es decir, el equilibrio optimo de Pareto

50

Un Curso de Teora de Juegos Clasica


corresponde a la situacion en que todos los jugadores eligen 7, mientras que
el peor equilibrio ocurre cuando todos eligen 1. Finalmente, notemos que
en el escenario B la eleccion del n
umero 7 es una estrategia dominante para
cada jugador. Uno de los objetivos buscados por los experimentadores con el
dise
no de este escenario B era determinar si los participantes comprendan
suficientemente bien el experimento en el sentido de que percibieran (y eligieran) la estrategia dominante; esto es, si el experimento no era claro para los
participantes, estos no elegiran el n
umero 7.

Figura 21: Escenario B

Valor escogido

7
6
5
4
3
2
1

Menor
7
6
1.3 1.2
1.2
-

valor
5
1.1
1.1
1.1
-

escogido
4
3
1.0 0.9
1.0 0.9
1.0 0.9
1.0 0.9
0.9
-

2
0.8
0.8
0.8
0.8
0.8
0.8
-

La dinamica del experimento consista en que todos los jugadores enfrentaran


el escenario A en 10 ocasiones, conociendo siempre las elecciones de la etapa
inmediatamente anterior; luego deban pasar al escenario B en 5 ocasiones y,
posteriormente, regresaran al escenario A para jugar 5 o 7 veces mas.
El proposito de esta dinamica era, por un lado, observar cual equilibrio emerga
en cada escenario a partir de la informacion que iban adquiriendo los jugadores
y, por otro lado, determinar si el equilibrio alcanzado en el escenario B se
constitua en un punto focal para la u
ltima fase a desarrollarse en el escenario
A.
Algunos de los resultados obtenidos fueron los siguientes:
a. Luego de algunas repeticiones en el escenario B, el 96 % de los participantes en el experimento eligen el n
umero 7, lo que indica que el juego
era comprendido y que los jugadores tenan incentivos para participar en
el experimento.
b. Aunque en las etapas iniciales en el escenario A (antes y despues de jugar
en B) se presenta una alta dispersion en las elecciones realizadas por los
jugadores, rapidamente estos se coordinan en la elecci
on del n
umero 1;
es decir, en el peor de los equilibrios de Nash en terminos de pagos.

51

Juegos No-Cooperativos con Informacion Simetrica

El hecho de que los jugadores se coordinen nuevamente en 1 despues de haber


participado en el escenario B indica que haberse coordinado en 7 en tal escenario, no genera un punto focal para la fase siguiente del juego.
Notemos que, contrariamente a lo que sugiere la intuicion, el criterio de optimalidad paretiana no es suficiente para la generaci
on de puntos focales; de
hecho, la coordinacion, de presentarse, se lleva a cabo sobre el equilibro que
genera los menores pagos conjuntos; luego son aspectos como el riesgo, y la
incertidumbre respecto a la racionalidad de los demas, lo que probablemente
incide de manera mas importante en la decision de los jugadores.
Un aspecto controlado por los experimentadores era el n
umero de jugadores en
cada sesion; cuando los grupos se reducen a solo 2 jugadores, estos se coordinan
mas rapidamente en la eleccion del n
umero 7; lo anterior sugiere que el tama
no
del grupo importa, en el sentido que reduce la probabilidad subjetiva que cada
individuo asigna a que los demas elijan n
umeros peque
nos, y a que permite
pensar que los individuos eligen estrategias de largo plazo que les garanticen
pagos altos gracias a la reputacion adquirida en la etapas iniciales. Sobre esto
hablaremos mas adelante en la seccion de juegos repetidos.
En otro experimento con juegos de coordinacion Copper, DeJong y Ross [1990]
se proponen estudiar como el poder focal de un equilibrio en un juego de
coordinacion es influenciado por los pagos de estrategias que no son jugadas
en equilibrio. As, proponen juegos como los de la figura 22 donde aparecen
dos equilibrios de Nash puros (1, 1) y (2, 2), y donde la tercera estrategia es
estrictamente dominada para cada jugador.
Figura 22: Coordinacion con estrategias dominadas
Juego 1

Juego 2

350,350

350,250

700,0

350,350

350,250

700,0

250,350

550,550

0,0

250,350

550,550

1000,0

0,700

0,0

600,600

0,700

0,1000

500,500

Notemos que la u
nica diferencia entre los dos juegos son los pagos que obtienen
los jugadores por la estrategia 3 que, realmente, no es jugada en equilibrio.
La dinamica del experimento consista en que cada jugador era emparejado
aleatoriamente con otro en 20 ocasiones. Algunos de los resultados aparecen
en la figura 23.

52

Un Curso de Teora de Juegos Clasica


Figura 23: Experimento en juegos de coordinacion

Juego 1

Juego 2

Fuente: Cooper, DeJong, Forsythe y Ross (1990)

Observemos que conforme los jugadores ganan experiencia, se coordinan en


uno de los equilibrios del juego. Al igual que en el experimento anterior, la
dominancia paretiana no es suficiente para determinar en que equilibrio se coordinan los agentes, ya que en el primero de los casos la coordinacion se hace
sobre el equilibrio (1, 1) que es Pareto-dominado por (2, 2). De igual forma,
notemos que los pagos de la estrategia dominada efectivamente afectan la coordinaci
on de los agentes sobre los equilibrios. Para explicar tal coordinacion
Copper et a
l. recurren a dos hipotesis. La primera es que cada individuo cuestiona la racionalidad de su compa
nero y as elige la mejor-respuesta ante una
estrategia dominada de aquel (observemos que, en el primer juego, la coordinacion se alcanza sobre la estrategia 1 que es una mejor-respuesta ante 3,
mientras que en el segundo juego la mejor respuesta ante 3 es la estrategia 2,
y es precisamente all donde se da la coordinacion). La segunda hipotesis es
que cada jugador espera encontrar una pareja con la que alcance el maximo
pago conjunto. Para inclinarse a favor de una u otra hipotesis, Copper et a
l.
proponen dos juegos adicionales del estilo del de la figura 24.
Figura 24: Juego de coordinacion adicional
1

350,350

350,250

700,0

250,350

550,550

0,0

0,700

0,0

500,500

Notemos que la mejor-respuesta ante la estrategia 3 es la estrategia 1, luego


la coordinacion en (1, 1) favorecera la primera hipotesis. Asimismo, notemos
que el maximo pago conjunto se encuentra en (2, 2), luego la coordinacion en

Juegos No-Cooperativos con Informacion Simetrica

53

este equilibrio favorecera la segunda hipotesis. Se encontro como resultado de


este nuevo experimento la coordinacion en el equilibrio (2, 2), lo que lleva a
afirmar a Copper et a
l. que cada participante asigna una probabilidad positiva
a encontrarse con un oponente que sea altruista, en el sentido de buscar el
m
aximo pago conjunto, y act
ua en consecuencia.

Ejercicios 4.
1. John Stuart Mill [1848] establece que, como excepcion del principio economico de laissez-faire, existen casos donde la ley es precisa no para predominar
sobre el juicio de los individuos respecto de sus propios intereses, sino para
dar efectividad a ese juicio. As, se refiere al caso particular de una reduccion
de la jornada laboral de diez a nueve horas manteniendose el salario constante. Establece que aunque todos los obreros estuvieran convencidos de que
se veran beneficiados por esta medida, esta no sera adoptada a menos que se
estableciera una ley que obligara su cumplimiento, ya que:
...si casi todos se atuvieran a las nueve horas, los que prefirieran trabajar diez seran los que ganaran todas las ventajas de la restriccion,
al mismo tiempo que el beneficio de infringirla: obtendran el salario
correspondiente a las diez horas por nueve de trabajo y ademas el
salario de una hora [...] es probable que fueran tantos los que prefirieran las diez horas en las condiciones mejoradas, que no pudiera
mantenerse la limitacion como una regla general. (Mill [1848], pp.
948 a 951).
a. Describa la situacion mencionada como un juego; defina los jugadores,
sus estrategias y sus funciones de pagos.
b. Encuentre el equilibrio de Nash de este juego.
c. Comente.
2. Discutiendo acerca de la evolucion social y sus beneficios, J. J. Rousseau [1755]
describe la siguiente situacion a la que se enfrentan un conjunto de cazadores
que persiguen un venado:
En el trabajo de cazar un venado cada cazador debe sentir que
su proposito es mantenerse fiel a su objetivo; sin embargo, si una
liebre pasara cerca a alguno de ellos, no habra duda de que este la
perseguira sin escr
upulos y que, habiendo obtenido su presa, poco le
importara haber causado a sus compa
neros la perdida de las suyas.
a. Modele esta situacion en una bimatriz asumiendo que las u
nicas acciones
disponibles a cada agente son cazar venado y cazar liebre.

54

Un Curso de Teora de Juegos Clasica


b. Encuentre los equilibrios de Nash del juego.
c. Interprete sus resultados.
3. Calcule el equilibrio de Nash del siguiente juego:
b1

b2

b3

a1

0,0

50,40

40,50

a2

40,50

0,0

50,40

a3

50,40

40,50

0,0

Muestre que si cualquier jugador adopta una estrategia distinta de la del equilibrio de Nash, la respuesta optima por parte del otro jugador resultara en unos
pagos superiores para ambos. As, el equilibrio de Nash es el peor resultado
posible!
4. Suponga que a usted se le propone el siguiente juego: Escoja un n
umero de
1 a 3. Yo trato de adivinarlo. Usted responde (con la verdad): alto, bajo
o correcto dependiendo de si el n
umero que yo dije es mas alto, mas bajo o
correcto, respecto al n
umero que usted escogio. Usted recibira el n
umero de
miles de pesos igual al n
umero de intentos de adivinar que yo haya tenido que
hacer antes de acertar. Construya un juego en forma estrategica que describa
la interaccion mencionada y encuentre los equilibrios de Nash.
5. Resuelva los siguientes juegos mediante eliminacion de estrategias estrictamente dominadas. Verifique que la solucion es un equilibrio de Nash.
Jugador 2
A

4,2

-6,5

6,1

0,-1

Jugador 1

Jugador 2
A

0,2

4,-25

-1,0

2,1

Jugador 1

6. Suponga que en un pas solo hay automoviles japoneses y franceses. Dos individuos estan interesados en comprar cada uno un automovil y sus elecciones
posibles son:
wi = 1

si i adquiere un vehculo japones

wi = 1

si i adquiere un vehculo frances

55

Juegos No-Cooperativos con Informacion Simetrica


y sus funciones de pago son
v1 (w1 , w2 ) = u1 (w1 ) + 2w1 w2
v2 (w1 , w2 ) = u2 (w2 ) + 2w1 w2
donde u1 (1) = 1, u1 (1) = 2, u2 (1) = 2, u2 (1) = 1
a. Describa este juego en una bimatriz 2 2.

b. Encuentre los equilibrios de Nash de este juego.


c. Cree usted que existe en este juego un efecto conformidad; es decir,
que hace parte del beneficio de cada jugador adquirir un vehculo similar
al del vecino?
VI.

Principio-Soluci
on de Equilibrios de Nash en
Estrategias Mixtas

La amplia posibilidad del concepto de equilibrio de Nash de resolver juegos, que el


principio de dominancia iterada no tiene, hace de aquel un concepto mas potente y
mas controversial que el concepto de solucion basado en la idea de que los jugadores
no escogen estrategias dominadas y tienen conocimiento com
un. El problema se
complica a
un mas si se tiene en cuenta que casi todos los juegos tienen otro tipo de
equilibrios de Nash. Para ver esto, consideremos una vez mas el juego de lanzar la
moneda:
Ejemplo 19 (Lanzar la moneda (von Neumann y Morgenstern [1944])).
Ya sabamos que en el juego lanzar la moneda (matching pennies) dos agentes
lanzan cada uno una moneda; si en ambas monedas aparece cara o sello, el jugador
1 gana la moneda del otro; si difieren, es el jugador 2 el que la gana. Los pagos se
ilustran en la bimatriz de la figura 25.
Figura 25: Juego de lanzar la moneda
Jugador 2
C

1,-1

-1,1

-1,1

1,-1

Jugador 1

C cara

S sello

Para intentar solucionar este juego, tomemos, por ejemplo, el par de estrategias
(C, C); dado que el jugador 2 cree que el jugador 1 escogera su estrategia C, lo

56

Un Curso de Teora de Juegos Clasica

mejor que el puede hacer es escoger su estrategia S, lo que muestra que (C, C)
no puede ser un equilibrio de Nash. De forma similar, el par de estrategias (C, S)
tampoco puede ser un equilibrio de Nash ya que si el jugador 1 espera que 2 juegue
S, lo mejor que este puede hacer es desviarse y jugar S. Por un argumento similar, se
puede mostrar que en las demas combinaciones de estrategias puras tambien existen
incentivos para desviarse unilateralmente por parte de alg
un jugador. Esto muestra
que no existe un equilibrio de Nash en estrategias puras para este juego. Sin embargo,
como nos lo ense
naron von Neumann y Morgenstern, s existe un equilibrio de otro
tipo, conocido como equilibrio en estrategias mixtas, en el que cada jugador adopta
una estrategia asignandole cierta probabilidad a cada una de las estrategias puras
de los demas jugadores; es decir, cada jugador asume ciertas probabilidades sobre las
estrategias puras que los otros jugadores escoger
an.
M
Definici
on 5 (Estrategia Mixta (von Neumann [1928])).
a. En un juego finito en forma estrategica = (N, (C i )iN , (ui )iN ), una estrategia mixta del jugador i es una distribucion de probabilidad sobre el conjunto
de estrategias puras Ci . Al conjunto de todas las estrategias mixtas del jugador
i lo denotamos por i . Para i i y ci Ci , i (ci ) es la probabilidad que la
distribucion i le asigna a la estrategia ci . El soporte de una estrategia mixta
i es el conjunto de estrategias puras a las cuales i le asigna una probabilidad
estrictamente positiva.
b. Una estrategia mixta del juego es una combinacion de distribuciones
= (1 , 2 , . . . , n )
donde i i para todo i; es decir, ni=1 i .
De acuerdo con la definicion anterior, es claro que el conjunto de las estrategias mixtas contiene al de las estrategias puras. En este caso, cada i le asigna probabilidad
1 a cierta estrategia pura y probabilidad 0 a las demas estrategias.
Definici
on 6 (Utilidad Esperada (von Neumann y Morgenstern [1944])).
Sea = (N, (Ci )iN , (ui )iN ) un juego finito en forma estrategica. Dado un perfil de
distribuciones = (1 , ..., n ) ni=1 i , la utilidad esperada del jugador i asociada
a este perfil corresponde a la siguiente expresion:
P
ui () cC (nj=1 j (cj )ui (c))

De esta forma, la utilidad esperada de un jugador tiene la misma naturaleza que un


valor esperado (matematico); es decir, corresponde a una suma ponderada de todas
las utilidades que puede alcanzar el jugador, donde la ponderacion de cada una de
estas es la probabilidad de ocurrencia del resultado que genera tales pagos.

57

Juegos No-Cooperativos con Informacion Simetrica

Ejemplo 20 (Un Calculo de Utilidades Esperadas).


En el juego de la figura 26, dado que ning
un agente tiene certeza acerca de la eleccion
de su oponente, cada uno de ellos debe asignar probabilidades a las estrategias de
acuerdo con sus creencias.
Figura 26: Calculo de utilidades esperadas
Jugador 2
x2

y2

x1

3, 2

5, 1

y1

4, 1

2, 3

Jugador 1

El jugador 1 puede asignar una probabilidad q a la estrategia x 2 del jugador 2 y por


consiguiente, una probabilidad 1 q a la estrategia y 2 . De igual forma, el jugador 2
asigna una probabilidad p a la estrategia x 1 del jugador 1 y una probabilidad 1 p
a la estrategia y1 . Esto puede observarse en la figura 27.
Figura 27: (...continuacion)
Jugador 2
(q)

(1-q)

x2

y2

(p) x1

3, 2

5, 1

(1-p) y1

4, 1

2, 3

Jugador 1

Esta estrategia mixta del juego es, entonces, (p[x 1 ]+(1p)[y1 ], q[x2 ]+(1q)[y2 ]). Por
consiguiente, la utilidad esperada del jugador 1 de su estrategia x 1 es 3q + 5(1 q).
De igual forma, la utilidad esperada de su estrategia y 1 es 4q+2(1q). Similarmente,
para el jugador 2 la utilidad esperada de su estrategia x 2 es 2p + 1(1 p) y de su
estrategia y2 es p + 3(1 p). De manera que los pagos de los jugadores asociados a
la estrategia mixta (1 , 2 ), donde 1 = (p, 1 p), 2 = (q, 1 q) son:
Jugador 1:

p(3q + 5(1 q)) + (1 p)(4q + 2(1 q)) = 2 2pq + 5p 2q 2

Jugador 2:

q(2p + (1 p)) + (1 q)(p + 3(1 p)) = 3 + 3pq 2q 2p


M

58

Un Curso de Teora de Juegos Clasica

Ejemplo 21 (Utilidades Esperadas de lanzar la moneda).


Consideremos el juego de lanzar la moneda, tal como se establece en la figura 25, y
que presentamos nuevamente en la figura 28.

Figura 28: lanzar la moneda


Jugador 2

Jugador 1
(p)
(1-p)

C
S

(q)

(1-q)

1,-1

-1,1

-1,1

1,-1

En este juego las utilidades esperadas de los jugadores 1 y 2 para cada una de sus
estrategias son:
UE1 (C) = 2q 1,

UE1 (S) = 1 2q,

UE2 (C) = 1 2p,

UE2 (S) = 2p 1

Con esto, las utilidades esperadas por participar en el juego son:


UE1 = 2p(2q 1) 2q + 1

UE2 = 2q(1 2p) + 2p 1


M

Definici
on 7 (Dominancia Estricta y Debil en Estrategias Mixtas).
Sea = {N, (Ci )iN , (ui )iN } un juego finito en forma estrategica. Entonces:
a. La estrategia mixta i i domina estrictamente a otra estrategia i0 i
para el jugador i si ui (i , i ) > ui (i0 , i ) para todo i i 15 .
b. La estrategia mixta i i es estrictamente dominante para el jugador i si
ui (i , i ) > ui (i0 , i )
para todo i i , para toda i0 i .
c. La estrategia mixta i i domina debilmente a otra estrategia i0 i para
el jugador i si ui (i , i ) ui (i0 , i ) para todo i i .
15

De forma similar a los hechos en el caso con estrategias puras, i denota el conjunto de
estrategas mixtas conjuntas de todos los jugadores excepto i.

Juegos No-Cooperativos con Informacion Simetrica

59

d. La estrategia mixta i i es debilmente dominante para el jugador i si


ui (i , i ) ui (i0 , i )
para todo i i , para toda i0 i .
Ejemplo 22.
Consideremos el juego representado por bimatriz de la figura 29.
Figura 29: Dominacia en estrategias mixtas
H

5,2

1,1

1,1

5,2

2,3

2,3

En este juego ninguna estrategia pura es estrictamente dominada para ninguno de


los jugadores. Sin embargo, para cualquier conjetura de 1 acerca de la distribucion de
probabilidad con la que 2 elige sus estrategias puras (q, 1 q), existe una estrategia
mixta en la que 1 realiza aleatoriedad entre S y D con probabilidad 1/2 que domina
estrictamente a W . Para ver esto notemos que la utilidad esperada por seguir tal
estrategia mixta es:
1
1
[5q + 1(1 q)] + [1q + 5(1 q)] = 3
2
2
que es estrictamente mayor que el pago que 1 obtendra con certeza por jugar W ,
esto es, 2. Lo anterior hace pensar que si un jugador nunca elige una estrategia pura,
existe una estrategia mixta que las domina a todas.
M
El teorema siguiente muestra que si eliminamos una estrategia pura por dominancia estricta podemos estar seguros de que esta estrategia no puede hacer parte de
ninguna estrategia mixta estrictamente dominante.
Teorema 5 (No debemos apostarle a un perdedor).
Una estrategia mixta de un jugador que asigna probabilidad positiva a una estrategia
pura estrictamente dominada es tambien estrictamente dominada.
Demostraci
on.
Sin perdida de generalidad, supongamos que
N = {1, 2}, C1 = {A, B}, C2 = {C, D}

60

Un Curso de Teora de Juegos Clasica

y que B es dominada estrictamente por A para el jugador 1.


Si 1 = (p, 1 p), donde p > 0 es la probabilidad asociada a la estrategia A del
jugador 1 y 2 = (q, 1 q), donde q es la probabilidad asociada a la estrategia C del
jugador 2, entonces
u1 (1 , 2 ) = pE(A) + (1 p)E(B)
donde
E(A) = qu1 (A, C) + (1 q)u1 (A, D)
y
E(B) = qu1 (B, C) + (1 q)u1 (B, D)
Pero como u1 (B ) < u1 (A ), entonces E(B) < E(A). Luego,
u1 (1 , 2 ) = pE(A) + (1 p)E(B) < pE(A) + (1 p)E(A)
= E(A) = 0E(B) + 1E(A) = u1 (10 , 2 )
donde 10 = (1, 0). De acuerdo con la definicion, 10 domina estrictamente a 1 .

Definici
on 8 (Equilibrio de Nash Mixto (Nash [1950b])).
En un juego finito en forma estrategica = (N, (C i )iN , (ui )iN ), el perfil de estrategias mixtas = (i )iN ni=1 i es un equilibrio de Nash en estrategias
mixtas (o equilibrio de Nash mixto) si, para cada i N , la estrategia mixta i del
jugador i es una mejor-respuesta a las estrategias mixtas de los demas jugadores.
Esto es, es un equilibrio de Nash en estrategias mixtas para el juego si, y solo
si,

ui (i , i
) ui (i , i
) i i . i N
) = ( , , . . . , , , , . . . , ).
donde (i , i
n
1
2
i1 i i+1

Como hemos visto, una estrategia mixta es una distribucion de probabilidad sobre
las estrategias puras de un jugador. De esta forma, un equilibrio de Nash en estrategias mixtas corresponde a una situacion en la que al menos uno de los jugadores no
se ve beneficiado por desviarse unilateralmente a jugar una estrategia pura u otra
estrategia mixta; es decir, para este resulta mejor elegir su accion de forma aleatoria
y no determinsticamente.
Cuando un jugador sigue una estrategia mixta en un equilibrio de Nash, debe ser
indiferente entre las estrategias puras a las cuales les asigna probabilidad positiva:
si no lo fuera, entonces aquella estrategia pura que obtiene mayor utilidad esperada
dominara a la estrategia mixta. El siguiente teorema ilustra esta idea y nos permite,
efectivamente, calcular equilibrios de Nash mixtos.

61

Juegos No-Cooperativos con Informacion Simetrica

Teorema 6.
Si un jugador utiliza una estrategia mixta no degenerada (es decir, que asigna una
probabilidad positiva a m
as de una estrategia pura) en un equilibrio de Nash mixto,
entonces es indiferente entre todas las estrategias puras a las cuales les ha asignado
probabilidad positiva. La afirmaci
on recproca no es cierta.
Demostraci
on.
Consideremos (sin perdida de generalidad) solo el caso N = {1, 2}, C 1 = {A, B}, C2 =
{C, D}. Supongamos, ademas, que el jugador 1 asigna probabilidades p y 1 p, con
0 < p < 1, a las estrategias A y B, respectivamente. Sea i la distribucion que asigna
la probabilidad p a la estrategia A del jugador 1 y probabilidad 1 p a la estrategia
B; sea 2 una distribucion cualquiera sobre las estrategias del jugador 2; y supongamos que = (1 , 2 ) es un equilibrio de Nash. Si E(A) > E(B), donde E(A) es
el valor esperado de la estrategia A del jugador 1 y E(B) es el valor esperado de la
estrategia B del jugador 1, entonces,
u1 (1 , 2 ) = pE(A) + (1 p)E(B) < pE(A) + (1 p)E(A) =E(A)

=u(10 , 2 )

donde 10 = (1, 0), y esto contradice la definicion de equilibrio de Nash para =


(1 , 2 ).
Ejemplo 23 (El Juego de Coordinacion, otra vez).
Consideremos nuevamente el juego de coordinacion del ejemplo 19 que presentamos
de nuevo en la figura 30, y encontremos su equilibrio de Nash mixto.
Figura 30: El Juego de coordinacion
q
(1-q)
D

10,10

0,0

(1-p)

0,0

1,1

D Derecha, I Izquierda

Soluci
on
Para comenzar, encontremos las utilidades esperadas de cada uno de los jugadores
para cada una de sus estrategias. Si el jugador 1 cree que el jugador 2 va a jugar
su estrategia pura derecha (D)con probabilidad q e izquierda (I) con probabilidad
1 q, sus pagos esperados por jugar sus estrategias derecha e izquierda son, respectivamente,
UE1 (D) = 10q + 0(1 q) = 10q

UE1 (I) = 0q + 1(1 q) = 1 q

62

Un Curso de Teora de Juegos Clasica

De forma analoga, si el jugador 2 cree que el jugador 1 va a jugar su estrategia


derecha con una probabilidad p y su estrategia izquierda con una probabilidad 1 p,
sus pagos esperados por jugar las estrategias derecha e izquierda, respectivamente,
son:
UE2 (D) = 10p + 0(1 p) = 10p

UE2 (I) = 0p + 1(1 p) = 1 p

Como se establece en el teorema 6, cada jugador escogera la probabilidad con la que


juega cada una de sus estrategias puras de tal forma que su oponente sea indiferente
al momento de elegir entre estas; es decir, la utilidad esperada de cada una de sus
estrategias puras debe ser igual para cada jugador. As, tenemos que
Jugador
10q = 1 q
1
q =
11

Jugador

10p = 1 p
1
p =
11

De esta forma, la solucion del juego indica que cada uno de los jugadores escogera su estrategia Derecha con probabilidad 1/11 y su estrategia Izquierda con
probabilidad 10/11. El equilibrio de Nash en estrategias mixtas es = (1 , 2 ) =
[(1/11, 10/11) , (1/11, 10/11)], el cual ofrece a los jugadores pagos esperados, en equilibrio, de (0.9, 0.9), que es inferior al pago en los equilibrios de Nash en estrategias
puras (10,10) y (1,1). Notemos, sin embargo, que una vez han sido elegidas las probabilidades con las que cada uno de los jugadores elige cada posible accion, todos son
indiferentes entre jugar su estrategia mixta y jugar una estrategia pura; esto es, los
valores esperados de sus utilidades son siempre 0.9.
M
Ejemplo 24 (Lanzar la moneda, otra vez).
En el ejemplo 21 habamos visto que las utilidades esperadas de los jugadores en el
juego de lanzar la moneda vienen dadas por las siguientes expresiones:
UE1 (C) = 2q 1,

UE2 (C) = 1 2p,

UE1 (S) = 1 2q

UE2 (S) = 2p 1

De acuerdo al teorema 6, se tiene que U E1 (C) = UE1 (S) y que UE2 (C) = UE2 (S) y,
por tanto, p = 1/2 y q = 1/2. As, el equilibrio de Nash mixto de este juego es
[(1/2, 1/2) , (1/2, 1/2)], y los pagos esperados, en equilibrio, son de cero para cada
jugador.
M
Evidencia Experimental de lanzar la moneda
Goeree y Holt [2001] dise
naron un experimento en el que dos individuos enfrentan
un juego con pagos simetricos en el que el u
nico equilibrio de Nash consiste en

63

Juegos No-Cooperativos con Informacion Simetrica

que cada jugador asigne una probabilidad del 50 % a cada una de sus dos estrategias, tal como en el juego de lanzar la moneda. Se tomaron parejas de individuos
seleccionadas aleatoriamente para participar en el juego por una sola vez. Se encontro que el porcentaje de la poblacion que eligio cada una de las acciones disponibles
se ubico suficientemente cerca del 50 %, luego aparece cierta relacion entre el porcentaje de individuos que elige cada estrategia pura, y la probabilidad que se le
asigna a cada una de estas en el u
nico equilibrio de Nash del juego. Sin embargo,
al variar uno de los pagos de solo uno de los jugadores, su asignacion de probabilidades, en equilibrio, no cambia ya que su eleccion de probabilidades se realiza con
base en los pagos de su oponente. Recordemos que estas probabilidades se eligen de
tal forma que el oponente sea indiferente entre todas sus estrategias puras a las que
les asigna probabilidad positiva.
A
un as, los resultados experimentales muestran que ante un pago mayor en un
400 % en una de las estrategias, digamos del jugador 1, el porcentaje de la poblacion
que elige tal estrategia aumenta hasta cerca de un 96 %, mientras que cuando el
incremento es solo del 10 % tal incremento llega hasta el 92 %. Es decir, modificar
levemente o de forma sustancial uno de los pagos de un juego simetrico, transforma
dramaticamente el porcentaje de la poblacion que elige cada una de las estrategias
puras. As, en principio encontramos cierto sustento experimental ante los equilibrios
teoricos del juego lanzar la moneda simetrico. Sin embargo, cuando se introduce
alguna asimetra en los pagos, tal sustento parece desaparecer.
Ejemplo 25 (Juego de El Gallina).
Este juego ilustra la escena de la pelcula Rebelde sin causa de los a
nos 1960 en la
que dos jovenes (uno de ellos, el actor James Dean) se ubican en sus automoviles en
una misma calle en extremos opuestos y aceleran en direccion contraria (uno contra
el otro). Cada uno puede decidir en cierto momento entre las opciones continuar
(C) o quitarse del camino(Q). Desde luego, si ambos contin
uan, reciben un pago
negativo a causa del accidente; en caso de que uno contin
ue y el otro se retire del
camino (caso en el cual no hay accidente) el que se retira es calificado como gallina
y recibe un pago de cero mientras que el otro recibe un pago positivo. Si ambos se
retiran, los dos son calificados como gallinas, aunque reciben un pago positivo
peque
no por haber evitado el accidente. Los pagos se representan en la bimatriz de
la figura 31.
Aqu encontramos dos equilibrios de Nash en estrategias puras: (C, Q) y (Q, C).
Para encontrar el equilibrio mixto, igualamos las utilidades esperadas de cada una
de las estrategias puras de cada jugador:
Jugador
UE1 (C)

UE1 (Q)

5q + 2(1 q) = 0q + 1(1 q)
1
q =
6

Jugador
UE2 (C)

UE2 (Q)

5p + 2(1 p) = 0p + 1(1 p)
1
p =
6

64

Un Curso de Teora de Juegos Clasica


Figura 31: Juego de el gallina
q

(1-q)

-5,-5

2, 0

(1-p)

0,2

1,1

As, el equilibrio mixto de este juego es [(1/6, 5/6), (1/6, 5/6)], con pagos de 5/6 para
cada uno de los jugadores.
M
Nota Sobre Aplicaciones del Juego de El Gallina
El hecho de que en cada uno de los equilibrios puros de este juego uno de los
jugadores obtenga un pago mayor que el del otro, permite pensar que cada uno de
estos preferira el equilibrio que lo favorece y, de ser posible, adelantara acciones para
alcanzarlo. Un ejemplo para forzar la eleccion de cierto equilibrio en la historia
original de este juego podra ser que el conductor de uno de los automoviles lanzara
el timon de su auto por la ventana como un acto simbolico para decir que no se
quitara del camino. A este respecto, vale la pena se
nalar que el juego de El Gallina
ha sido utilizado en importantes aplicaciones a nivel poltico y militar. Entre tales
aplicaciones se encuentran la confrontacion nuclear, en donde cada uno de los pases
puede ser fuerte o debil, as como tambien el perodo previo a una guerra: en una
confrontacion nuclear, un pas se ve beneficiado si realiza un ataque y el otro no;
en caso de que ambos se ataquen, sus resultados son desastrosos para ambos. En el
perodo preguerra cada una de las partes puede ceder o mantenerse firme ante las
exigencias del otro. Al igual que en la historia original, cada pas prefiere que sea
el otro el que ceda y, de ser posible, adelantara acciones para conseguirlo. ONeill
[1999], por ejemplo, describe los insultos de Bush a Hussein en el perodo previo a
la Guerra del Golfo, y su comparacion con Hitler, como presiones para que Saddam
cediera y se alcanzara el equilibrio que favoreca a Estados Unidos.
Ejemplo 26 (La Batalla de los Sexos, otra vez).
Encontremos ahora el equilibrio de Nash mixto para el juego de la batalla de los
sexos, el cual ilustramos de nuevo en la figura 32.
Habamos visto que existen dos equilibrios de Nash en estrategias puras, (F, F ) y
(T, T ). Para encontrar el equilibrio de Nash en estrategias mixtas, debemos encontrar
la distribucion de probabilidad sobre las estrategias del esposo ( 1 = (p, 1 p)) y de
la esposa (2 = (q, 1q)), que les brinde la mayor utilidad esperada. Si ambos juegan
una estrategia mixta no degenerada, es decir 0 < p < 1 y 0 < q < 1, entonces, en
el equilibrio de Nash mixto, para cada jugador se deben igualar los pagos esperados
de sus dos estrategias. As,

65

Juegos No-Cooperativos con Informacion Simetrica


Figura 32: La Batalla de los Sexos

(1-q)

2,1

0,0

(1-p)

0,0

1,2

Esposo
UE1 (F )

UE1 (T )

2q + 0(1 q) = 0q + 1(1 q)
1
q =
3

Esposa
UE2 (F )

= UE2 (T )

p + 0(1 p) = 0p + 2(1 p)
2
p =
3

Luego, el perfil de distribuciones de probabilidad de equilibrio es



 

2 1
1 2

= (1 , 2 ) =
,
,
,
3 3
3 3
El pago esperado de jugar F o T en este equilibrio es 2/3 para cada jugador. Este
pago es menor al que podran obtener en los otros dos equilibrios de Nash.
Evidencia Experimental de la Batalla de los Sexos
En el experimento realizado por Rubinstein [1999] de la batalla de los sexos, se le
pide a cada jugador que haga una eleccion dependiendo de su genero. Los resultados
obtenidos indican que el 68 % de los participantes eligio su accion favorita; es decir, la
accion que lo conduce a su equilibrio favorito: para los hombres es F en nuestro juego,
mientras que es T para las mujeres. Haciendo un analisis en el que se clasifique por
genero, el 75 % de los hombres eligio su accion favorita, mientras que las mujeres se
dividieron equitativamente entre las dos opciones. En otro experimento, Cooper, De
Jong, Forsythe y Ross [1993] encontraron que alrededor del 64 % de los participantes
eligieron su accion favorita. Observemos que, en ambos experimentos, aparece cierta
relacion entre la eleccion sobre cada una de las estrategias puras en la distribucion
poblacional, y la distribucion de probabilidades en el equilibrio mixto. El hecho
de que la distribucion de hombres y mujeres sea diferente indica que hay patrones
culturales de genero, que influyen en las decisiones y que no estan incluidos en la
matriz de pagos.
En el experimento de Rubinstein se modifico el juego inicial, permitiendo que hubiera
cierta comunicacion previa al juego. En esta comunicacion, el jugador 1 anunciaba
que escogera su accion favorita y, seguido a esto, el jugador 2 anunciaba que sera

66

Un Curso de Teora de Juegos Clasica

el (ella) quien escogera su accion favorita. No tenan oportunidad de volver a comunicarse. Se le pregunta a los participantes del experimento cual accion conjunta
creeran que sera elegida por los jugadores. El 41 % de los participantes tiene una
inclinacion por la opcion que favorece a 2. Lo anterior evidencia un efecto puntofocal generado a partir de la comunicacion previa. Las otras tres combinaciones de
estrategias alcanzaron participaciones alrededor del 20 %.
M
Ejemplo 27.
Consideremos el juego de la figura 33. Aqu no hay ning
un equilibrio de Nash en
estrategias puras. Sin embargo, como veremos mas adelante, debe tener por lo menos
un equilibrio de Nash en estrategias mixtas. Para identificar este (o estos) equilibrio(s) utilizaremos el teorema 6; es decir, tendremos en cuenta que, en equilibrio,
un jugador utiliza una estrategia mixta si, y solo si, es indiferente entre todas las
estrategias puras a las cuales les asigna probabilidad positiva.
Figura 33: B
usqueda de equilibrios mixtos
L

7,2

2,7

3,6

2,7

7,2

4,5

De acuerdo con esto, consideraremos cuatro posibles casos para hallar equilibrios
en estrategias mixtas; en el primero de ellos, supondremos que el jugador 2 asigna
probabilidad positiva a todas sus estrategias puras; en los tres casos subsiguientes,
asumiremos que este jugador solo asigna probabilidades entre dos de sus estrategias
haciendo cero la probabilidad con la que juega la otra estrategia. Estos tres casos
difieren entre s dependiendo de la estrategia pura a la que se le asigna probabilidad
cero.
Analicemos entonces los casos:
a. El jugador 2 asigna probabilidad positiva a cada una de sus tres estrategias.
Si esto es cierto, tenemos que el pago esperado de jugar L (U E2 (L)) es igual al
pago esperado de jugar M (UE2 (M )) y al pago esperado de jugar R (UE2 (R));
es decir,
2 hT i + 7 hBi = 7 hT i + 2 hBi = 6 hT i + 5 hBi
donde hXi es la probabilidad con que un jugador juega la estrategia X. De
la primera igualdad se obtiene que hT i = hBi, mientras que de la segunda,
hT i = 3 hBi, con lo que obtenemos una contradiccion, por lo cual el jugador 2
no puede asignar probabilidad positiva a sus tres estrategias.

Juegos No-Cooperativos con Informacion Simetrica

67

b. El jugador 2 asigna probabilidad cero a su estrategia L


Si esto es cierto, obtenemos hT i = 3 hBi y hRi = 5 hM i; y esto es una contradiccion porque hRi y hM i son n
umeros positivos.
c. El jugador 2 asigna probabilidad cero a su estrategia R
Si esto es cierto, obtenemos hT i = hBi = 1/2 y hM i = hLi = 1/2. Por lo
tanto las utilidades esperadas son U 1 = 9/2, U2 = 9/2. Para verificar si esto
constituye un equilibrio de Nash, analicemos cuanto obtendra el jugador 2 si
decidiera desviarse y jugar, con probabilidad 1, su estrategia R. En tal caso, su
utilidad esperada sera U2 = 11/2 y, por tanto, le resulta provechoso hacerlo,
con lo cual jugar con probabilidad cero la estrategia R no puede constituir un
equilibrio de Nash.
d. El jugador 2 asigna probabilidad cero a su estrategia M
En este caso obtenemos hBi = 2 hT i y hRi = 5 hLi, es decir
2
1
5
1
hBi = ; hT i = ; hRi = ; hLi =
3
3
6
6
Con esta distribucion de probabilidades, las utilidades esperadas de los jugadores 1 y 2 seran, respectivamente: U 1 = 11/3, U2 = 16/3. Verifiquemos si
el jugador 2 tiene incentivos para desviarse y jugar su estrategia M con probabilidad 1. En tal caso, su pago esperado sera 11/3, y no tendra incentivos
para desviarse unilateralmente. As, el equilibrio de Nash de este juego es
[(1/3, 2/3) , (1/6, 0, 5/6)]
Existen las Estrategias Mixtas?
En lo que hemos visto, la nocion de estrategia mixta, y de equilibrio en estrategias
mixtas, se basa en la idea de que los jugadores aleatorizan a la hora de tomar sus
decisiones, lo cual equivale a decir que en el momento de decidir que hacer, estos
basan su decision en el resultado de una lotera que ellos mismos escogen. Vista
de esta forma, la aplicabilidad de este concepto resulta bastante abstracta. Radner y Rosenthal [1982], por ejemplo, establecen que una de las razones por las
cuales las ideas de la teora de juegos no han encontrado una aplicacion mas amplia, es la de aleatorizaci
on, que juega un papel importante en la teora de juegos y
parece tener limitada aplicacion en situaciones practicas 16 . De forma similar, Aumann [1987b] reconoce que las estrategias mixtas siempre han sido intuitivamente
problematicas. De manera que es necesario entonces detenernos un momento para
analizar tal concepto con cierto detalle.
16

Notemos que el teorema de existencia de al menos un equilibrio de Nash recurre al uso de


estrategias mixtas por parte de los jugadores.

68

Un Curso de Teora de Juegos Clasica

En primera instancia, es necesario aclarar que no toda aleatorizaci


on es un equilibrio
entre las estrategias puras disponibles. Para ilustrar esta idea, Rubinstein [1991]
propone el siguiente ejemplo: un empleador solo puede supervisar a uno de sus dos
empleados A y B. Estos pueden elegir entre esforzarse mucho o poco, y se esforzaran
mucho si la probabilidad de ser supervisados p es al menos del 50 %. El problema del
empleador no es entonces si supervisar a A o a B, sino el n
umero que asigna a p. La
poltica de p = 1/2 es la mejor para el empleador, y un comportamiento aleatorio es
optimo. Sin embargo, al no ser este indiferente entre p = 1 y p = 1/2, sino preferir
estrictamente este u
ltimo valor, tal comportamiento no es un equilibrio mixto en el
que las estrategias puras sean monitorear a A y monitorear a B.
Situaciones de este tipo se encuentran en m
ultiples escenarios; veamos unos ejemplos
a continuacion:
a. El tipo de lanzamiento (curva o recta) que efect
ua un lanzador en un juego
de beisbol es uno de estos casos. Si el bateador supiera de antemano que le
lanzaran una recta, se preparara para esto y lograra impactarla satisfactoriamente; de igual forma ocurrira si supiera que le van a lanzar una curva. Por
lo tanto, el lanzador podra ser indiferente entre lanzar una recta o una curva,
y su mejor estrategia es hacerse impredecible y escoger su lanzamiento de
acuerdo con alguna distribucion de probabilidad a priori.
b. Un caso similar es el de un ejercito decidiendo si atacar por aire o por tierra.
En caso de que el ejercito enemigo conociera de antemano el tipo de ataque,
lograra neutralizarlo; el exito de la invasion reside entonces en la aleatoriedad
respecto al camino a seguir.
En segunda instancia, y entre otras posibles interpretaciones de las estrategias mixtas, se encuentran las siguientes:
Idea de purificaci
on. En este contexto, una estrategia mixta se piensa como
un plan de accion que depende de informacion privada que no esta especificada en el modelo. De esta forma, una vez tal informacion privada se involucra al modelo, las estrategias mixtas se convierten en estrategias puras
condicionales a tal informacion. Dos aspectos juegan en contra de esta interpretacion: primero, considerar que los jugadores puedan basar sus decisiones
en aspectos que no afecten los pagos. Segundo, que el modelo se hace muy
sensible ya que cualquier cambio en algunas de las variables no-especificadas
que afectan el comportamiento de los agentes puede perturbar el equilibrio.
En el captulo siguiente veremos esto formalmente.
Grandes poblaciones. Podra pensarse cada juego como la interaccion entre
poblaciones grandes, en las que un juego particular se lleva a cabo una vez
cada jugador ha sido extrado aleatoriamente de una de estas poblaciones. En
este contexto, una estrategia mixta puede entenderse como una distribucion
poblacional sobre las estrategias puras. Los ejemplos que vimos sobre evidencia

Juegos No-Cooperativos con Informacion Simetrica

69

experimental de la batalla de los sexos o lanzar la moneda, en donde la


proporci
on de la poblacion que escoge cada estrategia pura se asemeja suficientemente a la probabilidad determinada por el equilibrio mixto, dan soporte a
este argumento. Esta idea esta en el centro de la visi
on evolutiva de la teora
de juegos, conocida como teora de juegos evolutivos. Sin embargo, para juegos
que solo se juegan una vez por parte de un solo par de jugadores, la justificacion de las estrategias mixtas como porcentajes de poblacion es, desde luego,
bastante limitada.

Ejercicios 5.
1. Encuentre el equilibrio de Nash en estrategias mixtas de la siguiente figura:
Izquierda

Derecha

Alta

7,2

2,7

Baja

3,3

4,1

2. (Halcon y Paloma) Dos individuos involucrados en un conflicto pueden adoptar uno de dos posibles comportamientos: agresivo (halcon) o conciliador
(paloma). Si dos Halcones se encuentran, se provocan da
nos por una valor de
(v c)/2, donde c > v > 0. Si un halcon se encuentra con una paloma, el
halcon obtiene v y la paloma cero. Si dos palomas se encuentran obtienen cada
uno v/2.
a. Presente este juego en forma estrategica.
b. Encuentre los equilibrios de Nash de este juego.
c. Determine como cambian las probabilidades de equilibrio ante cambios
en v y c. Explique.
3. En el juego bilateral resumido por la siguiente figura:
R

4,1

3,3

2,2

5,5

1,4

3,3

2,4

2,1

1,3

70

Un Curso de Teora de Juegos Clasica


a. Que estrategias del juego sobreviven a la eliminacion iterativa de estrategias dominadas?
b. Calcule los equilibrios de Nash, tanto en estrategias puras como mixtas.
4. Analizar nuevamente el juego infantil piedra - papel - tijera en el que dos
ni
nos deben elegir simultaneamente una de estas tres opciones, con una se
nal
en la mano que identifique los respectivos objetos; piedra vence a tijera,
tijera vence a papel y papel vence a piedra. El jugador que gane,
obtiene un pago de 2; el que pierda, un pago de cero; y, en caso de empate,
cada uno recibe un pago de uno.
a. Presente este juego en forma estrategica.
b. Encuentre la solucion del juego.
5. Los jugadores 1 y 2 escogen, cada uno, un elemento del conjunto {1, ..., K}.
Si los jugadores escogen el mismo n
umero entonces el jugador 2 le paga $1 al
jugador 1, y si no escogen el mismo n
umero no se realiza ning
un pago. Cada
jugador quiere maximizar su pago monetario esperado. Encuentre el equilibrio
de Nash en estrategias mixtas de este juego.
6. El ejercito A tiene un avion con el que puede atacar uno de tres posibles
objetivos. El ejercito B tiene un tanque antiaereo que puede ser asignado a
uno de los objetivos. El valor del objetivo k es v k donde v1 > v2 > v3 . El
ejercito A puede destruir un objetivo solo si el objetivo no esta defendido y el
ataca. El ejercito A desea maximizar el valor esperado de los da
nos, y el ejercito
B lo desea minimizar. Formule la situacion como un juego en forma estrategica
y encuentre los equilibrios de Nash mixtos. Encuentre el valor minmax de este
juego y explique su relacion con los equilibrios de Nash mixtos.
7. Calcule los equilibrios de Nash en estrategias mixtas del juego de la siguiente
figura e interprete estos equilibrios:
L

8,5

3,9

4,8

4,6

5,3

5,7

a2

b2

c2

a1

6,12

5,2

2,5

b1

2,2

3,12

12,5

8. Vimos los problemas que surgan en la coordinacion en juegos con m


ultiples
equilibrios. Algunos resultados recientes en teora de juegos explican la coordinacion en lo que se ha dado en llamar equilibrios dominantes bajo riesgo
(risk-dominant). Un equilibrio de Nash es dominante bajo riesgo si cada una de
las estrategias que lo componen es una mejor respuesta a una estrategia mixta
del otro jugador, en la que asigna igual probabilidad a todas sus estrategias
puras.

71

Juegos No-Cooperativos con Informacion Simetrica

a. Muestre que con el criterio de dominancia bajo riesgo, en el juego de


coordinacion se elige el equilibrio Pareto-dominante.
b. Muestre que si los pagos se modifican de la siguiente forma, se elige el
equilibrio Pareto-dominado y explique este resultado:
D

10,10

-100,2

2,-100

1,1

La relacion que presentan los pagos de este juego constituye lo que se


conoce como el juego de el cazador de venados, que representa la historia que ya comentamos de J. J. Rousseau en la seccion V.
9. En un juego = (N, (Ci )iN , (ui )iN ) una estrategia correlacionada es una distribucion de probabilidad sobre el conjunto de estrategias puras conjuntas de
los jugadores en N . Un mediador recomienda confidencialmente a cada uno de
los jugadores una estrategia particular. Una vez realizada tal recomendacion,
cada jugador es libre de seguirla o no. Una recomendacion del mediador es un
equilibrio correlacionado (Aumann [1974]) si, y solo si, la utilidad esperada de
cada jugador por seguir la recomendacion del mediador es mayor que la de no
hacerlo; esto es, si la recomendacion realizada por el mediador se realiza de
acuerdo con la distribucion de probabilidad sobre ni=1 (Ci ), decimos que tal
recomendacion es un equilibrio correlacionado del juego si, y solo si:
X

ci Ci

(ti , ti )ui (ti , ti )

(ti , ti )ui (di , ti )

ci Ci

para todo di Ci , ti Ci , i N ; o, lo que es lo mismo,


X

ci Ci

(ti , ti ) (ui (ti , ti ) ui (di , ti )) 0

para todo di Ci , ti Ci , i N.
a. Encuentre el equilibrio correlacionado que maximiza la suma de las utilidades de los jugadores en los juegos del dilema del prisionero, batalla de
los sexos, lanzar la moneda, ultimatum y el gallina.
b. Encuentre el equilibrio correlacionado que maximiza el pago de la esposa
en el juego de la batalla de los sexos.
c. Encuentre el equilibrio correlacionado que maximiza el producto de las
utilidades de los jugadores en los juegos del dilema del prisionero, batalla
de los sexos, lanzar la moneda, ultimatum y el gallina.

72

Un Curso de Teora de Juegos Clasica

10. (Dickhaut y Kaplan [1993]) El software Mathematica r incluye importantes


aplicaciones para facilitar el calculo de algunas soluciones en teora de juegos.
A continuacion presentamos una rutina basica para el calculo de equilibrios de
Nash (puros y mixtos) en juegos finitos de dos jugadores.
Para empezar es necesario cargar el paquete nash, lo cual se logra digitando:
variannashnash
en el espacio correspondiente para las entradas. Seguido a esto,
introducir el juego. Para esto se le asigna un nombre cualquiera.
introducen por celdas de izquierda a derecha y de arriba hacia
fila se delimita utilizando corchetes { }. As, por ejemplo, para
juego de la batalla de los sexos, la rutina sera:

se procede a
Los pagos se
abajo. Cada
introducir el

batalla={{{2,1},{0,0}},{{0,0},{1,2}}}.
Una vez introducido el juego, Mathematica r cuenta con un algoritmo que
encuentra los equilibrios de Nash del juego. Para utilizarlo basta con digitar
Nash seguido del nombre asignado al juego dentro de parentesis angulares.
Siguiendo con el ejemplo anterior, el comando sera:
Nash[batalla]
En este caso, Mathematicar arroja un resultado de la forma
{{{0, 1}, {0, 1}}, {{2/3, 1/3}, {1/3, 2/3}}, {{1, 0}, {1, 0}}}
All, cada par de corchetes representa una de las distribuciones de probabilidad
que corresponde a cada equilibrio de Nash del juego. As, por ejemplo, el primer
par de n
umeros en la salida anterior ilustra el equilibrio de Nash donde ambos
jugadores eligen su segunda estrategia (con probabilidad 1), mientras que el
segundo par de n
umeros corresponde al equilibrio mixto del juego.
Utilice los comandos mencionados para el calculo de equilibrios de Nash de
todos los juegos estudiados hasta ahora.
VII.

Correspondencias de Mejor-Respuesta

Resulta aclarador, con frecuencia, establecer el conjunto de acciones disponibles


que le maximizan a cada jugador su utilidad esperada dada cada posible accion
conjunta de los demas jugadores. A esta coleccion de acciones se le conoce como
correspondencia de mejor-respuesta, y es claro que una estrategia conjunta en la
que las correspondencias de mejor-respuesta de todos los jugadores coinciden, es un
equilibrio de Nash del juego. Esto muestra claramente por que un equilibrio de Nash
es un equilibrio de expectativas satisfechas (fullfilled expectations equilibrium): en un
equilibrio de Nash mis oponentes haran lo que efectivamente yo espero que hagan.

73

Juegos No-Cooperativos con Informacion Simetrica

Definici
on 9 (Correspondencia de Mejor-Respuesta).
La correspondencia de mejor-respuesta del jugador i se define como el conjunto de
estrategias del jugador i que le maximiza su utilidad esperada, para cada perfil
de estrategias conjuntas de todos los jugadores excepto las de i. Es decir, para
ei (Ci ):
i (ei ) =

ei |ei argmax ui (di , ei )


di (Ci )

Ilustremos esto con algunos ejemplos.


Ejemplo 28.
Encontremos las correspondencias de mejor-respuesta de algunos de los juegos que
ya hemos estudiado.
a. Dilema del prisionero
Supongamos que el prisionero 1 juega su estrategia confesar con probabilidad p
y el prisionero 2 juega su estrategia confesar con probabilidad q. Las utilidades
esperadas de los jugadores 1 y 2 son, respectivamente:
UE1 = p [4q + 0(1 q)] + (1 p) [5q 1(1 q)]
UE2

= p 4q 1

= q [4p + 0(1 p)] + (1 q) [5p 1(1 p)]


= q 4p 1

Notemos que el jugador 1, independientemente del valor que 2 le asigne a q,


maximiza su utilidad esperada cuando otorga un valor de 1 a p. De forma
analoga, el jugador 2 maximiza su utilidad esperada asignandole un valor de
1 a q:
1 (q) = 1, 2 (p) = 1
As se obtiene como resultado el equilibrio de Nash mostrado antes, donde
cada sospechoso juega su estrategia confesar con probabilidad 1. En la figura
34 se muestran las correspondencias de mejor-respuesta de los dos jugadores
en el plano (p, q).
b. Batalla de los sexos
De forma similar al caso anterior, el juego de la batalla de los sexos genera las
siguientes funciones de utilidad esperada para cada uno de los jugadores:
UE1 = p [2q + 0(1 q)] + (1 p) [0q + 1(1 q)]
UE2

= p(3q 1) + (1 q)

= q [1p + 0(1 p)] + (1 q) [0p + 2(1 p)]


= q(3p 2) + 2 2p

74

Un Curso de Teora de Juegos Clasica


Figura 34: Dilema del prisionero
q

Equilibrio de Nash

1
Correspondencia de 2
Correspondencia de 1

1 p

Podemos ver que para valores de q superiores a 1/3, el jugador 1 maximiza su


utilidad esperada cuando p toma un valor de 1; para valores menores a 1/3,
el jugador 1 maximiza su utilidad esperada haciendo p igual a cero y, cuando
q vale 1/3, el jugador 1 es indiferente entre todos los valores de p. De igual
forma, para valores de p superiores a 2/3, el jugador 2 maximiza su utilidad
esperada cuando q toma un valor de 1. Para valores de p menores a 2/3, el
jugador 2 maximiza su utilidad esperada haciendo q igual a cero y, cuando p
vale 2/3, el jugador 2 es indiferente entre todos los valores de q. De esta forma,
las correspondencias de mejor-respuesta vienen dadas por:

si q > 13 ,

si p > 23 ,
1
1
2 (p) = [0, 1] si p = 23 ,
1 (q) = [0, 1] si q = 13 ,

0
si q < 13 .
0
si p < 23 .

Llevando este analisis al plano (p, q) obtenemos la figura 35. Notemos que
en esta figura aparecen los tres equilibrios de Nash (dos puros y uno mixto)
encontrados anteriormente, pero ahora surgen como las intersecciones de las
correspondencias de mejor-respuesta de los dos jugadores.

c. El gallina
En este juego, las funciones de utilidad esperada para cada uno de los jugadores
son de la siguiente forma:

UE1 = p [5q + 2(1 q)] + (1 p)(1 q)


UE2

= p(1 6q) + (1 q)

= q [5p + 2(1 p)] + (1 q)(1 p)


= q(1 6p) + (1 p)

75

Juegos No-Cooperativos con Informacion Simetrica


Figura 35: Batalla de los Sexos
q

EN puro (F, F )

Correspondencia de 2
Correspondencia de 1
1/3

EN Mixto

1 p

2/3

EN puro (T, T )

Entonces,

0
1 (q) = [0, 1]

si q > 16 ,
si q = 16 ,
si q < 16 .

0
2 (p) = [0, 1]

si p > 16 ,
si p = 16 ,
si p < 16 .

Nuevamente, llevando estas correspondencias de mejor-respuesta al plano (p, q),


obtenemos la figura 36. Notemos la aparicion de los tres equilibrios de Nash
encontrados previamente.
Figura 36: Juego de El Gallina
q
EN puro (Q, C)
1


Correspondencia de 1

Correspondencia de 2

EN mixto
1/6

EN puro (C, Q)


0


1/6

1 p

d. Juego del ultim


atum (Un Juego con Infinitos Equilibrios)
Consideremos nuevamente el juego del ultimatum, representado por la bimatriz
de la figura 37.

76

Un Curso de Teora de Juegos Clasica


Figura 37: Juego del ultimatum
q

(1 q)

2,2

2,2

(1 p)

3,1

0,0

All, las funciones de utilidad esperada de los jugadores 1 y 2, respectivamente,


son:
UE1 = p(2 3q) + 3q
UE2 = q(1 p) + 2p

luego las correspondencias de mejor-respuesta son:

si q < 2/3,
1
1
1 (q) = [0, 1] si q = 2/3,
2 (p) =

[0, 1]

0
si q > 2/3.

si p < 1,
si p = 1.

Graficando estas correspondencias de mejor-respuesta obtenemos la figura 38.


Figura 38: Juego del Ultimatum
q

Equilibrio de Nash puro

1
Correspondencia de 2
Correspondencia de 1

Equilibrios de Nash mixtos

1 p

Equilibrio de Nash puro

Notemos que en este juego aparecen infinitos equilibrios de Nash. Ademas,


recordemos que al final del ejemplo 12 mencionamos que, en general, no es
correcto eliminar estrategias debilmente dominadas ya que podramos estar

77

Juegos No-Cooperativos con Informacion Simetrica

eliminando algunas posibles soluciones del juego. En este ejemplo ocurre tal
situacion ya que si lo solucionamos a traves del concepto de estrategias debilmente dominadas, la u
nica solucion sera la combinacion de estrategias (F, A),
y todos los demas equilibrios de Nash, simplemente, no apareceran.
Teorema 7 (Teorema de Nash [1950b]).
Todo juego finito en forma estrategica tiene al menos un equilibrio de Nash (en
estrategias puras o mixtas).
Demostraci
on.
Sea = (N, (Ci )iN , (ui )iN ) un juego finito en forma estrategica, y sea =
ni=1 i . Entonces17 probemos los siguientes puntos:
1. es convexo: Sean = (i ), 0 = (i0 ) , = (i0 ); es claro que para
[0, 1], + (1 ) 0 = (i + (1 )i0 ). Aqu podemos asumir que
6=c
i = pcj j=1i , donde pcj es la probabilidad asociada a la estrategia pura c j
 6=ci
P6=ci
0 = p0
con
p
=
1,
y
p

0;
similarmente,
para

. Entonces
c
c
cj
i
i
j=1 j
j=1

tendremos que

ci
a. i + (1 )i0 = (pcj + (1 )p0 cj )6=
j=1 ,

b. pcj + (1 )p0cj 0 y
P6=ci
P6=ci 0
P6=ci
0
c.
j=1 (pcj +(1)pcj ) =
j=1 pcj +(1)
j=1 pcj = 1+(1)1 = 1

y esto prueba la convexidad del conjunto .

2. es compacto ya que i es compacto (smplex unitario) para todo i.


3. Ahora: sea i : i , definida por i () = {i0 i /ui (i0 , i )
ui (i , i ) para todo i i } y sea : definida por () =
(1 (), 2 (), . . . , n ()). Si probamos que i es semicontinua superiormente
y que para todo , i () es no-vaco y convexo, entonces tiene un punto
fijo; es decir, existe tal que ( ); esto es, si i i ( ), entonces

ui (i , i
) ui (i , i
)

para todo i i

es decir, es un equilibrio de Nash.


17

La demostraci
on de este teorema requiere la aplicaci
on del Teorema de Punto Fijo de Kakutani
que establece lo siguiente:Si S Rn es un conjunto no-vaco, compacto y convexo, y si : S S
es una correspondencia semicontinua superiormente tal que para todo x S el conjunto (x) es
no-vaco y convexo, entonces tiene un punto fijo en S, es decir, existe x S tal que x (x)00 .
Recordemos que a) S es compacto si es cerrado y acotado; b) S es convexo si para todo s1 , s2 S
y [0, 1] se tiene que s1 + (1 s2S
) S; c) : S S es una correspondencia semicontinua
superiormente si, y s
olo si, Graf () = xS {(x, y)}|y (x)} es un conjunto cerrado en S S.

78

Un Curso de Teora de Juegos Clasica


a. Probar que i () es no-vaco; es decir, que el problema
max ui (i , i )

i i

para i fijo

tiene solucion, es inmediato por el teorema de Weierstrass 18 .


b. Probemos que i () es convexo. Si tenemos i0 , i00 i (), entonces
0
ui (i0 , i
) ui (i , i )

0
ui (i00 , i
)

ui (i , i )

para todo i i
para todo i i

As, ui (i0 + (1 )i00 , i ) ui (i , i ), para todo i i .


c. Probemos que el grafico de es cerrado,
Graf () = {(, 0 )| 0 ()}
Sea (n , n0 ) Graf () y (n , n0 ) (, 0 ), donde , 0 . Debemos probar
que (, 0 ) Graf (), es decir que
un
0 () para alg
0 0 entonces, de
Pero, como n,i
i

ui (n0 , i ) ui (i , i )

ui (n0 , i )

ui (i , i )

i i
i i

tenemos i0 i (), y esto completa la demostracion.


Observemos que este teorema garantiza, para juegos con un n
umero finito de jugadores, la existencia de al menos una combinacion de estrategias tal que ninguno
de ellos tiene incentivos unilaterales para desviarse. El lector podra preguntarse
aqu por que si el teorema de Nash que acabamos de presentar es aplicable para
cualquier conjunto finito de jugadores, los ejemplos y aplicaciones presentados en
este captulo u
nicamente han involucrado a dos jugadores. Como dijimos, von Neumann y Morgenstern reconocan que para tratar con juegos de mas de dos jugadores
debera recurrirse a una metodologa diferente a la utilizada en juegos de dos jugadores, ya que en aquellos casos algunos jugadores podran formar alianzas que
los beneficiaran frente a terceros jugadores. Sin embargo, Nash no parecio creerlo
as. De hecho, algunos piensan que la consideracion de la formacion de alianzas y la
cooperacion por parte de von Neumann, frente a la omision de estas por parte de
Nash, y el que aquel no considerara atractiva la iniciativa de este u
ltimo cuando se
propona demostrar la existencia de equilibrios en juegos finitos, tena razones en la
sicologa profunda de los dos individuos. Nassar [2001], por ejemplo, dice:
18

El teorema de Weierstrass dice: Si X Rn es un conjunto no-vaco, compacto y f : X R


una funci
on continua, entonces f () alcanza un m
aximo y un mnimo en X. Ver Monsalve [2005].

79

Juegos No-Cooperativos con Informacion Simetrica


No resulta en absoluto sorprendente que ambos genios chocaran entre s,
ya que haban llegado a la teora de juegos a partir de visiones opuestas
sobre la forma en que interact
ua la gente. Von Neumann, que se haba
hecho adulto discutiendo en cafes europeos y colaboraba en la construccion de la bomba atomica y los ordenadores , consideraba a las personas
como seres sociales que estan en permanente comunicacion, y por ello le
resultaba perfectamente natural poner el acento en la importancia central que tenan en la sociedad las coaliciones y la accion conjunta. Nash
tenda a pensar en las personas como seres que estaban aislados de sus
semejantes y que actuaban por su cuenta, razon por la cual le pareca
mucho mas natural una perspectiva basada en los modos en que la gente
reacciona a los incentivos individuales.

Ejercicios 6.
1. Grafique las correspondencias de mejor-respuesta y encuentre los equilibrios
de Nash (puros y mixtos) de los siguientes juegos:

VIII.

x2

y2

x1

9,4

6,4

y1

8,5

4,3

x2

y2

x1

10,1

0,0

y1

0,0

1,1

x2

y2

x1

3,1

1,3

y1

5,5

4,2

x2

y2

x1

-6,-6

-6,-6

y1

-6,-6

-1,-1

Un Refinamiento del Equilibrio de Nash:


Perfecci
on de Mano Temblorosa (Selten [1975])

Desde 1975 comenzo a verse claramente que la definicion amplia del concepto de
equilibrio de Nash en ocasiones no provea de una adecuada descripcion del problema
bajo estudio. Para remediar esto, se empezaron a desarrollar refinamientos de tal
concepto, algunos de ellos exigiendo mas racionalidad por parte de los jugadores,
pero tambien otros, como el Premio Nobel en Economa de 1994, Reinhard Selten,
quien en 1975 definiera el concepto de equilibrio de Nash de mano temblorosa,
utilizando cierta irracionalidad como mecanismo para llegar a una fuerte nocion
de racionalidad; es decir, mostrando que la racionalidad no necesariamente podra
abastecerse de s misma.

80

Un Curso de Teora de Juegos Clasica

El refinamiento de mano temblorosa establece que un equilibrio de Nash razonable


debe ser inmune a peque
nas probabilidades de error en la ejecucion de las estrategias. Con esta nocion de equilibrio de Selten se llega a una idea mas evolutiva
que racional que consiste basicamente en que los eventos con baja probabilidad de
ocurrencia no deberan preocuparnos. Veamos esto.
Sea = (N, (Ci )iN , (ui )iN ) un juego finito en forma estrategica, y i,c la probabilidad de que la estrategia c Ci sea jugada, por error, por el jugador i, donde
P
cCi i,c < 1.
Definamos, con estas probabilidades, i,c el subconjunto de (Ci ) consistente en
aquellas estrategias mixtas que el jugador i puede implementar, dados los errores de
probabilidad i,c , as:
i () = { i (ci )|i,c i,c }
donde = (i,c )iN,cCi . Con lo anterior, se construye el juego perturbado (asociado
a ), notado (), as:
() = (N, ni=1 i (), (ui )ni=1 )
Por el teorema de Nash, estos juegos tienen al menos un equilibrio de Nash.
Definici
on 10 (Equilibrio de Nash Perfecto de Mano Temblorosa).
Un equilibrio de Nash ( ) de un juego en forma estrategica es perfecto de
mano temblorosa (trembling hand) si para alguna sucesion de juegos perturbados
{(t )}
on de estrategias mixtas { t } cada una
t=1 , podemos encontrar una sucesi
de las cuales es un equilibrio de Nash de los juegos ( t ), tales que t cuando
t .
Definimos como (Ci , i,c )cCi = {xi (Ci )|xi,c i,c } el conjunto de estrategias mixtas que el jugador i puede implementar dados los errores = ( i,c )ciCi .
Consideremos los juegos perturbados.
Lo anterior equivale a decir que es perfecto si, y solo si, en cada vecindad de
existe alguna estrategia interior y para la cual es una mejor-respuesta. Pero,
que el concepto de equilibrio de Nash de mano temblorosa tiene sentido comienza a
validarse porque, efectivamente, este tipo de equilibrios con ruido existen.
Teorema 8 (Existencia de Equilibrios de Nash Perfectos).
Todo juego finito en forma estrategica tiene al menos un equilibrio de Nash perfecto.
Demostraci
on.
Ver Selten [1975].
Ejemplo 29 (Calculo de Equilibrios de Nash Perfectos).
Calculemos los equilibrios de Nash perfectos de los juegos batalla de los sexos, dilema
del prisionero y ultimatum.

Juegos No-Cooperativos con Informacion Simetrica

81

a. Batalla de los sexos


Analicemos cada uno de los equilibrios de Nash de este juego.
i. Si p = 1, 2 (p) = 1 y si p = 1 , (para  > 0 peque
no) 2 (p) = 1.
De forma similar, si q = 1, entonces su mejor-respuesta es 1 (q) = 1 y
si q = 1 , 1 (q) = 1; luego el equilibrio en el que ambos van a f
utbol,
([(1, 0), (1, 0)]), es perfecto.
ii. Si p = 0, 2 (p) = 0 y si p = , (para  > 0 peque
no) 2 (p) = 0.
De igual forma, para el jugador 1 tenemos que si q = 0, 1 (q) = 0, y si
q = , 1 (q) = 0; por lo tanto, el equilibrio en el que ambos van a teatro,
([(0, 1), (0, 1)]), tambien es perfecto.
iii. Ahora consideremos el equilibrio mixto: si p = 2/3, 2 (p) = para todo
[0, 1] y si p = 2/3 +  entonces 2 (p) = 1. Para el jugador 1 tenemos
que si q = 1/3 entonces 1 (q) = y si q = 1/3 +  entonces 2 (p) = 1;
como 1 [0, 1] entonces [(2/3, 1/3), (1/3, 2/3)] tambien es perfecto.
b. Dilema del prisionero
Sabemos que si q = 1, 1 (q) = 1 y si q = 1  (para  > 0 peque
no),
1 (q) = 1; de forma similar, si p = 1, 2 (p) = 1 y si p = 1 , 2 (p) = 1. Por
lo tanto p = 1, q = 1 es un equilibrio perfecto para el dilema del prisionero.
c. Ultim
atum
Analicemos los equilibrios de Nash de este juego:
a. Tomemos inicialmente el equilibrio en estrategias puras (F, A). Verifiquemos para el jugador 1: si q = 1, 1 (q) = 0, y si q = 1  (para  > 0
peque
no), entonces 1 (q) = 0; verifiquemos ahora para el jugador 2:
si p = 1, 2 (p) = para todo [0, 1], mientras que si p = 1 , entonces 2 (p) = 1. Como en este equilibrio la mejor-respuesta en el juego
perturbado para ambos agentes hace parte de la mejor-respuesta en el
juego original, el equilibrio de Nash en estrategias puras donde el jugador
1 escoge F y el jugador 2 escoge A es perfecto.
b. Analicemos ahora el equilibrio mixto en el que el jugador 1 escoge p = 1 y
el jugador 2 escoge q = 2/3. Aqu, 1 (q) = para todo [0, 1], mientras
que si q = 2/3  entonces 1 (q) = 1. Para el jugador 2 tenemos que si
p = 1, 2 (p) = para todo [0, 1] mientras que si p = 1 , entonces
2 (p) = 2/3, por lo tanto este tambien es un equilibrio perfecto.
c. Por u
ltimo, tomemos cualquiera de los equilibrios en los que el jugador
1 escoge E (p = 1) y el jugador 2 escoge q < 2/3. Para el jugador 1, si
q < 2/3, 1 (q) = 1; y para el jugador 2, si p = 1, entonces 2 (p) = 0 para
todo [0, 2/3), mientras que si p = 1 , entonces 2 (p) = 1. Como
en este equilibrio la mejor-respuesta del juego perturbado no hace parte
de la mejor-respuesta del juego original, este conjunto de equilibrios no
es perfecto.

82

Un Curso de Teora de Juegos Clasica

Ejercicios 7.
1. Encuentre los equilibrios perfectos (de mano temblorosa) de los siguientes juegos:
x2

y2

x1

10,10

-100,2

y1

2,-100

1,1

x2

y2

x1

-6,-6

-6,-6

y1

-6,-6

-1,-1

2. Encuentre los equilibrios de Nash perfectos (de mano temblorosa) de los juegos
halcon y paloma, gallina y dilema de seguridad.
IX.

Infinitas Estrategias y Equilibrios de Nash

Hasta ahora hemos analizado juegos con un n


umero de estrategias que, si bien puede
ser suficientemente grande, es finito. Sin embargo, en muchas situaciones de interes
en economa y otras ciencias sociales, resulta u
til considerar que cada jugador tiene
a su disposicion conjuntos con infinitas estrategias. Ejemplos de esto son la cantidad
de recursos que cada pas decide invertir en educacion anualmente, la ubicacion de
los establecimientos comerciales en una ciudad, la cantidad de un producto agrcola
que un campesino lleva al mercado, o el precio que establecen dos o mas firmas que
compiten en una industria. Claramente en cada uno de estos casos los conjuntos
de estrategias son infinitos, por lo cual algunos de los resultados presentados hasta
ahora deben ser revisados.
Una vez establecido el teorema de Nash sobre la existencia del equilibrio en juegos
finitos, algunos teoricos en juegos percibieron esta debilidad, y se preguntaron
si al permitir que los conjuntos de estrategias fueran infinitos tal equilibrio segua
existiendo. A continuacion ilustramos dos teoremas que respondieron a estas inquietudes.
Teorema 9 (Debreu [1952], Glicksberg [1952], Fan [1952]).
Considere un juego en forma estrategica = (N, (C i )iN , (ui )iN ) cuyos espacios
de estrategias Ci son subconjuntos no-vacos, compactos 19 y convexos de Rn . Si
todas las funciones de pago ui son continuas en c y cuasic
oncavas 20 en ci , existe un
equilibrio de Nash en estrategias puras
Demostraci
on.
Ver Glicksberg [1952]
19
20

Un conjunto en Rn es compacto si, y s


olo si, es cerrado y acotado.
Ver Monsalve [2005] para una definici
on precisa de cuasiconcavidad.

83

Juegos No-Cooperativos con Informacion Simetrica

Teorema 10 (Glicksberg [1952]).


Considere un juego en forma estrategica = (N, (C i )iN , (ui )iN ) cuyos espacios
de estrategias Ci son subconjuntos no-vacos y compactos de R n . Si las funciones
de pago ui son continuas en C = ni=1 , entonces existe un equilibrio de Nash en
estrategias mixtas.
Demostraci
on.
Ver Glicksberg [1952]
Ejemplo 30 (Juego con Infinitas Estrategias sin Equilibrios de Nash Puros).
Consideremos el siguiente juego con dos jugadores 1 y 2, y conjuntos de estrategias
C1 = C2 = [0, 1], con c1 c2 donde las funciones de pago vienen dadas por:
u1 (c1 , c2 ) = |c1 c2 |
(
(c1 c2 1/4)1/2 si c1 1/4,
u2 (c1 , c2 ) =
(c1 c2 + 1/4)1/2 si c1 < 1/4
y encontremos primero las correspondencias de mejor-respuesta para este juego. En
el caso del jugador 1, observemos que su maximo pago posible (cero) lo alcanza
cuando c1 = c2 ya que, en cualquier otro caso, incurrira en una perdida igual al
valor absoluto de la diferencia entre c 1 y c2 . Para el jugador 2 podemos buscar la
condicion de primer orden u2 /c2 = 0 y despejar c2 , con lo que obtenemos:

c2 =

c1 1/4 si c1 1/4,
c1 + 1/4 si c1 < 1/4

Figura 39: Juego sin equilibrios de Nash Puros


C2
1

Correspondencia de
mejor-respuesta de 1

C1

Correspondencia de
mejor-respuesta de 2

Como es claro en la figura 39, al ser discontinua la correspondencia de mejorrespuesta del jugador 2, esta no se intercepta en ning
un punto con la del jugador 1, y

84

Un Curso de Teora de Juegos Clasica

por tanto en este juego no hay equilibrio de Nash en estrategias puras. Que hip
otesis
del teorema anterior est
a fallando en este ejemplo? Tendr
a equilibrios de Nash en
estrategias mixtas?
M

Ejercicios 8.
1. Considere un juego compuesto por dos jugadores cuyos conjuntos de estrategias
puras son C1 = [0, 50] = C2 . Las funciones de pago son:
u1 (c1 , c2 ) = 100c1 10c21 + 10c1 c2
u2 (c1 , c2 ) = 200c2 15c22 + 10c1 c2

a. Calcule los equilibrios de Nash.


b. Compare los pagos que obtienen los jugadores en el equilibrio de Nash con
respecto a los que obtendran si eligieran c 1 y c2 para maximizar u1 + u2 .
Comente.
2. Dos jugadores estan negociando como repartirse una unidad monetaria. Ambos
jugadores indican simultaneamente la porcion que querran conseguir, s 1 y s2
respectivamente, donde 0 s1 , s2 1. Si s1 + s2 1, los jugadores ven
cumplidas sus peticiones; si s1 + s2 > 1, ambos jugadores reciben un pago de
cero.
a. Establezca las correspondencias de mejor-respuesta de los dos jugadores.
b. Cuales son los equilibrios de Nash en estrategias puras de este juego?
3. Suponga que dos jugadores escogen ubicaciones a 1 y a2 en el intervalo [0, 1].
Cada uno quiere estar tan cercano al otro como sea posible. El pago de cada
jugador es |a1 a2 |. Calcule los equilibrios de Nash en estrategias puras.
4. Dos candidatos a un cargo p
ublico estan decidiendo simultaneamente sobre
la plataforma poltica de sus propuestas. Para tomar su decision de voto, los
electores u
nicamente tienen en cuenta tal plataforma poltica. A los candidatos
u
nicamente les interesa ganar las elecciones; no les afecta el tipo de plataforma que eligen. Normalicemos el espectro ideologico al intervalo [0,1] donde
0 representa, digamos, extrema izquierda, mientras 1 representa extrema
derecha. Los electores se encuentran uniformemente distribuidos en el intervalo [0,1]. Cada elector vota por el candidato que se encuentre mas cerca a su
posicion ideologica; en caso de que dos candidatos se encuentren a igual distancia, el elector lanza una moneda para tomar su decision. Gana el candidato
con un mayor porcentaje de votos y, en caso de empate, nuevamente se lanza
una moneda.

85

Juegos No-Cooperativos con Informacion Simetrica

a. Establezca las correspondencias de mejor-respuesta de cada candidato y


encuentre el equilibrio de Nash del juego.
b. Explique este resultado.
5. (Sion y Wolfe [1957].). Dos personas juegan un juego de suma cero (lo que
gana un jugador lo pierde el otro). Los conjuntos de estrategias son S i = [0, 1]
para i = 1, 2; las funciones de pago son

1 si < sj < si + 2 ,
i = 1, 2
ui (si , sj ) =
0 si = sj , si + 12 ,

1 en otro caso.
Muestre que este juego no tiene equilibrios de Nash en estrategias puras.

6. Asuma dos jugadores 1 y 2 que eligen respectivamente x 1 y x2 , y cuyas funciones de pago estan dadas por:

u1 (x1 , x2 ) =

u2 (x1 , x2 ) =

0 

x1

x2

0 

x2

x2 x 1 + 1 + a b
2

x1 x 2 + 1 + b a
2

si x1 < x2 (1 a b),
si x1 > x2 + (1 a b),
si x1 [x2 (1 a b),
x2 + (1 a b)]
si x2 < x1 (1 a b),
si x2 > x1 + (1 a b),
si x2 [x1 (1 a b),
x1 + (1 a b)]

Muestre que para que exista un equilibrio en este juego son necesarias las
siguientes condiciones:


ab 2 4
a. 1 +
(a + 2b);
3
3
2

ba
4
b. 1 +
(b + 2a)
3
3
X.

Juegos Din
amicos con Informaci
on Sim
etrica

Hasta ahora hemos estudiado la forma estrategica de un juego, que consiste, fundamentalmente, en tres elementos: los jugadores, el conjunto de estrategias para
cada jugador, y los pagos que recibe cada jugador por cada posible combinacion de

86

Un Curso de Teora de Juegos Clasica

estrategias. Ahora pasamos a examinar lo que en adelante llamaremos la forma ex


tensiva de un juego. Esta
busca modelar, no solo quienes son los jugadores, cuales sus
estrategias y los pagos resultantes de cada combinacion de estrategias, sino tambien
los momentos en que esas estrategias se juegan, y la informacion disponible al momento de ser elegidas. Por lo tanto, un juego en forma extensiva debera especificar,
al menos, los siguientes elementos:
a. Quienes son los jugadores.
b. Cuando act
ua cada jugador.
c. Que acciones estan disponibles para cada jugador cuando le corresponde actuar.
d. Que conoce cada jugador cuando le corresponde actuar acerca de las acciones
que ya han realizado otros jugadores.
e. Los pagos que cada jugador recibe por cada posible combinacion de acciones.
La forma mas com
un de ilustrar un juego en forma extensiva es mediante un diagrama de a
rbol. Cada punto posible de distribucion en el arbol lo llamamos nodo. Por
convencion, y para saber donde comienza el juego, al nodo inicial se le representa
con un crculo vaco, y todos los nodos siguientes se representan con crculos llenos.
Las ramas que parten de un nodo son las diferentes acciones disponibles al jugador
en ese momento. Cada rama, a su vez, conduce a otro nodo. Si no existen ramas
que partan de cierto nodo, a este se le llamara nodo terminal y all se asignaran los
pagos de los jugadores.
Para la clase de problemas que son de interes a este nivel, los juegos en forma extensiva son instrumentos convenientes para examinar interacciones que se realizan a
traves del tiempo, y los juegos en forma estrategica son m
as adecuados para problemas de toma de decisiones simult
aneas. Sin embargo, merece se
nalarse que es posible
tratar el caso en el que los jugadores mueven simultaneamente de la misma forma en
que tratamos los problemas en los que un jugador mueve despues de otro, pero sin
saber que movimiento realizo este u
ltimo. De hecho, esto muestra que la dinamica
aqu considerada no es del todo sustancial.
La figura 40 es una representacion en forma extensiva de un juego en el que el
jugador 1 mueve primero, eligiendo entre dos acciones L o R. El jugador 2 mueve
despues, decidiendo entre L0 o R0 . El jugador 2 aparece en dos nodos: el nodo que
resulta cuando el jugador 1 juega L y el nodo que resulta cuando el jugador 2 juega
R.
Sin embargo, aqu, el jugador 2 no conoce la decisi
on tomada por el jugador 1 ; es
decir, no conoce en cual nodo debe tomar su decision. Esta dificultad que encuentra
el jugador 2 de no poder distinguir entre estos dos nodos se indica conectandolos
a traves de una lnea punteada. Al observar que nodos estan conectados de esta

87

Juegos No-Cooperativos con Informacion Simetrica

manera, podemos determinar que conoce cada jugador acerca de las acciones de los
demas jugadores al momento de tomar su decision. Cuando un jugador no puede
distinguir entre diferentes nodos al momento de tomar su decision (como es el caso
del jugador 2 en la figura 40), reunimos todos esos nodos en un solo conjunto llamado
conjunto de informaci
on.
Figura 40: Juego con Informacion Imperfecta
1
e
@
@

L0
10
0

u
@
@

2
0
@ R
@
@

L0
7
3

8
2

R
@

@u
@
@

0
@ R
@
@

6
1

Si en el arbol todos los conjuntos de informacion tienen un solo nodo, diremos que
el juego tiene informaci
on perfecta. En otro caso (como sucede con nuestro ejemplo
de la figura 40) diremos que tiene informaci
on imperfecta.
En la forma extensiva, una estrategia de un jugador especifica las acciones que toma
en cada conjunto de informacion del juego. En el ejemplo anterior, las estrategias del
jugador 1 son L y R, y las estrategias del jugador 2 (dentro del conjunto de informacion conformado por los dos nodos de la parte inferior de la figura 40) son L 0 y R0 .
Ahora consideremos el mismo ejemplo anterior, solo que esta vez asumiremos que el
jugador 2 s sabe cual fue la decision tomada por el jugador 1 y, por tanto, conoce
el nodo en el que debe tomar su decision. El arbol de este juego se representa en la

figura 41. Este


es un juego con informacion perfecta pues ambos jugadores toman su
decision sobre un solo nodo; es decir, los conjuntos de informacion estan conformados
por un solo elemento.
Para resolver los juegos de las figuras 40 y 41 debemos especificar que saben los
agentes al momento de tomar sus decisiones. Inicialmente, asumamos que en ambos
juegos tenemos informacion simetrica 21 . Como podemos resolver el juego de la
figura 40? Basta observar que, dado el problema de informacion imperfecta que
21

La simetra en la informaci
on se referir
a al conocimiento com
un del juego.

88

Un Curso de Teora de Juegos Clasica


Figura 41: Juego con Informacion Perfecta
1
e
@
@

L0
10
0

2 u
@
@

0
@ R
@
@

R
@

L0
7
3

@u 2
@
@
0
@ R
@
@

8
2

6
1

afecta al jugador 2, este es equivalente al juego en forma estrategica (es decir, de


decisiones simultaneas) de la figura 42.
Figura 42: Representacion Estrategica de un Juego en Forma Extensiva
Jugador 2
L0

R0

10,0

7,3

8,2

6,1

Jugador 1

Como el u
nico equilibrio de Nash de este juego es (L, R 0 ) con pagos (7,3), entonces
el u
nico equilibrio de Nash de la figura 40 es tambien (L, R 0 ).
Algo diferente sucede cuando intentamos resolver el juego de la figura 41. Siguiendo
con el metodo de encontrarle un juego en forma estrategica que le sea equivalente
y resolverlo, debemos tener cuidado al elegir las estrategias posibles del jugador 2,
puesto que este ahora s sabe cual fue la accion que tomo el jugador 1. Una forma
de reducir este problema de dos tiempos a uno de un solo tiempo (movimientos
simultaneos) es asignarle al jugador 2 planes de contingencia. As, las estrategias
del jugador 2 no son L0 y R0 sino (L0 , L0 ), (L0 , R0 ), (R0 , L0 ) y (R0 , R0 ), donde el plan
de contingencia generico (A, B) significa jugar A si el jugador 1 juega L, y jugar B
si el jugador 1 juega R. Por tanto, un plan de contingencia como (L 0 , L0 ) significa
jugar L0 sin importar que haya jugado el jugador 1. La forma estrategica del juego
se representa en la figura 43.

89

Juegos No-Cooperativos con Informacion Simetrica

Figura 43: Representacion Estrategica de un Juego en Forma Extensiva con Informacion Perfecta
Jugador 2
Jugador 1

(L0 , L0 )

(L0 , R0 )

(R0 , L0 )

(R0 , R0 )

10,0

10,0

7,3

7,3

8,2

6,1

8,2

6,1

Aqu aparecen dos equilibrios de Nash en estrategias puras: (L,(R 0 , R0 )) y (R, (R0 , L0 )).
El primero de estos podra interpretarse (abusando de la notacion) como el mismo
equilibrio (L, R0 ) encontrado en el juego con informacion imperfecta. Cabe entonces
preguntarse: cual es el otro equilibrio? Esto es facil dilucidarlo si entendemos que
este es un juego con informacion, ademas de perfecta, completa. Observemos, en
primera instancia, que cada uno de los pagos en los equilibrios de Nash (7,3) y (8,2)
favorece a uno de los jugadores y no son comparables en el sentido de Pareto. Resulta, sin embargo, que en este juego s se podra decidir cual de los dos equilibrios de
Nash es mas creble, y esta decision la tomara el jugador que tiene m
as poder en
el juego: el jugador 1. Es facil observar esto en la figura 41. Si el jugador 1 juega L, el
jugador 2 (como agente racional) jugara R 0 , y esto le da un pago de 3; si el jugador
1 juega R, el jugador 2 jugara L0 , que le da un pago de 2. Pero como el jugador 1
sabe esto (es decir, conoce las acciones que el jugador 2 tomara en respuesta a las
suyas, y ademas conoce los pagos correspondientes a cada una de estas acciones),
conducira al jugador 2 a tomar la accion que mas le conviene a el (jugador 1); es
decir, para el jugador 1 es mejor elegir R que L, ya que si escoge R, el jugador 2
elige L0 , y el jugador 1 recibe un pago de 8; mientras que si escoge L, el jugador 2
escogera R0 , y el jugador 1 recibe un pago de 7. Por tanto, el equilibrio que creblemente se jugara, dada la estructura del juego, es aquel en el que el jugador 1 (el
que tiene el poder del juego) obtiene un mayor pago: (R, (R 0 , L0 )). Una conclusion
adecuada es que en este tipo de juegos con informaci
on perfecta y completa, el jugador que mueve primero (el lder) puede conducir al jugador que mueve despues (el
seguidor) a obrar en su conveniencia (del lder).
Ahora es posible resumir el proceso que acabamos de emplear para distinguir cual
de los dos equilibrios de Nash en estrategias puras del juego de la figura 42 era m
as
creble.
a. Inicialmente resolvimos el problema del jugador 2 en el nodo 2A; es decir,
cuando el jugador 1 jugo L. Se resolvio jugando R 0 .
b. Despues resolvimos el problema del jugador 2 en el nodo 2B; es decir, cuando
el jugador 1 jugo R. Se resolvio jugando L 0 .

90

Un Curso de Teora de Juegos Clasica


c. Finalmente resolvimos el problema del jugador 1 en el nodo inicial. Conociendo
lo anterior, el jugador 1 comparo cual estrategia le ofreca mejores pagos. El
problema se resolvio jugando R.

Este proceso se conoce como soluci


on del juego por inducci
on hacia atr
as que, en
juegos con informacion completa y perfecta, ofrece, en general, el equilibrio de Nash
mas creble del juego. Pero en el fondo hemos analizado el juego de una manera
mas articulada: observemos que hemos estudiado las elecciones optimas en cada uno
de los nodos, lo que equivale a decir que hemos encontrado, con este proceso, una
serie de estrategias que son un equilibrio de Nash en cada uno de los peque
nos
juegos que aparecen despues de cada nodo. Para ver que s es as, observemos que
el equilibrio de Nash encontrado por induccion hacia atras fue (R, (R 0 , L0 )) y este
contiene las mejores estrategias de los jugadores cuando les corresponde actuar.
En efecto:
Figura 44: Subjuegos del Juego de la figura 41
2A
L0
10
0

u
@
@

2B
0
@ R
@
@

L0
7
3

8
2

u
@
@

0
@ R
@
@

6
1

a. En el peque
no juego que comienza en el nodo 2A (dado que el jugador 1 ha
elegido L ), la mejor estrategia es jugar R 0 .
b. En el peque
no juego que comienza en el nodo 2B (dado que el jugador 1 ha
elegido R), la mejor estrategia es jugar L 0 .
c. En el juego que comienza en el nodo inicial, es decir, en el juego total de
la figura 41, la mejor estrategia del jugador 1, dada la estrategia optima del
jugador 2, es jugar R22 .
A estos peque
nos juegos, incluido el juego total, los llamamos los subjuegos del juego
original, y a una coleccion de estrategias para los jugadores que conformen un equilibrio de Nash en cada uno de los subjuegos la llamaremos un equilibrio de Nash
perfecto en subjuegos (ENPS). En nuestro ejemplo de la figura 41, el u
nico ENPS
22

Una estrategia es un plan de acci


on completo que le especifica al jugador una acci
on para cada
contingencia en la que le corresponda actuar.

91

Juegos No-Cooperativos con Informacion Simetrica

es (R, (R0 , L0 )), el cual fue calculado mediante induccion hacia atras. Pero esto no
es una coincidencia; de hecho, todo ENPS de un juego finito en forma extensiva con
informaci
on perfecta y completa puede calcularse mediante el metodo de inducci
on
hacia atr
as.
Sin embargo, es conveniente anotar que, en general, el concepto de ENPS puede
aplicarse a cualquier juego (finito o no) en forma extensiva, y que no sucede lo mismo
con el proceso de induccion hacia atras. Estas dos nociones coinciden en juegos finitos
con informacion perfecta y completa. Por ejemplo, en el juego ya presentado de la
figura 40, el jugador 2 enfrenta problemas de informacion. En este juego, el proceso
de induccion hacia atras ni siquiera es posible iniciarlo debido a estas dificultades de
informacion. En su lugar, como el u
nico subjuego de este juego es el juego mismo,
entonces el u
nico ENPS es el mismo equilibrio del juego total: (L, R 0 ).
Ejemplo 31 (La Batalla de los Sexos en Forma Secuencial).
Consideremos una modificacion del juego de la batalla de los sexos, permitiendo
que, en el momento en que la esposa deba tomar su decision, ya conozca la decision
tomada por el esposo. La representacion en forma extensiva de este juego aparece
en la figura 45.
Figura 45: Batalla de los Sexos Secuencial
Esposo
e
@
@

Esposa u
F
2
1

@
@

@ T
@
@

F
0
0

0
0

T
@

@u Esposa
@
@
@ T
@
@

1
2

Resolviendo por induccion hacia atras, observemos que si la esposa sabe que su
esposo jugo F en la primera etapa, ella elige F ya que obtiene un pago de 1, que
es mayor que 0. De igual forma, si sabe que el esposo jugo T en la primera etapa,
lo mejor que puede hacer es tambien jugar T , obteniendo un pago de 2. Entonces,
como el esposo sabe esto, en la primera etapa decide jugar F para obtener un pago
de 2, mayor que 1, que sera lo que obtendra por jugar T . La solucion por induccion
hacia atras es, entonces, (F, F ).
La representacion de este juego en forma estrategica aparece en la figura 46.

92

Un Curso de Teora de Juegos Clasica


Figura 46: Batalla de los Sexos Secuencial: Representacion Estrategica
Esposa
(F, F )

(F, T )

(T, F )

(T, T )

2,1

2,1

0,0

0,0

0,0

1,2

0,0

1,2

Esposo

Observemos que en esta bimatriz aparecen tres equilibrios de Nash:


(F, (F, F )), (F, (F, T )), (T, (T, T ))
Los dos primeros equilibrios corresponden a la situacion en que ambos jugadores eligen F , es decir, coinciden con la solucion por induccion hacia atras. Que representa,
entonces, el tercer equilibrio de Nash? Este equilibrio corresponde a la situacion en
que ambos jugadores eligen T ; sin embargo, notemos que la eleccion de T por parte
del esposo se basa en una amenaza no-creble de parte de la esposa con la que
ella asegura jugar T independientemente de lo que haga el esposo. Notemos que si
esto fuera cierto, el esposo debera jugar T , razon por la cual esta configuracion de
estrategias es un equilibrio de Nash. Sin embargo, decimos que la amenaza de la
esposa no es creble porque, en la contingencia en que el esposo jugara F , lo mejor
que podra hacer la esposa no es jugar T sino, como vimos, tambien jugar F . As,
este u
ltimo equilibrio de Nash no es perfecto en subjuegos. Notemos, ademas, que el
primero de los equilibrios de Nash (F, (F, F )) tampoco es creble, ya que esta basado
en una promesa en que la esposa asegura elegir F independientemente de lo que
haga el esposo. Sin embargo, si el esposo se equivocara y elige T en lugar de F ,
lo mejor que podra hacer la esposa es jugar T y no F ; de esta forma, tal equilibrio
de Nash tampoco sera creble (perfecto en subjuegos).
M
Fundamentos Te
oricos
Formalizemos ahora los conceptos estudiados en la seccion anterior definiendo, en
primer lugar, el concepto de a
rbol. Este concepto fue desarrollado por von Neumann
en 1928, y posteriormente generalizado por Harold Kuhn en 1953.
Definici
on 11 (Definicion de arbol).

a. Dado un conjunto de jugadores N = {1, 2, . . . , n}, definimos un a


rbol T como
un par (X, ) donde X es un conjunto de elementos llamados nodos y  es

93

Juegos No-Cooperativos con Informacion Simetrica

una relacion transitiva23 y asimetrica24 sobre X, llamada de precedencia, tales


que:
i. Existe un u
nico elemento O X (llamado nodo inicial) tal que O  x
para todo x X, x 6= O; es decir, el nodo inicial precede todos los nodos.

ii. Para todo x X, x 6= O, si x0  x y x00  x, entonces x0 = x00 , x00  x0 o


x0  x00 ; es decir, todo nodo distinto del inicial tiene un u
nico predecesor.
iii. Existe al menos un x0 X (llamado nodo terminal) tal que no existe
x0 X, con x0 6= x0 , x0  x0 .
b. Denotamos por Z al conjunto de nodos terminales de X. Asociamos a cada
nodo x X \ Z, un solo jugador i N mediante una funcion 25 :
i :X \Z N
x i(x)
Es decir, esta funcion indica que jugador mueve en cada nodo.
c. Tambien asumiremos que el jugador i(x) que mueve en el nodo x X \ Z
tiene un conjunto finito de estrategias puras C i(x) para el nodo x. Los pagos
los definimos mediante las funciones:
ui : xX\Z Ci(x) R

para

iN

d. Finalmente, supondremos que existe una particion 26 H de X \Z. Este conjunto


H (llamado el conjunto de los conjuntos de informaci
on) estara conformado
entonces por conjuntos de la forma h(x) para x X, donde h(x) es el conjunto de informacion que contiene a x. Este H debe satisfacer las siguientes
condiciones:
a. Si h(x) H y x0 h(x), entonces i(x) = i(x0 ); es decir, el mismo jugador
mueve dentro de cada nodo de un conjunto de informacion.
b. Si h(x) H y x0 h(x), entonces Ci(x) = Ci(x0 ) ; es decir, el jugador
que mueve en un conjunto de informacion tiene el mismo conjunto de
elecciones en cada uno de los nodos de ese conjunto de informacion.
Ahora podemos definir un juego en forma extensiva.
23

La relaci
on de precedencia  es transitiva si x  y, y  z implica x  z.
La relaci
on de precedencia es asimetrica si no es posible x  x.
25
X \ Z denota el conjunto de elementos que est
an en X y que no est
an en Z.
26
Es decir, H es una colecci
on de subconjuntos de X \ Z; todos estos subconjuntos son no vacos
y disjuntos, adem
as de que su uni
on coincide con X \ Z.
24

94

Un Curso de Teora de Juegos Clasica

Definici
on 12 (Forma Extensiva).
Un juego en forma extensiva es una tupla
= (N, (X, ), Z, i, {Ci(x) }xX\Z , H, (ui )iN )
que satisface las condiciones de la definicion de arbol (definicion 11).
Definici
on 13 (Juego Finito en Forma Extensiva).
Un juego finito en forma extensiva es un juego en forma extensiva en el que el
conjunto de nodos X es un conjunto finito. En otro caso, diremos que es un juego
infinito en forma extensiva.
Ejemplo 32.
Consideremos el juego que estudiamos al inicio de esta seccion y que presentamos
nuevamente en la figura 47.
Figura 47: Juego Finito en Forma Extensiva
1
e
@
@

L0
10
0

u
@
@

2
0
@ R
@
@

L0
7
3

8
2

R
@

@u
@
@

0
@ R
@
@

6
1

Este es un juego finito en forma extensiva de dos jugadores (N = {1, 2}). Los conjuntos de estrategias de los jugadores 1 y 2 son C 1 = {L, R} y C2 = {L0 , R0 }; el
conjunto de nodos no-terminales es X \ Z = {1A, 2A, 2B}, donde el nodo 1A es
el nodo inicial en el que mueve el jugador 1, y 2A y 2B son los nodos en los que
mueve el jugador 2. Observemos que el jugador 1 tiene solo un conjunto de informacion formado por el nodo 1A, y el jugador 2 tiene a su vez un solo conjunto de
informacion formado por los nodos 2A y 2B. Por tanto, H = {{1A}, {2A, 2B}}.
Observemos que H es un conjunto de subconjuntos no vacos, disjuntos por pares
y cuya union es X \ Z. Los pagos asociados a cada posible combinacion de estrategias son: u1 (L, L0 ) = 10, u1 (L, R0 ) = 7, u1 (R, L0 ) = 8, u1 (R, R0 ) = 6, u2 (L, L0 ) =
0, u2 (L, R0 ) = 3, u2 (R, L0 ) = 2, u2 (R, R0 ) = 1.
M

95

Juegos No-Cooperativos con Informacion Simetrica


Ejemplo 33.
Consideremos ahora el juego de la figura 48.
Figura 48: Juego Finito en Forma Extensiva
1
e
@
@

L0
10
0

2@u

2 u

@
@

0
@ R
@
@

L0
7
3

@
@

8
2

0
@ R
@
@

6
1

Este tambien es un juego finito en forma extensiva de dos jugadores (N = {1, 2}).
Los conjuntos de estrategias de los jugadores 1 y 2 son C 1 = {L, R} y
C2 = {(L0 , L0 ), (L0 , R0 ), (R0 , L0 ), (R0 , R0 )}

Observemos que una estrategia del jugador 2 es un plan de contingencia; es decir,


una especificacion de las acciones que el elige en cada uno de los nodos en los que
puede mover. Por ejemplo, la estrategia (R 0 , L0 ) del jugador 2 significa jugar R 0
si el jugador 1 juega L y jugar L0 si el jugador 1 juega R. El conjunto de nodos
no terminales es X \ Z = {1A, 2A, 2B}, donde el nodo 1A es el nodo inicial en el
que mueve el jugador 1, y 2A y 2B son los nodos en los que mueve el jugador 2.
Observemos que el jugador 1 tiene solo un conjunto de informacion formado por el
nodo 1A, mientras que el jugador 2 tiene dos conjuntos de informacion formados por
los nodos 2A y 2B. Por tanto H = {{1A}, {2A}, {2B}}. Observemos que H es una
particion de X \ Z. Los pagos asociados a cada posible combinacion de estrategias
son:
u1 (L, (L0 , L0 )) = 10,

u1 (L, (L0 , R0 )) = 10,

u1 (L, (R0 , L0 )) = 7,

u1 (L, (R0 , R0 )) = 7,

u1 (R, (L0 , L0 )) = 8,

u1 (R, (L0 , R0 )) = 6,

u1 (R, (R0 , L0 )) = 8,

u1 (R, (R0 , R0 )) = 6,

u2 (L, (L0 , L0 )) = 0,

u2 (L, (L0 , R0 )) = 0,

u2 (L, (R0 , L0 )) = 3,

u2 (L, (R0 , R0 )) = 3,

u2 (R, (L0 , L0 )) = 2,

u2 (R, (L0 , R0 )) = 1,

u2 (R, (R0 , L0 )) = 2,

u2 (R, (R0 , R0 )) = 1.
M

96

Un Curso de Teora de Juegos Clasica

Ejemplo 34 (Figura que no representa un juego en forma


extensiva).
Consideremos la figura 49 en la que una de las hipotesis importantes de la definicion
de arbol no se satisface y, por lo tanto, no constituye una representacion en forma
extensiva de un juego.
Figura 49: No representa un juego en forma extensiva
1
L
2A
x0 u

e
@
@

R
@

@ 2B
@u x00
Z
Z
 Z
 Z
L0 
L0 
Z R0
Z R0

Z

Z

Z x 
Z
u
u
1A 
1BZ
1CZu
@
@
@
@ R
@ R
@ R
L
L
L
@
@
@

Observese que aqu x0  x y a su vez x00  x, y ademas x0 6= x00 , y no se cumple que


x00  x0 o x0  x00 ; por lo tanto, no se cumple la hipotesis ii en la que se establece
que cada nodo debe tener un u
nico nodo que lo preceda. En este caso el nodo x es
precedido por dos nodos diferentes, x 0 y x00 .
M
Definici
on 14 (Juego en Forma Extensiva con Informacion
Simetrica).
Un juego en forma extensiva tiene informaci
on simetrica (o completa) si es de
conocimiento com
un. En otro caso diremos que el juego tiene informaci
on asimetrica
(o incompleta).
Definici
on 15 (Juego en Forma Extensiva con Informacion
Perfecta).
Un juego en forma extensiva tiene informaci
on perfecta cuando H esta conformado
u
nicamente por conjuntos de un solo elemento. En otro caso, diremos que el juego
tiene informaci
on imperfecta.
Ejemplo 35.
Consideremos el juego finito en forma extensiva representado en la figura 50.
Este es un juego con informacion imperfecta porque el conjunto de informacion del
jugador 3 esta compuesto por mas de un nodo. De hecho, esta compuesto por los

97

Juegos No-Cooperativos con Informacion Simetrica


Figura 50: Juego con Informacion Imperfecta

L
1A e

2B

u
@
@

u 2A
@
@
@ R
@
@

3A u

@
@

L0
1
2
1

R0

@
3
3
3

L0

2
0
0

R@ 3
1
4

@u 3B
@
@
@ R0
@
@

1
2

0
1
1

nodos 3A y 3B, lo cual esta ilustrado por la lnea punteada que los une. En otras
palabras, el jugador 3, en el momento en el que le corresponda actuar, no sabe si
el jugador 2, en la etapa inmediatamente anterior, eligio la accion L o la accion R.
As, este es un juego con informacion imperfecta porque no todos los conjuntos de
informacion estan conformados por un u
nico nodo.
M
Acerca de las Estrategias de un Juego en Forma Extensiva
Habamos notado el conjunto de estrategias puras de un jugador i(x) en el nodo
x dentro del juego extensivo como C i(x) , que puede escribirse equivalentemente
como C(hi ), donde hi es el conjunto de informacion que contiene al nodo x y en
el que mueve el i-esimo jugador. En el conjunto de informacion h i , una estrategia
mixta para el jugador i en hi debe ser entonces una distribucion de probabilidad
sobre las estrategias puras C(hi ); es decir, un elemento del conjunto que notaremos i (C(hi )). Luego una estrategia mixta del i-esimo jugador es un elemento del
conjunto hi H i (C(hi )). Y as, una estrategia mixta del juego en forma extensiva
debe ser un producto de estas distribuciones; es decir, un elemento de
iN (hi H i (C(hi )))
Definici
on 16 (Estrategia de Comportamiento).
Una estrategia de comportamiento del juego en forma extensiva (estrategia mixta

98

Un Curso de Teora de Juegos Clasica

de un juego en forma extensiva) es un elemento de


iN (hi H i (C(hi )))
Podemos preguntar, ahora, cual es la relacion entre las estrategias de comportamiento del juego en forma extensiva y las estrategias mixtas del correspondiente juego en
forma estrategica. Es claro que ambas formas de juego tienen las mismas estrategias
puras; sin embargo, las estrategias de comportamiento y las estrategias mixtas (en
su forma de descripcion) son distintas, como se vera analizando el ejemplo del inicio
de la seccion. Las formas extensiva y estrategica del juego aparecen en las figuras 51
y 52, respectivamente.

Figura 51: Forma Extensiva


1
e
@
@

2A u
L0
10
0

@
@

0
@ R
@
@

L0
7
3

8
2

R
@

@u 2B
@
@
0
@ R
@
@

6
1

Una estrategia mixta del juego en forma estrategica de la figura 52 es, por ejemplo,
= (1 , 2 ), donde 1 = (pL , pR ) y 2 = (pL0 L0 , pL0 R0 , pR0 L0 , pR0 R0 ) bajo la interpretacion conocida. En su lugar, una estrategia de comportamiento del juego de la
figura 51 es, por ejemplo, b = (b1 , b2 ), donde b1 = (pL , pR ) y b2 = ((pL0 , pR0 ), (qL0 , qR0 )),
donde pL b1 (L/1) es la probabilidad con que el jugador 1 juega L en el nodo
1; pR b1 (R/1) es la probabilidad con que el jugador 1 juega R en el nodo 1;
pL0 b2 (L0 /2A) es la probabilidad con que el jugador 2 juega L 0 si alcanza el nodo
2A; pR0 b2 (R0 /2A) es la probabilidad con que el jugador 2 juega R 0 si alcanza el
nodo 2A; qL0 b2 (L0 /2B) es la probabilidad con que el jugador 2 juega L 0 si alcanza
el nodo 2B; y qR0 b2 (R0 /2B) es la probabilidad con que el jugador 2 juega R 0 si
alcanza el nodo 2B.
Sin embargo, podemos mostrar que la estrategia mixta = ( 1 , 2 ) genera una
estrategia de comportamiento bajo una regla bayesiana de construccion. Para el
jugador 1, su estrategia de comportamiento es la misma estrategia mixta: b 1 = 1 =
(1/2, 1/2). Para el jugador 2, la estrategia de comportamiento es

99

Juegos No-Cooperativos con Informacion Simetrica


Figura 52: Forma Estrategica
Jugador 2
(L0 , L0 )

(L0 , R0 )

(R0 , L0 )

(R0 , R0 )

10,0

10,0

7,3

7,3

8,2

6,1

8,2

6,1

Jugador 1

b2 (L0 /2A) = b2 (R0 /2A) = b2 (L0 /2B) = b2 (R0 /2B) = 1/2;


es decir, la estrategia mixta = ((1/2, 1/2), (1/4, 1/4, 1/4, 1/4)) genera la estrategia
de comportamiento b1 = (1/2, 1/2), b2 = ((1/2, 1/2), (1/2, 1/2)).
Tambien podemos mostrar que la anterior estrategia de comportamiento genera una
estrategia mixta dentro de una regla bayesiana de construccion. Para el jugador 1, su
estrategia mixta 1 es la misma estrategia de comportamiento: 1 = b1 = (1/2, 1/2).
Para el jugador 2,
2 (L0 , L0 ) =Prob(L0 /2A)Prob(L0 /2B) = (1/2)(1/2) = 1/4
2 (L0 , R0 ) =Prob(L0 /2A)Prob(R0 /2B) = (1/2)(1/2) = 1/4
2 (R0 , L0 ) =Prob(R0 /2A)Prob(L0 /2B) = (1/2)(1/2) = 1/4
2 (R0 , R0 ) =Prob(R0 /2A)Prob(R0 /2B) = (1/2)(1/2) = 1/4
Es facil ver que, en este ejemplo, toda estrategia mixta del juego en forma estrategica
genera una estrategia de comportamiento del juego en forma extensiva y viceversa.
Sin embargo, sera esto cierto para cualquier juego en forma extensiva? La respuesta
es no, como se explica a continuacion. Para esto consideremos el juego en forma
extensiva de la figura 53
En este juego el jugador 1 tiene dos conjuntos de informacion. En el primero, este
tiene tres acciones L, M y R. En el segundo, tiene dos acciones X y Y . Por tanto, el
jugador 1 tiene 6 estrategias que son (L, X), (L, Y ), (M, X), (M, Y ), (R, X) y (R, Y ).
Por otra parte, el jugador 2 tiene solo un conjunto de informacion con dos acciones,
l y r. Por tanto, las estrategias del jugador 2 son l y r.
Consideremos la siguiente estrategia de comportamiento para el jugador 1. En su
primer conjunto de informacion, el jugador 1 mueve L, M y R con probabilidades p L ,
pM y pR , respectivamente (desde luego pL + pM + pR = 1). En su segundo conjunto
de informacion, este mueve X e Y con probabilidades p X y pY , respectivamente (de
nuevo px + pY = 1). Por otra parte, el jugador 2 mueve l y r con probabilidades p l y

100

Un Curso de Teora de Juegos Clasica


Figura 53: Estrategias de Comportamiento

1
L
T0

ePP
T PPP
T
PP
PP
T
PP
T M
PP R
PP
T
PP
T
PP
PP
2
Te
e
 Q
 Q
l
r
l
Q

Q r

Q

Q
1
u

Qu
u

Qu
@ Y
@ Y
@ Y
@ Y
X
X
X
@
@
@
@
@
@
@
@

T1

T2

T3

T4

T5

T6

T7

T8

pr respectivamente (con pl + pr = 1). Estas estrategias de comportamiento generan


la siguiente distribucion de probabilidad sobre los nodos terminales:
p(T0 ) = pL

p(T1 ) = pM pl px

p(T2 ) = pM pl pY

p(T3 ) = pM pr px

p(T4 ) = pM pr pY

p(T5 ) = pR pl px

p(T6 ) = pR pl pY

p(T7 ) = pR pr px

p(T8 ) = pR pr pY

Una estrategia mixta que genera la misma distribucion de probabilidad sobre los
nodos terminales, dada la estrategia mixta (p l , pr ) del jugador 2, satisface:
p(T0 ) = p(L, X) + p(L, Y )

p(T1 ) = p(M, X)pl

p(T2 ) = p(M, Y )pl

p(T3 ) = p(M, X)pr

p(T4 ) = p(M, Y )pr

p(T5 ) = p(R, X)pl

p(T6 ) = p(R, Y )pl

p(T7 ) = p(R, X)pr

p(T8 ) = p(R, Y )pr

Por ejemplo,
pL = p(L, X) + p(L, Y )
pM pY = p(M, Y )

pM pX = p(M, X)
pR pX = p(R, X)

pR pY = p(R, Y )
Ahora podemos tomar
pL
2
p(M, X) = pM pX

pL
2
p(M, Y ) = pM pY

p(R, X) = pR pX

p(R, Y ) = pR pY

p(L, X) =

p(L, Y ) =

101

Juegos No-Cooperativos con Informacion Simetrica

Y as, esta estrategia mixta es equivalente a la estrategia de comportamiento especificada.


Sin embargo, consideremos alguna estrategia mixta para el jugador 1:
p(L, X), p(L, Y ), p(M, X), p(M, Y ), p(R, X), p(R, Y ).
Si el jugador 2 utiliza la estrategia mixta (p l , pr ), la distribucion de probabilidad
asociada sobre los nodos terminales a esta estrategia mixta es:
p(T0 ) = p(L, X) + p(L, Y )

p(T1 ) = p(M, X)pl

p(T2 ) = p(M, Y )pl

p(T3 ) = p(M, X)pr

p(T4 ) = p(M, Y )pr

p(T5 ) = p(R, X)pl

p(T6 ) = p(R, Y )pl

p(T7 ) = p(R, X)pr

p(T8 ) = p(R, Y )pr

Una estrategia mixta que genera la misma distribucion de probabilidad sobre los
nodos terminales, dada la estrategia mixta (p l , pr ) del jugador 2, satisface:
pL = p(L, X) + p(L, Y )
pM pl pX = p(M, X)pl
pM pl pY = p(M, Y )pl
pM pr pX = p(M, X)pr
pM pr pY = p(M, Y )pr
pR pl pX = p(R, X)pl
pR pl pY = p(R, Y )pl
pR pr pX = p(R, X)pr
pR pr pY = p(R, Y )pr
Por ejemplo,
i. pL = p(L, X) + p(L, Y )

ii. pM pX = p(M, X)

iv. pR pX = p(R, X)

iii. pM pY = p(M, Y )

v. pR pY = p(R, Y )

De las ecuaciones ii y iii tenemos:


vi.

p(M, X)
p(M, Y )
=
pX
pY

Dado que pX + pY = 1, entonces


vii. pX =

p(R, X)
p(R, X) + p(R, Y )

pY =

p(R, Y )
p(R, X) + p(R, Y )

As, de las ecuaciones vi y vii podemos concluir que no siempre existe una estrategia
de comportamiento que sea equivalente a la estrategia mixta especificada.

102

Un Curso de Teora de Juegos Clasica

Los juegos en forma extensiva en los que podemos identificar estrategias mixtas con
estrategias de comportamiento satisfacen una condicion que, aunque restrictiva, la
satisfacen la mayora de los juegos estudiados en la practica. En estos juegos, llamados de memoria perfecta, ning
un jugador olvida ninguna informacion que alguna
vez conocio. En general, asumiremos que los juegos extensivos tienen memoria perfecta; es decir, que si dos nodos estan en el mismo conjunto de informacion de cierto
jugador, las movidas que el jugador hace para llegar a cualquiera de los dos son las
mismas: un jugador nunca olvida sus movidas.
Definici
on 17 (Memoria Perfecta).
Un juego en forma extensiva tiene memoria perfecta cuando:
i. Si x0 h(x), entonces ni x  x0 ni x0  x (si dos nodos estan en el mismo
conjunto de informacion, ninguno debe anteceder al otro).
ii. Si x00 h(x0 ), x  x0 e i(x) = i(x0 ) (y por tanto, igual a i(x00 )), entonces existe
un nodo x X (posiblemente x mismo) tal que x h(x), x  x00 , y la
accion tomada en x para llegar a x0 es la misma que la accion tomada en x
para llegar a x0 a traves de x00 (si las trayectorias fueran distintas, el jugador
habra olvidado lo que antes hizo).
Un ejemplo de un juego en forma extensiva con memoria imperfecta es el de la figura
53. Este no es un juego de memoria perfecta porque el jugador 1 olvida si elige M
o R cuando tiene que mover en su segunda oportunidad.
Teorema 11 (Equivalencia entre Estrategias de Comportamiento y Estrategias Mixtas (Kuhn [1953])).
En un juego con memoria perfecta, toda estrategia mixta genera una u
nica estrategia
de comportamiento y cada estrategia de comportamiento genera una u
nica estrategia
mixta. M
as a
un, la estrategia mixta generada por una estrategia de comportamiento
genera, a su vez, una estrategia de comportamiento que coincide con la estrategia de
comportamiento original.
Demostraci
on.
Ver Kuhn [1953].
Debido a este teorema, bajo la hipotesis de memoria perfecta utilizamos los terminos
estrategias mixtas y estrategias de comportamiento de manera intercambiable y,
en adelante, asumiremos que todos los juegos en forma extensiva tienen memoria
perfecta.
Continuando entonces con la descripcion de un juego en forma extensiva, presentamos su subestructura mas importante: la nocion de subjuego.
Definici
on 18 (Subjuego de un Juego en Forma Extensiva).
Un subjuego F de un juego en forma extensiva es un juego en forma extensiva
conformado por un nodo de (nodo inicial del subjuego) y todos sus sucesores, con

103

Juegos No-Cooperativos con Informacion Simetrica

la propiedad de que si x0 esta en F y x00 h(x0 ), entonces x00 tambien esta en el


subjuego F (es decir, un subjuego no rompe conjuntos de informacion) 27 .
Ejemplo 36.
El juego finito en forma extensiva de la figura 54 posee tres subjuegos:
Figura 54: Subjuegos de un Juego en Forma Extensiva
1




L

e
 H

H

(6,0,6)

R
HH
2
HHu

(8,6,8)

F##

#
u
@
@
F

(0,0,0)

u
#c
#
c

c G
c
c

@ G
@
@

(7,10,7)

(7,10,7)

cu
@
@

@ G
@
@

(0,0,0)

a. El subjuego que comienza en el nodo de eleccion del jugador 2.


b. El subjuego que comienza en el nodo de eleccion del jugador 3.
c. Y el juego total representado en la figura 54.
Observemos que los juegos que comienzan en los segundos nodos de eleccion del
jugador 1 no pueden ser subjuegos porque un subjuego nunca rompe conjuntos
de informacion.
M
Definici
on 19 (Equilibrio de Nash).
Una estrategia de comportamiento iN (hi H i (C(hi ))) de un juego en
forma extensiva es un equilibrio de Nash si ning
un jugador puede incrementar
su pago esperado utilizando, unilateralmente, una estrategia de comportamiento
diferente; es decir, si para todo i N ,
27
Un subjuego del juego es cualquier juego que puede ser podado del a
rbol del juego
suprimiendo todos los nodos y ramas que no siguen alguna subraz X y haciendo que el nodo X sea
la raz del subjuego. Si X es una subraz entonces cualquier jugador que mueve en X, o despues,
sabe que ha ocurrido en el nodo X.

104

Un Curso de Teora de Juegos Clasica


) u ( , )
ui (i , i
i i i

para todo i hi H i (C(hi ))

Definici
on 20 (Equilibrio de Nash perfecto en subjuegos).
Una estrategia de comportamiento de un juego en forma extensiva es un equilibrio de Nash perfecto en subjuegos (ENPS) si la restriccion de a cualquier subjuego
es un equilibrio de Nash del subjuego.
El siguiente teorema resume algunas de las principales caractersticas de los equilibrios de juegos en forma extensiva.
Teorema 12.
i. Todo juego finito en forma extensiva tiene al menos un equilibrio de Nash.
ii. Todo equilibrio de Nash perfecto en subjuegos es un equilibrio de Nash del juego
en forma extensiva.
iii. Todo juego finito en forma extensiva con informaci
on perfecta y completa tiene
al menos un equilibrio de Nash perfecto en subjuegos.
iv. Todo equilibrio de Nash perfecto en subjuegos de un juego finito en forma extensiva con informaci
on perfecta y completa puede calcularse mediante inducci
on
hacia atr
as; es decir, comenzando con los nodos anteriores a los terminales, el
jugador all asignado, optimiza; luego, teniendo esto en cuenta, los jugadores
asignados a los nodos inmediatamente anteriores, optimizan; etc.
Demostraci
on.
Ver Selten [1975].
Ejemplo 37 (Calcular ENPS puede ser dispendioso).
Consideremos el juego de dos jugadores de la figura 55.
Figura 55: Calculo de ENPS
Jugador 2

Jugador 2
L1

R1

Jugador 1 U1

2,2

-1,3

D1

3,-1

0,0

Pagos perodo 1

L2

R2

Jugador 1 U2

6,4

3,3

D2

3,3

4,6

Pagos perodo 2

En el primer perodo, los jugadores 1 y 2 eligen simultaneamente U 1 o D1 (jugador


1) y L1 o R1 (jugador 2); estas elecciones son reveladas al final del periodo 1 con los
pagos correspondientes. En el periodo 2, los jugadores 1 y 2 eligen simultaneamente

105

Juegos No-Cooperativos con Informacion Simetrica

U2 o D2 (jugador 1) y L2 o R2 (jugador 2). El objetivo de cada jugador es maximizar


la suma de sus pagos en los dos periodos. Calculemos los ENPS de este juego cuya
forma extensiva se representa en la figura 56.
Figura 56: Calculo de ENPS
c1
U1

 HH



HHD1
HH

H Hs
2

s 
@
@
@ R1
L1
@ R1
L1
@
@
@
@
1s
1s
1s
1s

J
U2
J D2
U2
J D2
U2
J D2
U2
J D2

s
Js
s

Js
s

Js
s

Js
A
A
A
A
A
A
A
A
 A
 A
 A
 A
 A
 A
 A
 A
8
6

5
5

5
5

6
8

5
7

2
6

2
6

3
9

9
3

6
2

6
2

7
5

6
4

3
3

3
3

4
6

Una combinacion de estrategias es ENPS si cada una de las estrategias que la conforman es un equilibrio de Nash en cada uno de los subjuegos. Sean, el subjuego 1, el
subjuego que sigue a U1 L1 ; el subjuego 2, el subjuego que sigue a U 1 R1 ; el subjuego
3, el subjuego que sigue a D1 L1 ; y el subjuego 4, el que le sigue a D1 R1 . Por tanto,
este juego tiene cinco subjuegos: el juego total y los cuatro subjuegos propios. Cada
uno de estos u
ltimos tiene dos equilibrios de Nash: (U 2 , L2 ) y (D2 , R2 ). La primera
etapa tiene cuatro posibles resultados: (U 1 , L1 ), (U1 , R1 ), (D1 , L1 ) y (D1 , R1 ). Por
tanto, existen 4(24 ) = 64 posibles ENPS. Sin embargo, queda como ejercicio al lector
probar que solo las siguientes estrategias son los ENPS del juego:
Jugador 1

Jugador 2

1. ((U1 , U2 , U2 , U2 , D2 ), (R1 , L2 , L2 , L2 , R2 ))
2. ((U1 , U2 , U2 , D2 , D2 ), (R1 , L2 , L2 , R2 , R2 ))
3. ((D1 , D2 , D2 , D2 , U2 ), (L1 , R2 , R2 , R2 , L2 ))
4. ((D1 , D2 , U2 , D2 , U2 ), (L1 , R2 , L2 , R2 , L2 ))
5. ((D1 , U2 , U2 , U2 , U2 ), (R1 , L2 , L2 , L2 , L2 ))
6. ((D1 , D2 , U2 , U2 , U2 ), (R1 , R2 , L2 , L2 , L2 ))
7. ((D1 , U2 , D2 , U2 , U2 ), (R1 , L2 , R2 , L2 , L2 ))
8. ((D1 , D2 , D2 , U2 , U2 ), (R1 , R2 , R2 , L2 , L2 ))

106

Un Curso de Teora de Juegos Clasica

9. ((D1 , D2 , D2 , D2 , D2 ), (R1 , R2 , R2 , R2 , R2 ))
10. ((D1 , U2 , D2 , D2 , D2 ), (R1 , L2 , R2 , R2 , R2 ))
11. ((D1 , D2 , D2 , U2 , D2 ), (R1 , R2 , R2 , L2 , R2 ))
12. ((D1 , U2 , D2 , U2 , D2 ), (R1 , L2 , R2 , L2 , R2 ))
La solucion de equilibrio de Nash perfecto en subjuegos pretende tomar en cuenta
los incentivos de las partes en cada punto posible de decision. La tecnica de focalizar
el juego en cada subjuego es u
til en la medida en que elimina cualquier equilibrio de
Nash que asuma comportamientos implausibles (fuera de la trayectoria de equilibrio)
por parte de los jugadores; sin embargo, y a pesar de todas estas previsiones, algunas
complicaciones pueden surgir. Ejemplos de esto se ilustran con los ahora considerados clasicos juegos del ciempies y de la cadena de tiendas, que presentamos a
continuacion.
Ejemplo 38 (El Juego del Ciempies (Rosenthal [1981])).
Consideremos dos jugadores que hacen parte de un proceso que cada uno de ellos
puede alternativamente detener. A medida que el proceso tome mas etapas en detenerse, mayores son los pagos que obtienen los jugadores: en particular, por cada etapa
que avance el proceso, los pagos conjuntos se incrementan en una unidad monetaria,
digamos 1 euro. Sin embargo, cada jugador prefiere el pago resultante de que sea el
quien detenga el proceso, a que sea su oponente, en la etapa inmediatamente posterior, quien lo haga. El proceso tiene un maximo de 100 etapas. La representacion
en forma extensiva de este juego aparece en la figura 57.
Figura 57: Juego del Ciempies
1

2
C

2
1

2
C

0
2

2
C

1
0

1
C

...
...

48
50

2
C

1
3

1
C

50
49

51
50

49
51

Observemos que en la primera etapa solo hay un euro. El jugador 1 tiene la oportunidad de detener el juego, lo que significara un pago de 1 para el y 0 para el
jugador 2. En la segunda etapa hay 2 euros; el jugador 2 puede detener el juego con
un vector de pagos (0,2), o continuarlo. Notemos que los mayores pagos conjuntos
son (51,50) que se alcanzan si en todas las etapas cada jugador al que le corresponda

actuar decide continuar el juego. Este


es un juego con informacion perfecta (porque

Juegos No-Cooperativos con Informacion Simetrica

107

todos los conjuntos de informacion estan conformados por un u


nico nodo) y completa (porque los dos jugadores conocen todos los posibles resultados del juego y los
pagos para ambos jugadores). Por tanto, de acuerdo con el teorema 12, el equilibrio
de Nash perfecto en subjuegos puede calcularse por el metodo de induccion hacia
atras.
As, en el u
ltimo nodo de decision, el jugador 2, como agente racional, elige D que le
genera un pago de 51, mayor al que obtendra si eligiera C que le da un pago de 50.
Sabiendo esto, en la etapa anterior el jugador 1 elegira D que le da un pago de 50,
desde luego mayor que lo que obtendra por jugar C dado que su oponente elegira
C, esto es, 49. Con un argumento similar, en el antepen
ultimo nodo de decision el
jugador 2 elegira D para obtener 50 y no 49, que sera lo que obtendra por jugar C,
dado que el jugador 1 elegira D. Continuando el mismo razonamiento hasta el nodo
inicial, se observa que el resultado por induccion hacia atras de este juego es que el
jugador 1 elija D, finalizando instantaneamente el juego. Los pagos que reciben los
jugadores son (1,0); luego el ENPS del juego del ciempies es claramente suboptimo
ya que, como dijimos, eligiendo C en todas las etapas, los jugadores terminaran con
pagos de (51,50).
Siguiendo a McKelvey y Palfrey [1992], no obstante esta inequvoca prediccion, los
teoricos en juegos no se han visto demasiado comodos con el analisis anterior del
juego, preguntandose si este realmente refleja la forma en que cualquiera lo jugara.
En principio, observemos que el resultado predicho por el ENPS requiere de una
estructura de informacion muy fuerte: que la racionalidad de los jugadores sea de
conocimiento com
un. Esto es, para que el jugador 1 elija D en la primera etapa
requiere de 100 rondas de eliminacion de estrategias dominadas. Notemos que aun
si ambos jugadores son racionales, y ambos saben que su oponente es racional, pero
alguno de ellos desconoce que su oponente sabe que el es racional, entonces el ENPS
no resulta una prediccion razonable como solucion del juego. Surge otra complicacion
a raz de que cada jugador debe jugar varias veces: supongamos que en la primera
etapa el jugador 1 elige C. La nocion de induccion hacia atras implicara que el
jugador 2 debera jugar D porque, en caso contrario, el jugador 1 jugara D en el
tercer nodo. Sin embargo, es claro que el jugador 1 no jugo seg
un la induccion hacia
atras en el primer nodo. As, lo mejor que puede hacer el jugador 2 en el segundo
nodo depende de sus creencias acerca de como jugara el jugador 1 en sus nodos
siguientes. Por tanto, dependiendo de que tan fuertes sean las creencias del jugador
2 de que el jugador 1 seguira jugando C, puede resultar razonable para el jugador 2
jugar C y obtener un resultado que domine en el sentido de Pareto al ENPS.
Otro argumento que cuestiona el resultado predicho por el ENPS se basa en la nocion
de que al menos uno de los jugadores realmente desconoce los pagos que su oponente
obtendra en cada posible resultado. Sin embargo, tal discusion la aplazamos hasta
el proximo captulo cuando estudiaremos juegos con informacion incompleta. A continuacion presentamos cierta evidencia experimental respecto al juego del ciempies.
M

108

Un Curso de Teora de Juegos Clasica

Evidencia Experimental del Juego del Ciempi


es (McKelvey y Palfrey
[1992])
McKelvey y Palfrey [1992] presentan evidencia experimental de varias versiones del
juego del ciempies, mostrando como tales resultados se alejan notablemente de las
predicciones hechas por el concepto de equilibrio de Nash perfecto en subjuegos.
Para dar una idea global de estos resultados, vale la pena se
nalar que, contrario a
lo que predice la teora, solo 37 de los 662 juegos que llevaron a cabo terminaron
en la primera etapa. Por otro lado, 23 de los juegos llegaron hasta la u
ltima etapa,
mientras que el resto terminaron en perodos intermedios dispersos.
Algunas de las principales conclusiones extradas de los resultados del experimento
son:
a. Se rechaza cualquier hipotesis de racionalidad de los agentes en el sentido de
eliminar sucesivamente estrategias dominadas.
b. La probabilidad de que un jugador decida terminar el juego aumenta conforme
este se aproxima a la u
ltima etapa.
c. A medida que los jugadores ganan experiencia se comportan mas racionalmente, lo cual evidencia aprendizaje en el juego.
d. Se encuentran individuos que nunca deciden terminar el juego; a estos jugadores se les cataloga como altruistas ya que tal comportamiento corresponde
al de agentes que buscan maximizar la suma de los pagos, y no sus pagos individuales.
Con base en estos aspectos, McKelvey y Palfrey [1992] construyen un modelo parametrico con el que se proponen explicar tales resultados. Concluyen que los comportamientos mostrados por los sujetos experimentales pueden explicarse por un modelo que
asuma informacion incompleta en el juego, una peque
na fraccion de agentes altruistas, as como la posibilidad de que los jugadores cometan errores, tanto en sus
creencias sobre el comportamiento de los otros como en las acciones que eligen.
Vale la pena se
nalar, nuevamente, que la incompletitud en la informacion se refiere a
que los jugadores creen que existe alguna posibilidad de que sus oponentes obtengan
pagos diferentes a los que los experimentadores trataban de inducir.
Ejemplo 39 (el juego de la cadena de tiendas (Selten [1975])).
Una cadena de tiendas tiene sucursales en 20 ciudades diferentes. Actualmente la
u
nica tienda presente en cada ciudad pertenece a esta cadena, pero tambien hay un
entrante potencial en cada ciudad. Cada mes, en una ciudad diferente, un entrante
potencial decide si entra o no al mercado y, seguido a esto, la cadena decide si se
acomoda a la entrada del otro competidor, o si le declara una batalla comercial.
El mejor resultado en cada mes, desde el punto de vista de la cadena, es que el
entrante potencial se mantenga fuera del mercado, ya que esto le permitira ser la

109

Juegos No-Cooperativos con Informacion Simetrica

u
nica firma en tal ciudad. El resultado mas deseable, desde el punto de vista de
cada firma entrante, es entrar y que la cadena se acomode; esto es, que no
le declare la batalla comercial. En cada etapa en que cualquier firma debe tomar
una decision, conoce toda la historia del juego; luego hablamos de un juego con
informacion perfecta. La representacion en forma extensiva del juego que se lleva a
cabo cada mes, aparece en la figura 58.
Figura 58: Juego de la Cadena de Tiendas
Entrante potencial
e
@
@

No entra
5
1

Se acomoda
2
2

Entra
@

@u Cadena de Tiendas
@
@
@ Declara guerra
@comercial
@

0
0

Observemos que el juego de cada mes tiene dos equilibrios de Nash en estrategias
puras: uno en el que la firma entrante se mantiene fuera y la cadena amenaza con
iniciar una guerra, y otro en el que la firma entrante incursiona en el mercado y la
cadena se acomoda. Desde luego, el primero de estos equilibrios no es perfecto en
subjuegos ya que, en caso de que la cadena tuviera que decidir, preferira acomodarse
a declarar una guerra comercial.
Volvamos nuevamente al juego original. Como, en cada etapa, cada firma conoce
la historia del juego, podemos solucionarlo por induccion hacia atras. Observemos
en la figura 58 que en la u
ltima etapa la solucion sera que el entrante potencial
efectivamente entre al mercado y que la cadena se acomode. Continuando con el
mismo razonamiento, podemos extender este argumento para todas las etapas.
Al igual que en el ejemplo anterior del juego del ciempies, este equilibrio de Nash
perfecto en subjuegos resulta poco intuitivo. En particular, podramos pensar que la
cadena de tiendas puede amenazar con declarar una guerra comercial con el fin de
obtener cierta reputacion que le permita disuadir la entrada futura de otras firmas
al mercado. Nuevamente, una posible salida a esta aparente paradoja consiste en
que cada firma asigne probabilidades subjetivas diferentes de cero, respecto al comportamiento de su oponente; pero al igual que en el ejemplo anterior, esta discusion
la dejamos para el captulo siguiente.
M

110

Un Curso de Teora de Juegos Clasica

Ejercicios 9.
1. Considere una modificacion del juego de el gallina de la pagina 63 donde al
momento de tomar su decision, el jugador 2 ya conoce la decision del jugador
1.
a. Represente este juego en forma extensiva.
b. Represente este juego en forma estrategica.
c. Encuentre la solucion por induccion hacia atras.
d. Encuentre los equilibrios de Nash.
e. Encuentre los equilibrios de Nash perfectos en subjuegos.
f. Explique las diferencias (si existen) entre estos dos u
ltimos.
2. Considere nuevamente el juego de dos jugadores con conjuntos de estrategias
C1 = [0, 50] = C2 y funciones de pago
u1 (c1 , c2 ) =100c1 10c21 + 10c1 c2
u2 (c1 , c2 ) =200c2 15c22 + 10c1 c2

Suponga que el jugador 1 elige primero y el jugador 2 conoce la decision de 1


al momento de jugar.
a. Encuentre la solucion por induccion hacia atras.
b. Encuentre el equilibrio de Nash perfecto en subjuegos.
c. Contraste los resultados encontrados con los de la seccion VIII.
3. Utilice la induccion hacia atras para encontrar el equilibrio de Nash del siguiente juego. Dos jugadores, Diego y Miguel, empiezan con $2 cada uno. En la
primera ronda, Diego puede retirarse (R) y robarle los $2 a Miguel. En ese
caso el juego se acaba. Si no se retira, Diego puede cooperar (C) al no robar a
Miguel, y la naturaleza le da $1 a Diego. Luego, en la segunda ronda, Miguel
puede retirarse (R) y robarle $2 a Diego, en cuyo caso se acaba el juego, o
cooperar (C), y la naturaleza le da $1 a Miguel. El juego contin
ua as hasta
que alguno de los jugadores se retire, o hasta que ambos tengan $10.

XI.

Juegos Repetidos

Hasta esta instancia se ha asumido implcitamente que una vez dos o mas jugadores
involucrados en alguna situacion alcanzan los resultados de esta, su relacion termina
y no vuelven a encontrarse nunca mas. Podramos decir que tal situacion refleja
mas la excepcion que la regla; es decir, lo usual es encontrar casos en los cuales

Juegos No-Cooperativos con Informacion Simetrica

111

los jugadores deben enfrentarse a una misma situacion varias veces (disponiendo
de alguna informacion acerca de los resultados de interacciones pasadas) antes de
iniciar cada nueva interaccion. Los juegos a los que se enfrentan compa
neros de
oficina, empresas lderes en alguna industria e, incluso, superpotencias nucleares,
clasifican facilmente en esta categora.
Algunos aspectos importantes hacen que el estudio de los juegos repetidos merezca un
analisis especial. Dado que los jugadores reconocen que sus interacciones se llevaran a
cabo repetidas veces, el mediano y el largo plazo que antes no eran tenidos en cuenta,
ahora cobran importancia. De esta forma, resulta plausible que algunos jugadores
no valoren u
nicamente los beneficios que obtendran en una primera interaccion
sino que mas bien podran interesarse por sus beneficios de largo plazo. Siendo esto
as, acciones diferentes a las que prescriben los conceptos solucion que hemos visto
(como el de equilibrio de Nash) podran ser tomadas racionalmente por los jugadores
si estas les dan la posibilidad de alcanzar mayores beneficios futuros.
Como dijimos antes, de forma previa a cada nueva interaccion, los jugadores cuentan
con alguna informacion acerca de los resultados de las interacciones anteriores. Este
hecho permite que cada jugador, desde el presente, pueda condicionar sus acciones
futuras a los resultados que hayan sido obtenidos hasta el momento en que deba
llevar a cabo una nueva accion. Como ejemplo de esto, recordemos el juego de pas
grande y pas peque
no, en el que sus estrategias eran armarse y permanecer
desarmado. Podramos pensar que este es un juego al que se enfrentan los dos pases
cada a
no. Especficamente, el primer da del a
no, los dos pases, simultaneamente y de
forma aislada, deben tomar una decision. Teniendo en cuenta las repercusiones que
les traera a ambos iniciar una carrera armamentista, podran adoptar posiciones
como permanecer desarmado hasta tanto el otro pas permanezca desarmado y
alcanzar resultados diferentes con respecto al caso en el que el juego se jugaba una
sola vez. Como resulta claro a partir de este ejemplo, escenarios de cooperacion
tacita, amenazas, retaliaciones y normas sociales, entre otros, pueden estudiarse en
este contexto.
Como su nombre lo indica, un juego repetido es aquel en el que un conjunto de jugadores deben enfrentar el mismo juego de estado varias veces. Dos escenarios para
el analisis de este tipo de juegos han sido desarrollados en la literatura: aquellos
en los cuales hay conocimiento com
un del n
umero finito de veces que se repetira el
juego de estado y aquellos en los cuales al menos una de las partes desconoce cuando
terminara el juego. Tradicionalmente estos dos escenarios se conocen como de horizonte finito y de horizonte infinito (superjuegos), respectivamente. A continuacion
analizamos los juegos de horizonte infinito, y hacia el final de la seccion los de horizonte finito. Las definiciones que introducimos a partir de ahora son validas para
ambos escenarios.
Definici
on 21 (Juego de Estado).
Un juego de estado es un juego finito en forma estrategica G = (N, (A i )iN , (ui )iN ),
donde N = 1, 2, ..., n es el conjunto que indiza a los jugadores; A i es el conjunto de

112

Un Curso de Teora de Juegos Clasica

acciones disponibles para cada jugador i N en cada etapa; y u i : A R es la


funcion de pagos (utilidad) para el jugador i, que asigna un pago (n
umero real) a
cada combinacion de acciones (a1 , ..., an ) A, donde A = iN Ai es el conjunto de
acciones conjuntas (o combinaciones de acciones) de los jugadores.
En lo que sigue, nos centraremos en juegos repetidos con informaci
on simetrica (o
completa). Sin embargo, como vimos antes, dado que cada jugador no conoce la accion que los demas jugadores escogeran en una misma etapa en la que deban actuar,
diremos que el juego de estado tiene informacion imperfecta.
A diferencia de la forma en que se generan los pagos en los juegos por etapas que
hemos estudiado hasta ahora, en los juegos repetidos asumimos que despues de cada interaccion, los jugadores reciben los pagos correspondientes y, seguido a esto,
s vuelven a interactuar. Como en los juegos repetidos las estrategias se escogen
al inicio del juego, cada jugador debe poder comparar las posibles sucesiones futuras de pagos, de tal forma que pueda elegir de antemano entre las estrategias
que determinaran tales sucesiones. A este respecto es de destacarse que la forma
en que un jugador dado valora sus pagos futuros en terminos presentes, involucra
factores sicologicos, culturales, religiosos, economicos, entre otros. Por esta razon,
se introducen en la literatura diferentes formas de medir los pagos. A continuacion
exponemos dos de estas formas:
1. Pagos descontados
Seg
un este criterio, decimos que un jugador i prefiere una sucesion infinita de
on {nit }
olo si, existe un n
umero (0, 1)
pagos {mit }
t=1 a otra sucesi
t=1 si, y s
tal que

X
X
t1 i
mt
t1 nit
t=1

t=1

Este n
umero es la tasa de descuento, es decir, aquella mediante la cual se
valora un pago futuro en terminos presentes. Formas alternativas de interpretar este n
umero se relacionan con la paciencia de los jugadores con respecto
al paso del tiempo (si es mas cercano a 1 el agente es paciente, pero si
es cercano a 0, el agente es impaciente); o la probabilidad de que llegada
cierta etapa, el juego contin
ue, siendo esta mayor en cuantoP sea cercano a 1.
t1 mi repreCon el criterio de pagos descontados la expresion (1 )
t
t=1
senta el pago de la sucesion {mit }
ermino (1 ) act
ua
t=1 para el jugador i; el t
como un factor de normalizacion, de tal forma que tal pago este acotado por
los mismos n
umeros correspondientes a los pagos del juego de estado. Notemos
que con este criterio de valoracion los pagos alcanzados en etapas futuras son
menores conforme estas se hacen mas lejanas. Desde luego, podran presentarse jugadores para los cuales pagos presentes y futuros reciben valoraciones
exactamente iguales o, de forma equivalente, su paciencia sea infinita ( = 1).
En tales casos, el criterio de pagos descontados no es adecuado para comparar
sucesiones de pagos. Esto nos lleva a introducir un segundo criterio.

113

Juegos No-Cooperativos con Informacion Simetrica

2. Lmite de los promedios


La esencia de este criterio es simplemente la comparacion de los pagos promedio
de cualquier par de sucesiones cuando el n
umero de etapas va al infinito; es
i

decir, una sucesion {mt }t=1 es preferida estrictamente a otra sucesion {n it }


t=1
si, y solo si,
lmT

PT

i
k=1 mk

> lmT

PT

i
k=1 nk

Notemos que, con este criterio, perdidas en un subconjunto finito de etapas


no son tenidas en cuenta; lo u
nico importante es el promedio de largo plazo 28 .
Un ejemplo plausible de esto son las personas que estan dispuestas a hacer
grandes sacrificios presentes con el animo de obtener futuras ganancias por un
perodo de tiempo de duracion indefinida; como lo importante en este caso es
el promedio total, tales sacrificios presentes no revisten mayor importancia a la
hora de elegir entre tal opcion y otra que genere pagos menores pero estables
a traves del tiempo.
Ejemplo 40.
Determinemos cual de las siguientes sucesiones de pagos sera elegida por un jugador racional de acuerdo con los criterios de pagos descontados y de lmite de los
promedios:
{mit } = {5, 1, 1, 1, ....}
{nit } = {2, 2, 2, ....}

De acuerdo con el criterio de pagos descontados, el pago de la sucesion m it es

t1 mti =

t=1

5 4
1

mientras que el pago descontado de la sucesion n it es

X
t=1

nti =

2
1

Por lo tanto, siempre y cuando 3/4, la sucesion n it es preferida a la sucesion mit .


Es decir, si la paciencia del jugador que enfrenta estas dos sucesiones de pagos es
suficientemente alta, preferira tener un pago de 2 siempre, que tener un pago de 5
28

Si los lmites mencionados no existen, el criterio puede modificarse a


PT
PT
mi
ni
lm inf T k=1 k > lm inf T k=1 k
T
T

donde lm inf es el menor lmite de alguna subsucesi


on convergente de la sucesi
on de pagos. M
as
precisamente, lminf es el nfimo de los lmites de las subsucesiones convergentes.

114

Un Curso de Teora de Juegos Clasica

hoy y 1 a partir de ma
nana. La paciencia es, pues, requerida para que el jugador no
se vea demasiado atrado por el pago (alto) de 5 en la primera etapa.
Ahora comparemos las dos sucesiones con base en el criterio de lmite de los promedios; de esta forma,
PT
k
k=1 mi
lm
=1
T
T
mientras que
lm

PT

k
k=1 ni

=2

Como dijimos, si el criterio es el de pagos descontados y el jugador es poco paciente


( 3/4), prefiere la sucesion mti a la sucesion nit . De forma similar, observemos
que si el jugador valora igual pagos presentes y futuros (criterio de lmite de los
promedios) la sucesion nit es preferida a la mit . Es decir, el criterio de lmite de los
promedios favorece la sucesion que otorgue mayores beneficios de largo plazo, aunque
en el corto plazo no sea demasiado favorable.
M
Ejemplo 41.
Consideremos las sucesiones de pagos, para t = 1, 2, . . . ,
hti

1
= t,
3

jit

t

y determinemos que sucesion es preferida con base en los criterios de pagos descontados y lmite de los promedios.
Pagos descontados
Con este criterio, la sucesion {hti } genera los pagos
hi =

2
3
+ 2 + 3 + 4 + ...
3 3
3
3

luego
hi =

1
3

mientras que la sucesion jit genera los pagos

1
ji = + +
... =
2 4 8 16
2+
De esta forma, la sucesion de pagos h ti es preferida a jit , independientemente del
valor de la tasa de descuento.

Juegos No-Cooperativos con Informacion Simetrica

115

Lmite de los Promedios


Con este criterio, el lmite del promedio de los pagos de cada una de las sucesiones
es
PT
k
k=1 hi
lm
=0
T
T
y
PT
k
k=1 ji
lm
=0
T
T
luego con este criterio las dos sucesiones son indiferentes para el jugador.
Antes de continuar, vale la pena aclarar un aspecto relacionado con los criterios de
valoracion de pagos: estos no son susceptibles de ser elegidos de forma estrategica
entre los agentes con el fin de inducir cierto resultado del juego. Estos criterios son
tomados de manera exogena por cada jugador de acuerdo con factores historicos,
polticos, religiosos o cualquier otro que incida en la importancia que este le asigna
al futuro con respecto al presente. Asumimos ademas que el criterio de valoracion
de pagos de los jugadores es de conocimiento com
un en el juego.
M
Una vez sabemos como valorar los pagos futuros por parte de los jugadores, es necesario establecer ahora, de forma adecuada, el concepto de estrategia en un juego
repetido. Como en cualquier juego dinamico, una estrategia para el jugador i especifica un plan de accion completo ante cualquier contingencia en la que i pueda
encontrarse. En los juegos repetidos con informacion simetrica que estudiamos en
esta seccion, las contingencias a las que se puede enfrentar el jugador i en una etapa
t son todas las posibles sucesiones de acciones escogidas por los N jugadores hasta
la etapa t 1. Nos referiremos a estas sucesiones como las historias del juego.
Definici
on 22 (Historia del Juego).
Sea ak = (ak1 , ak2 , ..., akn ) el vector que indica la eleccion de los n jugadores en la
etapa k. La historia del juego en la etapa t se define como la sucesion de vectores
t
ht = {ak }t1
k=0 . El conjunto de todas las posibles historias {h }t=1 se denota por H.
As, podemos definir formalmente una estrategia en un juego repetido.
Definici
on 23 (Estrategia Pura en un Juego Repetido).
Para el jugador i en un juego repetido, una estrategia pura s i es una funcion que
asigna a cada historia ht una accion ai :
si : H A i

ht si (ht ) = ai
De forma similar, podemos definir una estrategia mixta.
Definici
on 24 (Estrategia Mixta en un Juego Repetido).
Una estrategia mixta del jugador i, ( i ), en un juego repetido, es una funcion que

116

Un Curso de Teora de Juegos Clasica

asigna una distribucion de probabilidad sobre el conjunto de estrategias puras, para


cada posible historia del juego
i : H (Ai )
ht i (ht )

Como un ejemplo sencillo de lo anterior, consideremos el juego del Dilema del Prisionero que presentamos nuevamente.
Figura 59: Dilema del Prisionero, otra vez
C

NC

-4,-4

0,-5

NC

-5,0

-1,-1

Aqu las estrategias del juego de estado son confesar (C) y no confesar (N C).
As, una estrategia factible, digamos para el jugador i, en el juego repetido infinitamente, sera no confesar en la primera etapa, y en las etapas posteriores no
confesar si en la etapa anterior el jugador j eligio no confesar, y confesar si en
la etapa anterior el jugador j eligio confesar. Otra estrategia podra ser: elegir en
la primera etapa no confesar y seguir eligiendo no confesar hasta tanto el resultado de la etapa anterior haya sido (no confesar, no confesar); en caso contrario,
elegir confesar.
El hecho a destacar de las dos estrategias brevemente enunciadas es que, en un
juego repetido, las estrategias escogidas por los jugadores al inicio del juego indican
que accion debe elegirse ante cualquier posible historia del mismo. De esta forma,
puede decirse que cada jugador esta pre-programado para seguir una regla de comportamiento de acuerdo al desarrollo del juego, de tal manera que solo es necesario
saber que ha ocurrido hasta cierta etapa, para determinar inmediatamente la accion
a ser elegida en la etapa siguiente. Pasamos ahora a definir las funcion de pago.
Definici
on 25. (Funci
on de Pago en un Juego Repetido)
La funci
on de pago para cada jugador i N es
gi : H A R
que toma la forma gi [(st (ht ))]
t=0 = V (ui ), donde V viene dada de acuerdo con el
criterio de valoracion de pagos que se elija.

Juegos No-Cooperativos con Informacion Simetrica

A.

117

Juegos Repetidos Infinitamente

Llegamos, entonces, a la definicion central de esta seccion.


Definici
on 26. (Juego Repetido Infinitamente)
Un juego repetido infinitamente es un juego donde N = 1, 2, ..., n es el conjunto que
indiza a los jugadores, Si es el conjunto de estrategias para el jugador i, y g i es la
funcion de pagos del jugador i N asociada al criterio de valoracion elegido.
A continuacion presentamos una serie de ejemplos en los que algunos de los juegos
que hemos visto se repiten infinitamente; aparte de esto aprovechamos para definir
e ilustrar algunas de las estrategias mas conocidas en los juegos repetidos.
a. Estrategia del gatillo
De forma sencilla, esta estrategia establece cooperacion hasta tanto ambos jugadores hayan cooperado, pero a partir de cualquier desviaci
on de la cooperaci
on,
no volver a cooperar. En el contexto del dilema del prisionero nos referimos a cooperacion como la accion no confesar (NC), ya que genera los mayores pagos, siendo
estrictamente dominada para ambos jugadores. Formalmente podemos establecer
esta estrategia de la siguiente manera:
- ai1 = N C, para todo i
- si aitk = N C, para todo k = 1, 2.....t 1, entonces a it = N C
- si aitk 6= N C para alg
un i, para alg
un k, entonces a it = C
Ejemplo 42 (Estrategia del gatillo en el Dilema del Prisionero).
Consideremos el juego repetido en el que el juego de estado descrito por la figura 60 se
juega infinitas veces con el criterio de valoracion de pagos descontados donde la tasa
de descuento es exogena y com
un (0, 1). Analicemos este juego asumiendo que
ambos jugadores siguen estrategias del gatillo, y mostremos que seguir esta estrategia
constituye un equilibrio de Nash perfecto en subjuegos y que la cooperacion (no
confesar, no confesar) puede hacer parte de tal equilibrio si es suficientemente
cercano a 1. Para esto analicemos los posibles tipos de subjuegos a los que se enfrenta
un jugador i en este juego; estos pueden ser clasificados en dos grandes categoras:
los que provienen de la mutua cooperacion (N C, N C) y los que provienen de la
defeccion (C) de al menos uno de los jugadores. En este u
ltimo caso, el pago que
recibe el jugador que no confeso en la etapa en que su oponente se desvio es -5; si
contin
ua no-confesando, sus pagos en cada una de las etapas seran de -5 debido a que,
como su oponente sigue la estrategia del gatillo en lo que sigue del juego, entonces
elige C. Si sigue la estrategia del gatillo, y en adelante confiesa, su pago en cada
etapa sera -1. Claramente, en este tipo de subjuegos es mejor seguir la estrategia
del gatillo que no hacerlo. Consideremos ahora los subjuegos que provienen de la

118

Un Curso de Teora de Juegos Clasica

cooperacion de ambos agentes; el pago por desviarse de la cooperacion vendra dado


por:
4
C = 0 + (4) + (4) 2 + (4) 3 + ... =
1
mientras que el pago por continuar cooperando, dado que el otro jugador tambien
sigue la estrategia del gatillo, es:
N C = 1 + (1) + (1) 2 + (1) 3 + ... =

1
1

Podemos comparar estas dos series de pagos para determinar cuando es mejor cooperar que no hacerlo, es decir, cuando
N C =

1
4

= C
1
1

Despejando, es facil mostrar que siempre y cuando 1/4 resulta mejor no confesar que hacerlo en el juego repetido infinitamente cuando ambos jugadores siguen
estrategias del gatillo.
Analicemos ahora este mismo juego con el criterio de lmite de los promedios. Cuando nos encontramos en un subjuego que proviene de la no cooperacion, continuar no
confesando genera pagos de -5, luego el lmite de los promedios es tambien -5, mientras que seguir la estrategia del gatillo genera como lmite -1. As, al igual que antes,
es mejor seguir la estrategia en este tipo de subjuegos. Analicemos ahora que ocurre
para subjuegos que provienen de la mutua cooperacion: desviarse de la estrategia
genera la sucesion de pagos:
t
= (0, 4, 4, 4, ...)
D

y as
lm

PT

k=1 (4)

= 4

Mientras que continuar con la estrategia genera la sucesion de pagos


t
E
= (1, 1, 1, 1, ...)

as
lm

PT

k=1 (1)

= 1

Luego para un jugador que valore los pagos de acuerdo con el criterio de lmite de
los promedios, siempre sera mejor seguir la estrategia del gatillo que desviarse.
Un punto importante aqu es que la cooperacion entre ambos en el dilema del prisionero (que no es equilibrio de Nash en el juego de un solo tiro) surge como equilibrio
de Nash (perfecto en subjuegos) cuando la interaccion se repite una y otra vez.

Juegos No-Cooperativos con Informacion Simetrica

119

Notemos que esta cooperacion se alcanza de forma mas facil con agentes que valoren
de igual forma el presente y el futuro, que con agentes que den mayor importancia
al presente, ya que aquellos tendran pocos incentivos a desviarse de la cooperacion
motivados por los beneficios de corto plazo.
M
Ejemplo 43 (estrategia del gatillo en halcon y paloma).
Consideremos una estrategia del gatillo para el juego de Halcon y Paloma, que
presentamos en la figura 60, en el que cada jugador elige su accion P hasta tanto
ambos hayan elegido en la etapa anterior P . En caso de cualquier desviacion de
P , empiezan a coordinarse alternadamente en cada uno de los equilibrios de Nash
puros, digamos, empezando en el que favorece al jugador 1.
Figura 60: Halcon y Paloma
H

-1,-1

4,0

0,4

2,2

El pago por seguir la estrategia es


P =

2
1

mientras que el pago por desviarse genera los siguientes pagos:


D = 4 + 0 + 4 2 + 0 3 + 4 4 + . . .
que puede expresarse como
D =

4
4
=
(1 )(1 + )
1 2

Por lo tanto, siempre es mejor desviarse de la estrategia del gatillo en subjuegos que
provienen de la cooperacion de ambos jugadores (P, P ). Desde luego, en subjuegos
que provienen de (H, H), es mejor tambien desviarse. Notemos, sin embargo, que de
acuerdo con el criterio de lmite de los promedios, un jugador sera indiferente entre
seguir la estrategia y no hacerlo, ya que sus pagos promedio, en el lmite, son iguales
a 2 en ambos casos.
M
Ejemplo 44 (estrategia del gatillo en el juego del gallina).
Consideremos ahora el juego del gallina repetido infinitamente bajo estrategias del
gatillo para ambos jugadores:

120

Un Curso de Teora de Juegos Clasica


C

-5,-5

2,0

0,2

1,1

De forma similar al caso anterior, podemos definir una estrategia del gatillo como
jugar Q si en la etapa anterior ambos jugaron Q; en caso contrario, elegir alternadamente cada uno de los equilibrios de Nash puros.
De acuerdo con el criterio de pagos descontados, el pago por seguir la estrategia es
Q =

1
1

mientras que el pago por desviarse es


D =

2
1
=
(1 )(1 + )
1 2

As, como (0, 1) tenemos que siempre


2
2
1
>
2
1 (1 )(1 + )
(1 )

luego seguir la estrategia del gatillo no constituye un equilibrio de Nash perfecto en


subjuegos en el juego de el gallina con el criterio de pagos descontados, ya que
siempre sera mejor desviarse de la cooperacion.
Al igual que en el caso anterior, notemos que bajo el criterio de lmite de los promedios, las dos sucesiones de pagos son equivalentes, luego no hay incentivos unilaterales
a desviarse, de parte de ninguno de los jugadores. Notemos que para subjuegos que
provienen de (C, C) siempre es mejor seguir la estrategia (alternar entre (C, Q) y
(Q, C)) que seguir jugando C. As, con el criterio de lmite de los promedios, la
estrategia del gatillo s constituye un equilibrio de Nash perfecto en subjuegos para
el juego del gallina.
M
Ejemplo 45 (estrategia del gatillo para la batalla de los sexos).
Consideremos nuevamente el juego batalla de los sexos, cuya matriz de pagos esta dada por la bimatriz de la figura 61.
Establezcamos la siguiente estrategia para cada uno de los jugadores: jugar F en las
etapas impares y T en las etapas pares, siempre y cuando el otro jugador haya hecho
lo mismo. En caso contrario jugar la estrategia mixta que asigna a F y T probabilidades de 2/3 y 1/3 respectivamente para el jugador 1, y 1/3 y 2/3 respectivamente
para el jugador 2. Para verificar que esta estrategia constituye un equilibrio de Nash
perfecto en subjuegos, encontremos los beneficios por seguirla y por desviarse de

Juegos No-Cooperativos con Informacion Simetrica


Figura 61: Batalla de los sexos
F

2,1

0,0

0,0

1,2

ella. La utilidad del jugador 1 por seguir la estrategia es:


US1 = 2 + 1 + 212 + 13 + 214 + ...
y entonces
US1 =

2 1
2 1
=
(1 1 )(1 + 1 )
1 12

De forma similar, para el jugador 2 tenemos:


US2 = 1 + 21 + 12 + 213 + 14 + ...
y entonces
US2 =

1 + 22
1 22

Ahora encontremos la utilidad de 1 por desviarse:


      
   
  
2
2
1
2
1
1
1
= 0 + 1 2
+0
+ 0
+1
+ ...
UD
3
3
3
3
3
3
21
2 2 2 3
1
UD
=
+ 1 + 1 + ...
3
3
3
luego
1
UD
=

21
3(1 1 )

Con un procedimiento similar, la utilidad del jugador 2 por desviarse es:


2
UD
=

22
3(1 2 )

Por lo tanto, para el jugador 1 es mejor seguir la estrategia que desviarse si


2 1
21

2
3(1 1 )
1 1

121

122

Un Curso de Teora de Juegos Clasica

es decir, si 1 0, 866.
De forma similar, para el jugador 2 es mejor seguir la estrategia que desviarse si
1 + 22
22

2
3(1 2 )
1 2
es decir, si
2 0, 4361
Notemos que la tasa de descuento que garantiza la cooperacion es mayor para aquel
jugador que se vea mas beneficiado en la etapa cero (en este caso el jugador 1). Es
decir, una vez se han coordinado en el equilibrio que lo favorece entonces, a menos
que su tasa de descuento sea suficientemente alta, este tendra incentivos a jugar
su estrategia mixta en cada perodo en vez de alternar la escogencia de sus dos
estrategias puras.
M
b. Estrategia Garrote y Zanahoria
Esta estrategia consiste en que, seguido a cada desviaci
on de la cooperaci
on de parte
de alguno de los jugadores, se inicia una etapa de mutua penalizaci
on; terminada
esta etapa, los jugadores vuelven a cooperar hasta tanto no se presente alguna nueva
desviaci
on.
Es decir, despues de cada defeccion, ambos jugadores escogeran por alg
un tiempo
(digamos, una etapa) la accion que les reporte menores pagos conjuntos como se
nal
de castigo, con el animo de que puedan volver a un perodo (posiblemente infinito)
de cooperacion. Notemos que, con respecto a la estrategia del gatillo, la estrategia
del garrote y la zanahoria presenta una menor retaliacion ya que, si bien castiga
cualquier defeccion, el perodo de castigo no es de duracion infinita como en aquella,
sino que despues de cierto plazo se puede volver a la cooperacion. Con relacion a
los ejemplos que comentamos en la introduccion de la seccion, podra decirse que
una estrategia de este tipo es mas com
un en un grupo de compa
neros de trabajo,
mientras que la estrategia del gatillo caracterizara a los pases con capacidad de
iniciar una guerra nuclear. Ilustremos con un ejemplo la estrategia del garrote y la
zanahoria.
Ejemplo 46 (garrote y zanahoria para el ejemplo de halcon y paloma).
Consideremos el juego halcon y paloma asumiendo que se repite infinitamente. Podemos establecer formalmente una estrategia de garrote y zanahoria para cada jugador i de la siguiente forma:
- ai1 = P
- Si ait1 = P , para todo i, o ait1 = H, para todo i, entonces ait = P

Juegos No-Cooperativos con Informacion Simetrica

123

- Si ait1 6= ajt1 para alg


un i 6= j, entonces ait = H
Mostremos que el resultado (P, P ) puede alcanzarse como parte de un equilibrio de
Nash perfecto en subjuegos en el juego repetido infinitamente. Para esto necesitamos
mostrar que tal estrategia es de equilibrio para todos los subjuegos posibles del juego
repetido. De esta forma, identifiquemos los posibles tipos de subjuegos que pueden
aparecer:
1. Subjuegos que provienen de la mutua cooperacion (P, P )
2. Subjuegos que provienen de la mutua penalizacion (H, H)
3. Subjuegos que provienen de una etapa en la que uno de los jugadores coopero y
el otro penalizo (H, P ) y (P, H)
Analicemos el primer caso; si se proviene de una etapa de mutua cooperacion (P, P ),
seguir la estrategia equivale a jugar P nuevamente, mientras que desviarse corresponde a jugar H. As, si un jugador decide desviarse por una sola vez, recibe un
pago de 4 pero, seguido a esto, llegara la etapa de penalizacion en la que cada uno
gana -1, y posteriormente regresaran a la fase de cooperacion en donde los pagos,
en cada etapa, son nuevamente de 2 para cada jugador. As, con el criterio de pagos
descontados, sera mejor cooperar que desviarse si, y solo si,
2 + 2 + 2 2 + ... 4 + 2 2 + 2 3 + ...,
es decir, si, y solo si, 3 2 5 + 2 0, lo que ocurre siempre que 2/3.
Para el segundo caso (subjuegos que provienen de la etapa de penalizacion) la estrategia indica cooperar, generando pagos de 2 para cada jugador, mientras que
desviarse genera un pago de 4 en la etapa en que se genera la desviacion, -1 en la
etapa siguiente y, a continuacion, 2. Luego el valor de que sostiene cooperar
como un resultado de equilibrio es el mismo del caso anterior.
Para el u
ltimo caso, subjuegos que provienen de una etapa en la que solo uno de los
jugadores coopero, la estrategia indica entrar en la etapa de penalizacion generandose
un pago de -1 para cada jugador, y posteriormente entrar en la etapa de cooperacion
con pagos de 2. Desviarse de la estrategia equivale a ganar cero en tal etapa, y
retrasar el inicio de la penalizacion un perodo. As, para cualquier valor de se
sostiene la estrategia de garrote y la zanahoria en este tipo de subjuegos. Tomando
los tres casos, encontramos que se alcanza la cooperacion en el juego de halcon y
paloma repetido infinitamente con jugadores que adoptan la estrategia de garrote y
zanahoria como un equilibrio de Nash perfecto en subjuegos, siempre que 2/3.
Estudiemos ahora que pasara si los jugadores valoraran sus pagos futuros de acuerdo
con el criterio de lmite de los promedios. Consideremos entonces los subjuegos que
provienen de la mutua cooperacion (P, P ). En tal caso, seguir la estrategia garantiza
un pago de 2 en cada etapa; as el lmite de los promedios es 2. Desviarse, por su

124

Un Curso de Teora de Juegos Clasica

parte, genera un pago de 4 en la primera etapa, -1 en la segunda y, a partir de ah,


2 nuevamente. De esta forma el lmite de los pagos promedio, nuevamente, es 2,
con lo cual cada jugador sera indiferente entre seguir la estrategia o desviarse. Es
decir, la ganancia momentanea que se obtiene por desviarse no es suficientemente
atractiva, ya que en el largo plazo los pagos promedios son iguales.
M
Ejemplo 47 (garrote y zanahoria para el dilema del prisionero).
Consideremos los subjuegos que provienen de la mutua cooperacion. De acuerdo con
el criterio de pagos descontados, seguir la estrategia garrote y zanahoria representa
un pago de -1/1-, mientras que desviarse representa un pago de (4 + 3 2 )/(1
), correspondiente a un pago de 0 en la primera etapa, -4 en la segunda y -1 en
adelante, indefinidamente.
As, es mejor seguir la estrategia en estos subjuegos si

es decir, si

4 + 3 2
1
>
1
1

1
3

Para subjuegos que provienen de la no cooperacion de al menos uno de los jugadores,


claramente resultara mejor seguir la estrategia garrote y zanahoria que desviarse
y obtener, persistentemente, menores pagos. As, la estrategia garrote y zanahoria
constituye un equilibrio de Nash perfecto en subjuegos para el dilema del prisionero
con el criterio de pagos descontados, siempre que 2/3.
Al igual que con la estrategia del gatillo, notemos que con el criterio de lmite de
los promedios, la estrategia garrote y zanahoria constituye un equilibrio de Nash
perfecto en subjuegos ya que los pagos promedio por seguir la estrategia como por
desviarse (en el lmite) son iguales.
Observemos que la tasa de descuento que garantiza la cooperacion en el dilema del
prisionero bajo la estrategia garrote y zanahoria es mayor al que se requera con
la estrategia del gatillo. Esto evidencia que la amenaza de un castigo mayor, como
el suministrado por la estrategia del gatillo, es suficiente para generar cooperacion,
mientras que amenazas mas debiles, como la del garrote y la zanahoria, requieren de
una mayor paciencia de los jugadores para garantizar la cooperacion. Esto nos lleva
a pensar que es mas difcil alcanzar la cooperacion en un escenario de guerra fra
hacia una confrontacion nuclear que entre un par de compa
neros de oficina, dadas
las represalias que conlleva la defeccion en cada uno de los casos.
M
c. Estrategia del ojo por ojo (tit por tat)
La estrategia ojo por ojo, aunque en varias ocasiones ha resultado ser la mas

Juegos No-Cooperativos con Informacion Simetrica

125

efectiva para jugadores que se enfrentan a escenarios de juegos repetidos 29 , es, muy
probablemente, la mas simple de todas. La estrategia ojo por ojo indica iniciar
cooperando y, a partir de la segunda etapa, jugar la accion que el otro jugador
tomo en la etapa anterior. Formalmente podemos establecer:
- ai1 = C
- ait = ajt1 para todo t > 1
donde C representa la accion cooperativa i, j = 1, 2.
Ejemplo 48 (tit por tat para el dilema del prisionero).
Como esta estrategia indica que se debe iniciar cooperando, los pagos de seguir la
estrategia en el comienzo del juego y en los subjuegos que provienen de la cooperacion
vienen dados por
1
E =
1
Por su parte, los pagos por desviarse de la estrategia vienen dados por
D =

5
5
=
(1 )(1 + )
1 2

As, es mejor seguir la estrategia que desviarse si 1/4; sin embargo, tit por tat
no es perfecta en subjuegos. Para ver esto, supongamos que en la primera etapa el
jugador 2 se desva. Los pagos para el jugador 1 quedan de la siguiente forma:
5
5
=
(1 )(1 + )
1 2

Pero entonces, si el jugador 1 se desva y perdona la desviacion de 2 en la primera


etapa, obtiene

1
luego es mejor desviarse si 1,79; pero como (0, 1), siempre es mejor desviarse.
M
Ejemplo 49 (tit por tat para el juego del gallina).
Modifiquemos los pagos del juego del gallina y supongamos que se repite infinitamente. El juego de estado viene dado por la matriz de pagos de la figura 62. Los
pagos se han modificado ligeramente, aumentandose los que reciben si ambos deciden
detenerse, y el pago del que decide seguir cuando el otro se detiene.
Si ambos jugadores siguen la estrategia del tit por tat, empezaran jugando (Q, Q)
y continuaran haciendolo indefinidamente; luego sus pagos seran 4/(1 ). Si un
jugador, digamos el 1, decide desviarse de la estrategia por una sola etapa, entonces,
29

M
as adelante veremos algunos resultados del torneo de computadores de Axelrod [1984] que
confirman esto.

126

Un Curso de Teora de Juegos Clasica


Figura 62: Juego del gallina
C

-5,-5

6,0

0,6

4,4

en la etapa de la desviacion el resultado sera (C, Q), generandole un pago de 6,


pero esto hace que los resultados siguientes sean (Q, C), (C, Q), (Q, C), ... alternando
pagos de 6 y 0 para cada jugador. De esta forma, sera mejor seguir la estrategia del
tit por tat que desviarse siempre y cuando
4
6 + 6 2 + 6 4 + ...
1
es decir, siempre que
6
4

1
1 2
lo cual es cierto siempre que 1/2. Sin embargo, la estrategia del tit por tat no
es perfecta en subjuegos. Para ver esto, supongamos que en una etapa cualquiera,
digamos la primera, un jugador, digamos el 2, se desva por error (juega C). Si
esto es as, de acuerdo con la estrategia, el jugador 1 debera responder jugando C, y
el 2 jugando Q, lo cual generara una sucesion de resultados (Q, C), (C, Q), (Q, C), ...
con pagos de 6/1 2 para el jugador 1. Si este jugador se desva de la estrategia
y perdona al jugador 2 por su error, ganara cero en la primera etapa; pero a
partir de all ganara 4, luego su pago sera 4/1 .
De esta forma es mejor desviarse de la estrategia y perdonar el error de la primera
etapa siempre que
4
6

(1 )
1 2
es decir, siempre que 1/2.
Notemos ademas que para los subjuegos que empiezan en (C, C) es mejor desviarse
para cualquier valor de ya que es mejor alternar pagos de 0 y 6 que perder siempre 5.
As, podemos concluir que la estrategia del tit por tat no es perfecta en subjuegos.
No obstante, tal estrategia tiene caractersticas importantes, lo cual se hizo evidente
por primera vez en el torneo de computadores de Axelrod [1984] que comentamos
brevemente a continuacion.

Juegos No-Cooperativos con Informacion Simetrica

127

Sobre el Torneo Computarizado del dilema del prisionero


de Axelrod [1984]
A mediados de los a
nos 1980 el profesor de ciencia poltica y poltica p
ublica de
la Universidad de Michigan, Robert Axelrod, convoco a investigadores de varias
disciplinas para que dise
naran programas de computador que jugaran repetidamente
el dilema del prisionero a traves del metodo de liga, es decir, cada uno de los
participantes era enfrentado una vez con cada uno de los demas concursantes y con
un programa aleatorio. Se especificaba como objetivo de cada uno de ellos hacer
que la suma de los pagos obtenidos en todos los juegos fuera la mas alta posible.
Habiendo especificado esto, se realizo un primer torneo con 14 concursantes. Los
resultados fueron publicados y se convoco a un segundo torneo con 62 concursantes,
quienes ya conocan los resultados anteriores. Un resultado importante que se pudo
extraer de los dos torneos fue que la estrategia ojo por ojo (tit por tat) fue
la vencedora en ambos casos. Con base en los enfrentamientos particulares entre
pares de estrategias, y los resultados generales del torneo, Axelrod se
nala algunas
de las caractersticas que haban permitido a la estrategia tit por tat ubicarse en
el puesto mas alto y a otras alcanzar puntuaciones tambien altas. A continuacion
mencionamos tales caractersticas y un breve comentario respecto a cada una de
ellas.
a. No ser envidioso: esto quiere decir no cambiar cierto comportamiento porque
el oponente este ganando mas, sino comparar las ganancias individuales con las
propias ganancias potenciales (no con las del otro). A este respecto se muestra
que tit por tat no gano en ninguna sola partida; sus puntuaciones altas fueron
conseguidas a traves de comportamientos que permitan que ambas estrategias
puntuaran alto.
b. No ser el primero en no cooperar : un resultado interesante es que todas las estrategias que queran explotar a sus rivales, es decir, que queran ser la primera
en no cooperar, se ubicaron en la parte inferior de la tabla de puntuaciones.
As, una conclusion importante es la posicion desfavorable que se alcanza por
iniciar una guerra.
c. Devolver tanto la cooperaci
on como la defecci
on: simplemente, castigar defecciones del rival y premiar actitudes cooperativas. Penalizaciones demasiado
largas, como la de la estrategia del gatillo, son muy costosas.
d. No creerse demasiado inteligente: reglas claras y sencillas son de un mejor
entendimiento para un rival, y esto promueve la cooperacion a traves de la
confianza.
Claramente la estrategia tit por tat satisface las condiciones de Axelrod: es bastante sencilla, nunca deja ofensa sin castigo, nunca busca el enfrentamiento, no
guarda rencor por mucho tiempo y esta dispuesta a restaurar la cooperacion. Sus
virtudes principales son, entonces, promover la cooperacion y no dejarse explotar.

128

Un Curso de Teora de Juegos Clasica

Sin embargo, cuando tit por tat se aplica a problemas reales especficos, los errores de percepcion pueden ser demasiado costosos. Dixit y Nalebuff [1991], por
ejemplo, comentan el caso de cuando en 1987 Estados Unidos responden al espionaje ruso en su embajada en Mosc
u reduciendo el n
umero de diplomaticos sovieticos
autorizados para trabajar en Estados Unidos. Seguido a esto, los sovieticos, por
su parte, responden retirando el personal nativo contratado en la embajada sovietica en Washington. El resultado de tales acciones fue que, para ambos pases,
se dificulto sustancialmente el desarrollo de sus labores diplomaticas. Desde esta
perspectiva, una vez desencadenada la serie de penalizaciones, sera deseable para
ambos que al menos una de las partes, siendo un poco indulgente, se desviara de su
estrategia e iniciara un perodo de cooperacion. Esto evidencia el hecho de que la
estrategia tit por tat no es perfecta en subjuegos. Finalmente, notemos que la serie de penalizaciones en el ejemplo mencionado pudo haberse desatado simplemente
por un error de percepcion en cuanto a la accion de una de las partes; sobre esto
profundizaremos en el siguiente captulo.

B.

Teoremas Populares (Folk Theorems)

Como hemos visto en lo corrido de esta seccion, parece razonable que los pagos
promedio que obtienen los jugadores que enfrentan juegos repetidos infinitos en
algunos equilibrios de Nash perfectos en subjuegos son por lo menos iguales a los
que obtendran en los equilibrios de Nash del juego de estado correspondiente.
Recordemos que en algunos de los ejemplos presentados, con el criterios de valoracion
de lmite de los promedios siempre era mejor optar por la eleccion cooperativa que
por una que generara beneficios superiores en el corto plazo pero que penalizaba en
el mediano y/o largo plazo. De forma similar, vimos que con el criterio de valoracion
de pagos descontados, siempre que la tasa de descuento fuera suficientemente alta,
era preferible cooperar que no hacerlo.
La presentacion heurstica que acabamos de hacer corresponde a lo que se conoce
en la literatura de teora de juegos como teoremas populares, por haberse hecho una
serie de aproximaciones informales a estos resultados, antes de que se presentara una
demostracion formal explcita. La intuicion (y la tradicion) sugeran que en juegos
repetidos infinitamente, cada jugador podra alcanzar cualquier pago promedio que
no fuera menor a aquel que obtendra en el juego de una sola etapa si su objetivo
fuera minimizar la perdida que su oponente buscara infligirle, es decir, se podra
alcanzar cualquier pago promedio mayor o igual que el valor minmax del juego.
Teorema 13 (Teorema Popular para el Criterio de Lmite de los Promedios).
Sea vi el valor minmax del jugador i en el juego = (N, (C i )iN , (ui )iN ). Todo
perfil de pagos w con wi vi para todo i, es un perfil de pagos de equilibrio de Nash
perfecto en subjuegos del juego repetido infinitamente con el criterio de valoraci
on
de pagos lmite de los promedios.

129

Juegos No-Cooperativos con Informacion Simetrica


Demostraci
on.
Ver Aumann y Maschler [1995].

Teorema 14 (Teorema Popular para el Criterio de Pagos Descontados).


Sea vi el valor minmax del jugador i en el juego = (N, (C i )iN , (ui )iN ). Para todo
perfil de pagos w con wi vi para todo i, existe un n
umero (0, 1) y un n
umero
 > 0, tal que para todo > el juego repetido infinitamente con el criterio de
pagos descontados tiene un equilibrio de Nash perfecto en subjuegos con pagos w 0
que satisface ||w 0 w|| < .
Demostraci
on.
Ver Aumann y Maschler [1995].
Una representacion grafica de los dos teoremas anteriores para el juego del dilema
del prisionero puede observarse en la figura 63.
Figura 63: Dilema del prisionero
(-5,-0)

u1
(-1,-1)

(-4,-4)
(0,-5)

u2
La envolvente convexa de los cuatro pagos correspondientes a las posibles combinaciones de las estrategias puras representa el conjunto de pagos factibles (en estrategias puras y mixtas). Observemos que el valor minmax en este juego es -4 para
cada jugador. As, de acuerdo con los teoremas populares, todos los perfiles de pago
promedio factibles, a la derecha y arriba de (-4,-4) (region sombreada), pueden ser
alcanzados en equilibrios del juego repetido infinitamente.

C.

Juegos Repetidos Finitamente

Consideremos una situacion en la que dos jugadores deben enfrentar el mismo juego
un n
umero finito de veces y, desde el inicio, ambos tienen conocimiento de este
n
umero. Al igual que antes, asumamos que, de forma previa a cada etapa, cada
jugador conoce las decisiones de su oponente y recibe los pagos correspondientes a
la u
ltima interaccion.

130

Un Curso de Teora de Juegos Clasica

Como hablamos de un juego con informacion simetrica, podemos aproximarnos a su


analisis con el metodo de induccion hacia atras. Con el fin de ilustrar este metodo
para la clase de juegos en cuestion, consideremos nuevamente el juego del dilema del
prisionero, ahora en un contexto en el que los dos jugadores saben que enfrentaran
el mismo juego, digamos, 20 veces.
Empezando en la u
ltima etapa, ambos jugadores saben que la combinacion de estrategias que predeciblemente se jugara es la del equilibrio de Nash del juego de
estado: como no hay una etapa futura, cada jugador observa que no cooperar
domina a cooperar, y act
ua en consecuencia, independientemente de la historia
del juego. En la pen
ultima etapa, los dos jugadores, sabiendo lo que haran en la etapa
20, perciben que, dado que su eleccion en esta etapa no afecta la eleccion en la u
ltima
etapa, act
uan egostamente y eligen nuevamente la combinacion correspondiente al
equilibrio de Nash del juego de estado.
Siguiendo con el mismo argumento hasta la etapa inicial, encontramos que el u
nico
equilibrio de Nash del juego repetido finitamente consiste en jugar, en cada una de
las etapas, la combinacion de estrategias de equilibrio de Nash del juego de estado.
Desde luego, en tanto el n
umero de repeticiones que deben enfrentar los jugadores
se hace mas grande, este resultado, predicho por el concepto de equilibrio de Nash
perfecto en subjuegos, se vuelve cada vez menos plausible. En general, ocurre algo
similar a lo que vimos en la seccion anterior con el juego del ciempies. Esto es, que
en experimentos controlados se observa alg
un grado de cooperacion en las etapas
iniciales e intermedias, que tiende a atenuarse conforme el final del juego se aproxima.
Al igual que en aquel ejemplo, una posible explicacion de estos comportamientos
este en la incompletitud de la informacion acerca de los pagos del oponente. Como
dijimos, esto lo analizamos mas adelante. Sin embargo, otra posible explicacion,
planteada por el teorico en juegos Ariel Rubinstein (Osborne y Rubinstein [1994])
esta en el papel que juega la u
ltima etapa en la toma de decisiones de los jugadores en
cada una de las etapas. As, si estos perciben la u
ltima etapa suficientemente lejos (y
esto puede ser incluso 10 o 20 etapas), esta no afecta el comportamiento presente. Por
lo tanto, para hablar de la eleccion de los jugadores en ese momento, resultara mas
pertinente recurrir a herramientas de los juegos repetidos infinitamente que a los de
horizonte finito. Sin embargo, si el final del juego se acerca, los jugadores lo perciben
y esta u
ltima etapa, entonces, incide de forma importante en el comportamiento
presente. En tal contexto resultara pertinente analizar el caso como un juego de
horizonte finito. Este argumento explicara por que en los experimentos se percibe
cierta cooperacion al inicio del juego y conforme este avanza, aquella desaparece, tal
como dijimos arriba. Un problema que surge con este enfoque para la construccion
de un modelo teorico que se ajuste a lo encontrado en los experimentos controlados,
es como determinar el momento en el cual la u
ltima etapa pasa de no incidir en el
comportamiento de los jugadores, a efectivamente hacerlo.
Juegos repetidos finitamente con m
ultiples equilibrios
Consideremos ahora un juego similar al Dilema del Prisionero, e incluyamos una

Juegos No-Cooperativos con Informacion Simetrica

131

tercera estrategia para cada jugador. El juego se representa en la figura 64.


Figura 64: Juegos repetidos finitos con m
ultiples equilibrios
A2

B2

C2

A1

6,6

1,7

0,0

B1

7,1

2,2

0,0

C1

0,0

0,0

4,4

Observemos que este juego tiene dos equilibrios de Nash en estrategias puras (B 1 , B2 )
ltimo, en el sentido de Pareto, al primero. Asumamos
y (C1 , C2 ), dominando este u
ahora que los jugadores deben enfrentar este juego dos veces y esto lo saben desde
el comienzo. Por simplicidad, digamos que no hay descuento intertemporal. Recurriendo al metodo que acabamos de explicar, sabemos que en la u
ltima etapa los
jugadores se coordinan en un equilibrio de Nash; el problema ahora es que al haber
dos equilibrios en estrategias puras, no podemos decir con certeza cual de estos se
elegira. Los jugadores podran coordinar su eleccion en la u
ltima etapa de acuerdo
con las elecciones de la primera etapa. Por ejemplo, podran decidir coordinarse en
(C1 , C2 ) si en la primera etapa eligen (A1 , A2 ), que no constituye un equilibrio de
Nash del juego de estado y en cualquier otro caso coordinarse en (B 1 , B2 ). Desde
luego, esta regla es completamente ad hoc y podra especificarse cualquier otra. Sin
embargo, analicemos que pasara en tal caso. En principio, los pagos del juego de 2
etapas podran presentarse como aparece en la figura 65.
Figura 65: Pagos en las dos etapas
A2

B2

C2

A1

10,10

3,9

2,2

B1

9,3

4,4

2,2

C1

2,2

2,2

6,6

Aqu, por ejemplo, los pagos de la combinacion de estrategias (A 1 , A2 ) corresponden


a lo que obtendran los jugadores por elegir (A 1 , A2 ) en la etapa 1, y elegir (C1 , C2 ) en
la etapa 2. De forma similar, los pagos de la combinacion (B 1 , B2 ) corresponden a la
eleccion de (B1 , B2 ) en la primera etapa y (B1 , B2 ) en la segunda etapa. Observemos
que en este nuevo juego aparecen tres equilibrios de Nash en estrategias puras; los
mismos dos del juego de estado y un tercer equilibrio (A 1 , A2 ) en el que se elige la

132

Un Curso de Teora de Juegos Clasica

accion cooperativa por parte de ambos jugadores en la primera etapa. As hemos


especificado una regla que permite la cooperacion en juegos repetidos finitos, antes
de la u
ltima etapa.

D.

Una Nota sobre Cierta Evidencia Experimental

El dilema del prisionero


Es frecuente en la literatura sobre juegos repetidos que la tasa de descuento se asocie
a la probabilidad subjetiva p que cada individuo asigna a que el juego termine llegada una etapa dada. De esta forma, se ha interpretado el factor de descuento como
= 1 p. As, como una extension de los teoremas populares, se alcanzara la cooperacion siempre que la probabilidad de que el juego termine sea suficientemente baja
( cercano a 1). Para verificar esta hipotesis, Roth y Murnighan [1978] dise
naron
un dilema del prisionero en el que se alcanzaba la cooperacion en el juego repetido
siempre y cuando la probabilidad de que el juego continuara fuera mayor o igual a
1/3. Cada individuo participaba en tres juegos, con probabilidades de continuacion
de 0.1, 0.5 y 0.9 respectivamente. Se encontro que, aunque un significativo mayor
n
umero de elecciones cooperativas fueron realizadas en los dos escenarios con altas
probabilidades de continuacion que en el primer escenario, el porcentaje de las elecciones cooperativas no supero el 40 % ni siquiera en el u
ltimo de los escenarios.
Rubinstein [1999], por su parte, dise
no un juego repetido finitamente en el que cada
jugador deba participar en el dilema del prisionero durante 4 etapas. Cada participante deba elegir cooperar o no cooperar dependiendo de las dos elecciones
previas de su oponente. Alrededor del 40 % de las elecciones de la primera etapa
fueron cooperar. De igual forma, cerca del 40 % de las estrategias consistan en
jugar siempre no cooperar, 5 % consistan en cooperar siempre, y cerca del 10 %
eligieron tit por tat.
Batalla de los sexos
En la serie de juegos dise
nados por Rubinstein [1999] de la Batalla de los Sexos
repetido finitamente el porcentaje de individuos que eligio su accion menos favorable
en la primera etapa oscilo entre el 10 y el 28 %. De las estrategias seguidas por los
participantes, las mas destacadas, con su porcentaje de poblacion que las elige, son
las siguientes:
a. Escoger en la primera etapa la accion mas favorable y continuar jugando la
mejor-respuesta frente a la accion pasada del oponente (25 %).
b. Escoger la accion mas favorable a menos que, en el pasado, el oponente haya
jugado su accion mas favorable en una mayora estricta de perodos (10 %).

Juegos No-Cooperativos con Informacion Simetrica

E.

133

Aut
omatas

De acuerdo con lo que hemos estudiado, en un juego repetido cada jugador se preocupa por elegir la estrategia que le reporta los mayores pagos, utilizando el criterio
de valoracion seleccionado y sin enfrentar ninguna restriccion para hacerlo. Podemos decir que los agentes que hemos modelado son substantivamente racionales, en
el sentido de que su comportamiento es apropiado para alcanzar los objetivos propuestos dentro de los lmites establecidos por las condiciones y restricciones dadas. Es
claro, entonces, que no nos hemos preocupado por modelar aspectos procedimentales
de la toma de decisiones de los individuos. No obstante, esto no deja de ser un problema importante: para que un jugador pueda elegir la estrategia que le genera los
pagos mas altos, debe ser capaz de conocer las otras estrategias disponibles. Neyman
[1994] ilustra las complicaciones presentes en el trasfondo de esta cuestion:
Solo para escribir en forma decimal el n
umero de estrategias puras disponibles
a cada jugador en el dilema del prisionero repetido 100 veces, se requeriran mas dgitos que el n
umero de letras en todos los libros del
mundo.
Respecto a esta falencia de la teora existente hasta hace algunos a
nos, el mismo
Simon [1976] se
nalaba
. . . una urgente necesidad de extender el cuerpo establecido del analisis
economico, que ha estado ampliamente relacionado con la racionalidad
substantiva, para abarcar los aspectos procedimentales de la toma de
decisiones.
En 1986, Ariel Rubinstein explica el limitado impacto del trabajo de Simon en la
teora economica a causa de la dificultad presente en la incorporacion de tales aspectos procedimentales en modelos formales y la inexistencia de una teora natural u
nica
que los describiera (Rubinstein [1986]). La teora de automatas surge como una
posibilidad frente a estas limitaciones, y consiste en la construccion de modelos artificiales que capturan algunos elementos de lo que se ha dado en llamar racionalidad
acotada. El termino automata tiene la connotacion de que cada jugador elige una
m
aquina preprogramada para seguir cierta regla de comportamiento, donde la operacion de tales maquinas tiene un costo que el jugador esta interesado en minimizar.
As, se da un primer paso en la incorporacion de ciertos elementos procedimentales
en la toma de decisiones.
Los juegos repetidos son un terreno donde la teora de automatas encuentra una
interesante aplicacion. Al igual que antes, se asume que cada jugador esta interesado en alcanzar el mayor pago promedio, pero, para lograrlo elige una maquina
que juega por el; es decir, una maquina que elige una accion en cada perodo dependiendo de la historia del juego hasta ese momento. Una maquina consta de un
conjunto finito de estados (uno de los cuales corresponde a su estado inicial), una

134

Un Curso de Teora de Juegos Clasica

funci
on de resultados y una funci
on de transici
on. La funcion de resultados determina, para cada estado, la accion de la siguiente etapa, mientras que la funcion
de transicion asigna, para cada resultado, el estado de la maquina en el perodo
siguiente. As, por ejemplo, para la maquina encargada de jugar la estrategia del
gatillo en el dilema del prisionero, el conjunto de estados podra resumirse en cooperacion y no-cooperacion, refiriendose este u
ltimo a las tres combinaciones de
estrategias donde al menos uno de los jugadores decide no-cooperar. Para el estado
cooperacion, la funci
on de resultados asigna la accion cooperar, mientras que
para el estado no-cooperacion, asigna la accion no-cooperar. Por su parte, para
la combinacion de estrategias (cooperar, cooperar), la funci
on de transici
on asigna el
estado cooperacion, mientras que para cualquier otra combinacion de estrategias,
asigna el estado no-cooperacion.
Como dijimos, y a diferencia de lo presentado en los juegos repetidos, los jugadores no
solo tienen en cuenta los pagos que obtienen en el juego, sino tambien la complejidad
de la maquina que utilizan. Si bien se han desarrollado diferentes y sofisticadas medidas de complejidad, se asume, en principio, que la complejidad de una maquina se
determina por su n
umero de estados; as, en el ejemplo mencionado anteriormente,
decimos que la maquina tiene una complejidad igual a 2. Desde luego, cualquier
analisis sera sensible a la medida de la complejidad que se utilice; sin embargo, como la complejidad refleja las dificultades que enfrenta el jugador para llevar a cabo
su estrategia, tal sensibilidad es deseable ya que, en diferentes circunstancias, diferentes medidas pueden ser apropiadas. Ademas, como habamos dicho, cada jugador
persigue el pago mas alto pero esta interesado en minimizar la complejidad de la
maquina que utiliza para tal fin; es decir, prefiere utilizar m
aquinas con un reducido
n
umero de estados.
Un ejemplo de lo anterior es que en el dilema del prisionero hay una maquina que genera los mismos pagos que la que juega la estrategia del gatillo, pero tiene una menor
complejidad: aquella cuyo u
nico estado es cooperacion. Notemos que el estado nocooperacion solo se utiliza para disuadir la accion no-cooperativa del oponente; sin
embargo, tal estado no se alcanza en equilibrio. As, un jugador preferira esta u
ltima maquina que aquella con dos estados, ya que con cualquiera de esta consigue los
mismos pagos.
Una solucion para este tipo de juegos repetidos donde cada jugador debe escoger
una maquina, conocida como equilibrio semiperfecto, es un par de maquinas, una
para cada jugador, que, en cada etapa del juego, satisface lo siguiente:
i. Ning
un jugador puede alcanzar un pago mas alto cambiando unilateralmente
su maquina.
ii. Ning
un jugador puede reducir el n
umero de estados utilizado.
Algunos resultados que tenamos en los juegos repetidos convencionales (sin lmites
sobre la complejidad) se modifican si incluimos aspectos procedimentales en la toma

135

Juegos No-Cooperativos con Informacion Simetrica

de decisiones, como lo es la inclusion de maquinas de juego. Algunos de estos resultados son:


a. Habamos visto que en un dilema del prisionero repetido infinitamente, cualquier
vector de pagos resultante de la combinacion convexa de los pagos de las combinaciones posibles de estrategias puras por encima del valor minmax, podra
ser alcanzado como un equilibrio de Nash perfecto en subjuegos. Al considerar automatas con complejidad limitada, solo es posible alcanzar los pagos
correspondientes al equilibrio de Nash del juego de una sola etapa, y a la combinacion convexa de los pagos en las combinaciones de estrategias donde uno
de los jugadores coopera y el otro no, por encima del valor minmax del juego
(ver figura 66).
Figura 66: Dilema del prisionero jugado por automatas
(-5,-0)

u1
(-1,-1)
Pagos alcanzables
como ENPS

(-4,-4)
Pagos alcanzables en
equilibrios Semi-Perfectos

(0,-5)

u2
b. Se justifica la cooperacion en el dilema del prisionero repetido finitamente,
as como en otros juegos, sin desviarnos de la hipotesis de maximizacion de
la utilidad pero bajo el supuesto adicional de lmites (posiblemente grandes)
sobre la complejidad de las estrategias que cada jugador puede utilizar.

F.

Breve Comentario Final

Los equilibrios no cooperativos que hemos estudiado se han utilizado para explicar la
confianza y la cooperacion en escenarios polticos, economicos, biologicos y militares,
entre otros. En las aplicaciones de estos modelos, los analistas generalmente observan
que existe un equilibrio del juego repetido con las propiedades deseadas, y suponen
que el comportamiento observado correspondera a ese equilibrio. Esta aproximacion
(aunque fructfera en ocasiones) da origen a un problema a nivel teorico, ya que
estos juegos pueden tener muchos otros equilibrios. As, aunque los juegos repetidos
explican como la cooperacion, confianza o compromiso podran surgir, no predicen
que tales circunstancias necesariamente ocurriran. La pregunta natural resulta ser:
cual es la base para la idea generalizada de que ciertos equilibrios de un juego

136

Un Curso de Teora de Juegos Clasica

repetido sean particularmente razonables? Una explicacion se puede encontrar en


el hecho de que los efectos de reputacion modelan la idea de que los jugadores,
en un juego repetido, pueden tratar de desarrollar reputacion sobre su forma de
jugar. La intuicion aqu (Kreps y Wilson [1982], Milgrom y Roberts [1982]) es que
si un jugador elige siempre jugar de la misma forma, sus oponentes esperaran que el
juegue siempre en la misma forma, y ajustaran sus propias estrategias a esto. Con la
aproximacion de los efectos de la reputacion, la cuestion de por que ciertos equilibrios
parecen particularmente posibles es entonces si a alguno de los jugadores (o a todos)
les convendra desarrollar las reputaciones asociadas con equilibrios particulares. En
general, el conjunto de equilibrios de reputacion dependera de las creencias de los
jugadores acerca de sus oponentes. As, que implicaciones sobre las distribuciones a
priori tendran los efectos de reputacion? Los efectos de reputacion por s mismos (sin
fuertes restricciones sobre los a priori) no ayudan a explicar por que la confianza
y la cooperacion podran emerger en juegos de largo plazo con varios jugadores.
Algunos autores, por su parte, han tratado de explicar la emergencia de confianza
y cooperacion utilizando el concepto de estrategia evolutivamente estable.

Ejercicios 10.
1. Suponga que las interacciones al interior de una tribu indgena (Maya) pueden
ser descritas como una situacion tipo juego del gallina (con pagos de 4 si
en cada interaccion en parejas cada jugador coopera, 1 para el que coopera
cuando el otro no lo hace, 6 para este u
ltimo, y -3 en caso de que ninguno
coopere). Por otro lado, en otra tribu indgena (Tayrona), las interacciones
pueden ser descritas como una situacion tipo dilema del prisionero (con pagos
de 4 si ambos cooperan, 1 si no cooperan, 5 para el que no coopera cuando el
otro lo hace, y 0 para este u
ltimo). Como las interacciones se dan varias veces
cada da y no hay un u
ltimo perodo claramente especificado, ambos casos
pueden estudiarse como juegos repetidos infinitamente. Si en la tribu Maya
cada miembro sigue una estrategia del gatillo, mientras que cada miembro de la
tribu Tayrona sigue una estrategia garrote y zanahoria, en que tribu aparece
mas facil la cooperacion como un equilibrio de Nash perfecto en subjuegos?
Asuma que se utiliza el criterio de pagos descontados.
2. Considere los juegos de halcon y paloma y del gallina bajo los dos criterios
de valoracion de pagos, con estrategias del gatillo donde, en caso de defeccion
por parte de al menos uno de los jugadores, estos pasan indefinidamente al
equilibrio de Nash mixto. Determine si esta estrategia constituye un equilibrio
de Nash perfecto en subjuegos.
3. Considere una situacion en la que dos jugadores enfrentan el siguiente juego
dos veces, sabiendo esto de antemano. Establezca una regla para determinar la
eleccion de la segunda etapa que permita elegir (B 1 , B2 ) en la primera etapa.

137

Juegos No-Cooperativos con Informacion Simetrica

Recurra a la coordinacion en cada uno de los cuatro equilibrios de Nash en


estrategias puras del juego de estado en la construccion de esta regla.
A2

B2

C2

D2

E2

A1

2,2

6,1

0,0

0,0

0,0

B1

1,6

5,5

0,0

0,0

0,0

C1

0,0

0,0

4,4

0,0

0,0

D1

0,1

0,0

0,0

5,1

0,0

E1

0,0

0,0

0,0

0,0

1,5

4. Un juego en forma estrategica esta dado por la siguiente bimatriz:


A

5,9

5,7

-3,0

20,5

3,10

2,20

4,5

15,17

-4,1

10,3

2,2

0,-5

0,1

8,-2

6,4

10,0

a. Cuales son los equilibrios de Nash en estrategias puras de este juego?


b. Basado en estrategias puras, si el juego se repite T veces, existe un
equilibrio perfecto en subjuegos del juego finitamente repetido? Puede
dicha estrategia tener la estrategia pura (Y, D) con pagos realizados de
(15, 17) para parte del juego?
c. Basado en una estrategia del gatillo en el juego repetido infinitamente,
cual es el n
umero mnimo de periodos durante los cuales no se puede
escoger la estrategia pura (Y, D)?
d. Cuales son las cotas inferiores para el factor de descuento en la parte c
tal que la combinacion de estrategias del gatillo que se haya seleccionado
sea un equilibrio de Nash?
5. Corrobore los dos teoremas populares en cada uno de los siguientes juegos:
lanzar la moneda, batalla de los sexos, dilema del prisionero y el gallina.

Você também pode gostar