Você está na página 1de 3

Notas de clase de Teoría de Juegos - Marcela Eslava 32

3.5. Juegos Repetidos al infinito (G, ∞ ).

Denote (G) un juego estático tal que G = {S1,S2 ......SN ,u1,u2 } ⇒ (G,∞)es el juego en el que (G) es
repetido un número infinito de veces. El pago para le jugador (i) de este juego estaría dado por:


u i = ∑ δ t u it
t =0

Con los juegos repetidos de forma finita vimos que la naturaleza dinámica del juego permite generar
resultados que serían imposibles en el juego básico estático, en particular resultados que generan mayor
bienestar que el EN (ver ejemplo 3.7). Esta característica hace a los juegos repetidos interesantes. Sin
embargo, también vimos que tal mejora en el bienestar sólo es posible cuando hay más de un Equilibrio
de Nash en el juego básico. Cuando hay un sólo EN, el hecho de que llegue un periodo final en el cual
sólo ese EN es posible anula la posibilidad de premios y castigos en ese último periodo, y termina por
eliminar la posibilidad de coordinación fuera del EN en cualquier periodo.

¿Pero qué pasa si no hay periodo final (T → ∞)? ¿Será que en ese caso podemos lograr que se mejore el
bienestar social aún en un juego con Equilibrio de Nash único? ¿Será que si (T → ∞) podemos coordinar
los jugadores fuera de Equilibrio de Nash en todos los periodos?

La respuesta a ambas preguntas es sí, siempre y cuando se cumplan las siguientes condiciones:

1. Exista un posible castigo costoso por fallas de la coordinación y un premio atractivo por
coordinación.
2. Que ese premio y ese castigo sean creíbles.
3. δ Sea “suficientemente alto” (para que el futuro importe).

La importancia de estas condiciones se hace más clara con un ejemplo. Considere el Dilema de
Prisioneros repetido en infinitos periodos.

Ejemplo 3.8. Dilema del prisionero repetido al infinito.

Confesar No Confesar
Confesar (-6,-6) (-1,-10)
No Confesar (-10,-1) (-3,-3)

Tome la siguiente estrategia desencadenante que, de cumplirse, coordinaría a los jugadores fuera del EN
del juego estático en cada periodo:
⎧en t = 0 Jueguen ( N , N ).

Estrategia Desencadenante = ⎨ ⎧- Jueguen (N, N ) si en todo periodo anterior se jugó (N, N ).
⎪en t = 1 ⎨- Jueguen (C, C ) en caso contrario.
⎩ ⎩

Veamos si hay condiciones bajo las cuales la estrategia desencadenante propuesta es un EPS. Tenemos
que comprobar que es Equilibrio de Nash en cada subjuego del juego.
Notas de clase de Teoría de Juegos - Marcela Eslava 33
Dado el horizonte infinito es imposible examinar los subjuegos haciendo inducción hacia atrás. ¿Cómo
entonces analizar si la estrategia propuesta es EPS? Note que hay dos (2) tipos de subjuegos:
1. Tipo 1: Subjuegos tal que hubo desviación anterior (la estrategia desencadenante no se cumplió
en algún periodo anterior)
2. Tipo 2: Subjuegos tal que no hubo desviación anterior

Lo que es clave para que sólo tengamos estos dos tipos de subjuegos es que un subjuego tipo 1 en el
periodo t es igual a un subjuego tipo 1 en el periodo t+1) (o t+100 o t+200). Entonces para analizar todos
los subjuegos del juego sólo se necesita mirar un subjuego de cada tipo para un periodo (t) cualquiera5.

• Subjuego Tipo 1: Hubo desviaciones en algún periodo anterior.

El objetivo es analizar bajo qué circunstancias (C,C) es un EN en este tipo de subjuego. Es entonces
suficiente estudiar si en este subjuego C es la mejor respuesta de un jugador en el caso en que el otro
juegue C. Denote Vi1 la máxima utilidad que (i) puede obtener en este tipo de subjuego (la utilidad
que da la mejor respuesta) Note:
A. En t escogeré la opción que me da Vi1 .
B. En t+1 estoy también en un subjuego que me da Vi1 (pues si hubo desviaciones previas en t
entonces también la hubo en t+11).

⇒ u i (ai ,t , Ct ) = u it (ai ,t , C ) + δVi1


donde ui(uit,Ct) indica la utilidad en el juego completo a partir de t
si los jugadores escogen (ai,C) en el periodo t.

Si la mejor opción del jugador i en t fuera confesar cuando el otro confiesa, entonces:
Vi1=ui(Ct,Ct)= -6+δVi,1 ,
puesto que Vi1 está definido como la utilidad que genera la mejor opción. De manera similar, si la
mejor opción del jugador i en t fuera no confesar cuando el otro confiesa entonces:
Vi1=ui(Nt,Ct)= -10+δVi,1 .

Una comparación entre estas dos expresiones muestra que la mejor opción para este jugador i es
confesar, con lo cual podemos despejar
Vi,1= -6 / (1-δ)

• Subjuego tipo II: Sin desviaciones previas.

En este caso, el objetivo es analizar si (N,N) es Equilibrio de Nash en t en este tipo de subjuego.
Entonces ¿Sería N la mejor respuesta de cada jugador si el otro estuviera jugando N)? Denote Vi,2 la
mejor utilidad que puede obtener i en este tipo de subjuego y note:

1. Entre C y N, en t un jugador escogerá la que le da Vi,2 .


2. En t+1 el juego es idéntico a t (subjuego tipo II) si y sólo si i en t se jugó (N,N). De lo contrario, en
t+1 el juego es subjuego tipo I (porque si en t se jugó algo diferente a (N,N) eso constituye una
desviación previa cuando se ve desde t+1).

5
Note que lo mismo NO sucede en un juego que se repite un número finito de veces: allí un subjuego con
desviación previa en T es diferente de uno en T-1 o en T-x, pues en cada caso queda un número diferente de
periodos para llegar al final del juego, que son los periodos disponibles para premiar o castigar el comportamiento
de hoy.
Notas de clase de Teoría de Juegos - Marcela Eslava 34
Si la mejor opción del jugador i en t fuera no confesar cuando el otro no confiesa, entonces:
Vi2=ui(Nt,Nt)= -3+δVi,2 , es decir, Vi2= -3 / (1-δ)

De manera similar, si la mejor opción del jugador i en t fuera confesar cuando el otro no confiesa
entonces (recuerde que en este caso en t+1 los jugadores se encontrarían en un subjuego tipo I, lo que
se captura por la presencia de δVi,1 en la siguiente expresión):
Vi2=ui(Ct,Nt)= -1+δVi,1= -1 - (6δ) / (1-δ)
donde usamos el resultado anterior de Vi,1= -6 / (1-δ)

Comparando los dos posibles valores de Vi2, encontramos que para el jugador i es óptimo escoger N
en este tipo de subjuego siempre y cuando
[-3 / (1-δ)] ≥ -10 - (6δ) / (1-δ) es decir si: δ ≥ (2/5)

Esta es, por tanto, la condición necesaria que garantiza que (N,N) sea EN de este tipo de subjuegos.
Reuniendo todo lo anterior, encontramos que la estrategia desencadenante propuesta es EPS si la
condición δ ≥ (2/5) se cumple.

Lo que acabamos de mostrar es que repetir el Dilema de Prisioneros un número infinito de veces permite
que los jugadores se coordinen fuera del EN en cada periodo. Una mirada cuidadosa al ejemplo anterior
le mostrará que esta posibilidad se da gracias a tres elementos: (1) infinitos periodos, (2) que la
coordinación de los agentes los lleva a mejor utilidad para ambos que la que obtendrían jugando siempre
el EN, y (3) un δ lo suficientemente alto. Esta lógica se extiende a un resultado general, conocido como el
"Teorema Popular" (o "Folk Theorem"):

Teorema Popular:
Denote (e , e ,..., e ) como los pagos de un Equilibrio de Nash del juego estático G, y denote
*
1
*
2
*
N

(X , X ,...,, X ) otro conjunto de pagos cualquiera del juego G, que sea posible dado los espacios de
1 2 N

estrategias (incluyendo estrategias mixtas). Si Xi > e*i para todo jugador i y δ es suficientemente cercano a
1, entonces hay un Equilibrio Perfecto de Subjuegos del juego (G, ∞) en el cual los pagos están dados por
⎛ X1 X 2 X ⎞
⎜ , ,... N ⎟
⎝1− δ 1− δ 1− δ ⎠

Note:
⎛ X1 X 2 X ⎞
1) Unos pagos totales del juego dados por ⎜ , ,... N ⎟ implican unos pagos promedios por
⎝1− δ 1− δ 1− δ ⎠
( )
periodo de X1 , X 2 ,...,, X N .
¿Qué dice el teorema?

2) Sólo se puede alcanzar pagos promedio que son “posibles” en el juego básico dados los espacios de
estrategias. En el ejemplo anterior, pudimos alcanzar pagos promedio de (-3,-3) por periodo, porque estos
pagos son posibles en el juego estático, en el sentido de poderse alcanzar con una combinación de
estrategias posible en ese juego (en este caso (N,N)) . También podría alcanzarse cualquier grupo de
pagos generados por estrategias mixtas, es decir, cualquier combinación lineal entre los distintos pagos
derivados de las estrategias puras.