Você está na página 1de 5

INSTITUTO

TECNOLGICO DE
VILLAHERMOSA

5.6.4 Dilema de los prisioneros

ECONOMA EMPRESARIAL
PROFESORA: ZINATH JAVIER GERNIMO
PRESENTA: RUBN ARTURO PREZ JUREZ
INGENIERA EN GESTIN EMPRESARIAL
TURNO: MATUTINO

Dilema de los prisioneros

El dilema del prisionero es un problema fundamental de la teora de juegos


que muestra que dos personas pueden no cooperar incluso si en ello va el inters
de ambas.
Fue desarrollado originariamente por Merrill Flood y Melvin Dresher
mientras trabajaban en RAND en 1950. Albert W. Tucker formaliz el juego con la
frase sobre las recompensas penitenciarias y le dio el nombre del "dilema del
prisionero" (Poundstone, 1995).
Es un ejemplo de problema de suma no nula. Las tcnicas de anlisis de la
teora de juegos estndar, por ejemplo determinar el equilibrio de Nash, pueden
llevar a cada jugador a escoger traicionar al otro, pero ambos jugadores
obtendran un resultado mejor si colaborasen.
En el dilema del prisionero iterado, la cooperacin puede obtenerse como
un resultado de equilibrio. Aqu se juega repetidamente, por lo que, cuando se
repite el juego, se ofrece a cada jugador la oportunidad de castigar al otro jugador
por la no cooperacin en juegos anteriores. As, el incentivo para defraudar puede
ser superado por la amenaza del castigo, lo que conduce a un resultado
cooperativo.
La enunciacin clsica del dilema del prisionero es:
La polica arresta a dos sospechosos. No hay pruebas suficientes para
condenarlos y, tras haberlos separado, los visita a cada uno y les ofrece el mismo
trato. Si uno confiesa y su cmplice no, el cmplice ser condenado a la pena
total, diez aos, y el primero ser liberado. Si uno calla y el cmplice confiesa, el
primero recibir esa pena y ser el cmplice quien salga libre. Si ambos confiesan,
ambos sern condenados a seis aos. Si ambos lo niegan, todo lo que podrn
hacer ser encerrarlos durante seis meses por un cargo menor.

Lo que puede resumirse como:


l
confiesa
l lo
niega

T confiesas
Ambos son condenados a 6 aos.
l es condenado a 10 aos y t sales
libre.

T lo niegas
l sale libre y t eres condenado a 10
aos.
Ambos son condenados a 6 meses.

Vamos a suponer que ambos prisioneros son completamente egostas y su


nica meta es reducir su propia estancia en la crcel. Como prisioneros tienen dos
opciones: cooperar con su cmplice y permanecer callado, o traicionar a su
cmplice y confesar. El resultado de cada eleccin depende de la eleccin del
cmplice. Por desgracia, uno no conoce qu ha elegido hacer el otro. Incluso si
pudiesen hablar entre s, no podran estar seguros de confiar mutuamente.
Si uno espera que el cmplice escoja cooperar con l y permanecer en
silencio, la opcin ptima para el primero sera confesar, lo que significara que
sera liberado inmediatamente, mientras el cmplice tendr que cumplir una
condena de 10 aos. Si espera que su cmplice decida confesar, la mejor opcin
es confesar tambin, ya que al menos no recibir la condena completa de 10
aos, y slo tendr que esperar 6, al igual que el cmplice. Y, sin embargo, si
ambos decidiesen cooperar y permanecer en silencio, ambos seran liberados en
slo 6 meses.
Confesar es una estrategia dominante para ambos jugadores. Sea cual sea
la eleccin del otro jugador, pueden reducir siempre su sentencia confesando. Por
desgracia para los prisioneros, esto conduce a un resultado regular, en el que
ambos confiesan y ambos reciben largas condenas. Aqu se encuentra el punto
clave del dilema. El resultado de las interacciones individuales produce un
resultado que no es ptimo -en el sentido de eficiencia de Pareto-; existe una
situacin tal que la utilidad de uno de los detenidos podra mejorar (incluso la de
ambos) sin que esto implique un empeoramiento para el resto. En otras palabras,
el resultado en el cual ambos detenidos no confiesan domina al resultado en el
cual los dos eligen confesar.
Si se razona desde la perspectiva del inters ptimo del grupo (de los dos
prisioneros), el resultado correcto sera que ambos cooperasen, ya que esto
reducira el tiempo total de condena del grupo a un total de un ao. Cualquier otra
decisin sera peor para ambos si se consideran conjuntamente. A pesar de ello, si
siguen sus propios intereses egostas, cada uno de los dos prisioneros recibir
una sentencia dura.
Si has tenido una oportunidad para castigar al otro jugador por confesar,
entonces un resultado cooperativo puede mantenerse. La forma iterada de este
juego (mencionada ms abajo) ofrece una oportunidad para este tipo de castigo.
En ese juego, si el cmplice traiciona y confiesa una vez, se le puede castigar
traicionndolo a la prxima. As, el juego iterado ofrece una opcin de castigo que
est ausente en el modo clsico del juego.

Una opcin es considerar este dilema como una simple "mquina de la


verdad". El jugador puede tomar no dos, sino tres opciones: cooperar, no cooperar
o, sencillamente, no jugar. La respuesta lgica en este caso es "no jugar", pues el
prisionero carece de informacin suficiente para jugar correctamente: no sabe cul
ser la opcin de su compaero. No hay tal dilema, pues no es posible el juego. Si
juega, se trata de una "apuesta", ms que de una solucin lgica.
Pensemos tambin que el prisionero en realidad est "jugando" con su
carcelero, no con el otro prisionero. El carcelero le ofrece una opcin. Para l, la
mayor ganancia sera condenar al prisionero a la pena mayor, pues se es su
trabajo. Si logra condenar a los dos a la mxima pena, doble ganancia. El
prisionero sabe eso, en el fondo. Slo "jugara" si supiera con toda certeza que el
polica cumplira su palabra a pesar de su confesin. Pero tampoco lo sabe. En
realidad, prisionero-carcelero y prisionero-prisionero estn jugando al mismo
juego: encubrir o traicionar (en el caso del ejemplo de los prisioneros, no
concuerda el verdad o mentira puesto que decir la verdad sera traicionar).
T encubres

T traicionas

l encubre

Mximo beneficio comn

T ganas, l pierde

l traiciona

l gana, t pierdes

Mximo perjuicio comn

En este caso, decir la verdad equivale a cooperar, a callarse. Pero un


jugador slo optar por la casilla "verdad" si sabe que el otro jugador tambin opta
por la misma solucin. En la vida real, eso no lo sabemos: hay que "jugar", es
decir, arriesgarse. Todo se basa en la "relacin de confianza" existente entre los
dos jugadores. Pongamos, por ejemplo, que los dos prisioneros son hermanos,
con una relacin de confianza muy estrecha. O que lo son uno de los prisioneros y
el carcelero. Entonces s sabran (casi con toda seguridad, pero nunca completa)
cul sera la opcin de su compaero, y entonces siempre jugaran correctamente:
cooperaran.
La nica solucin lgica es, por tanto, decir la verdad. Y adems ser la que
dar el mximo beneficio comn. Este planteamiento nos lleva a la correcta
solucin del dilema, que es decir la verdad, cooperar. Pero en este caso el error
estaba en el planteamiento correcto del dilema, que no es pensar en nuestro
beneficio (ser egosta) sino en el del "otro" (ser generoso). En este caso, jugando
a "verdad" siempre conseguiremos que el "otro" gane. Si el objetivo del juego es
que siempre gane el rival, hay pues una nica solucin lgica, y que no depende
de la jugada del rival. Dilema resuelto.

Una solucin "incorrecta" sera en el caso que el hermano traicione al


hermano. Aun as, el juego es correcto (pues todo juego tiene una y slo una
solucin lgica). Lo que ha sucedido es que ha cambiado el nombre del juego:
ahora lo podramos llamar "Descubre al mentiroso". Hemos ganado, pues
descubrimos a un mentiroso.
T ganas
l gana
l pierde

T pierdes

Los dos dijeron la verdad

l minti

T mentiste

Lo dos mintieron

Es entonces una autntica "mquina de la verdad".


El dilema del prisionero es pues siempre un juego dual; pero siempre tiene
una solucin lgica. Si los dos juegan lgicamente, es decir, con honestidad, el
juego es beneficioso para ambos. Si uno engaa y el otro no, el juego se llama
"Descubre al Mentiroso", y ambos vuelven a ganar.
Pero si pensamos en el Dilema como bsqueda egosta, y no generosa, la
jugada "incorrecta" del dilema impide la iteracin, luego finaliza el juego. Por esa
razn, el jugador "ilgico" siempre tendr dos objetivos: uno, engaar al honesto; y
dos, convencerle a posteriori de que no fue engaado, mediante otro ardid, para
poder seguir engandole. Un mentiroso siempre necesitar otra mentira para
cubrir la primera.
Este tipo de estrategias es muy comn en la vida cotidiana y se conoce
como "manipulacin". Para algunos, quizs exagerando, la poltica (la mala
poltica) es el arte de la manipulacin continua. Y que la estrategia funcione tiene
tanto que ver con la "mentira" del tramposo como la "doble ingenuidad" del
honesto. Fiarse de un mentiroso no es honestidad, sino estupidez. (De ah que la
estrategia conocida como "vengativa no rencorosa", o Toma y daca (tit for tat)
ver ms adelante sea la ms eficaz). Pero sabemos que el nico resultado
correcto es bueno para todos los jugadores, y ste slo sucede cuando todos
dicen la verdad. Si alguien miente, engaa o manipula, la solucin siempre ser
incorrecta. O, dicho de otro modo, si la solucin es incorrecta, es que alguien nos
enga o nos minti.

Você também pode gostar