Deber Teoria de Juegos

UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE INGENIERIA QUÍMICA

INVESTIGACIÓN OPERATIVA
Nombre: Brenda Serrano

Fecha: 15 de junio de 2018
1. Resolución de la matriz por equilibrio de Nash en estado mixto

𝑞1 𝑞2 𝑞3
𝑝1 1 2 3
𝐴= 𝑝
2 (2 −1 4)
𝑝3 3 4 −1
Donde:
𝑞1 + 𝑞2 + 𝑞3 = 1
𝑝1 + 𝑝2 + 𝑝3 = 1
El equilibrio mixto
𝐴+𝑘 = 𝐵
𝑘= 5
6 7 8
𝐵 = (7 4 9)
8 9 4
Sistemas de ecuaciones
max(𝐵) = 𝑦1 + 𝑦2 + 𝑦3
6𝑦1 + 7𝑦2 + 8𝑦3 ≤ 1
7𝑦1 + 4𝑦2 + 9𝑦3 ≤ 1
8𝑦1 + 9𝑦2 + 4𝑦3 ≤ 1
𝑦1 + 𝑦2 + 𝑦3 ≥ 0
Aplicar el solver del software Winqsb 2.0

Tablas 1. Datos arrojados por Winqsb 2.0
Decision Solution Total

Variable value contribution
y1 0,0602 0,0602
y2 0,0361 0,0361
y3 0,0482 0,0482
Objetive funtion Max
(w)=0,1446
1
𝑣∗ = −𝑘
𝑤
1
𝑣∗ = −5
0,1446
Cálculo de las probabilidades
 Jugador 2
𝑦1 0,0602
𝑞1 = = = 0,416
𝑤 0,1446
𝑦2 0,0361
𝑞2 = = = 0,250
𝑤 0,1446
𝑦3 0,0482
𝑞3 = = = 0,333
𝑤 0,1446
𝑞1 + 𝑞2 + 𝑞3 = 1
 Jugador 1
𝑧 = 𝑤 = 0,1446
𝑥1 = 0,0482
𝑥2 = 0,0361
𝑥3 = 0,0602
𝑥1 0,0482
𝑝1 = = = 0,333
𝑤 0,1446
𝑥2 0,0361
𝑝2 = = = 0,250
𝑤 0,1446
𝑥3 0,0602
𝑝3 = = = 0,416
𝑤 0,1446
𝑝1 + 𝑝2 + 𝑝3 = 1
2. Diferencia entre estrategias puras y estrategias mixtas o mezcladas
- Jugada con una distribución de probabilidad asociada con el conjunto de estrategias
puras de un jugador.
𝑃 = (𝑃1 , 𝑃2 , … . , 𝑃𝑛 ) 𝑐𝑜𝑛 𝑃𝑖 ∈ [1, 0] 𝑦 ∑ 𝑃𝑖 = 1
- Jugador 1 (B), juega con Bi con probabilidad pi (P)

- Jugador 2 (L), juega con Lj con probabilidad qj (Q)
𝐸(𝑃, 𝑄) = ∑ 𝐸 (𝐵⁄𝐿𝑗) 𝑞𝑗 = ∑ 𝐸 (𝐿⁄𝐵𝑖 ) 𝑝𝑖 = ∑ ∑ 𝜋𝑖𝑗 𝑝𝑖 𝑞𝑗

𝑗 𝑖 𝑖 𝑗
 Estrategias puras
- Jugada con una probabilidad P=1

- Indica al jugador que movimientos debe efectuar o elegir dentro de un número
determinado de acciones
La diferencia erradica en: la estrategia pura indica al jugador o limita al jugador a realizar un
movimiento establecido, el cual será el mismo en cada jugada; mientras que la estrategia mixta
es una seria de movimientos elegidos al azar en cada jugada esperando un resultado.
3. ¿Qué es mínima entropía?
Entonces; la mínima entropía es el menor desorden existente, es decir, el punto mínimo en que
puede estar compactado u ordenado cualquier sistema.
Los juegos cuánticos hacen referencia a la actitud o respuesta que tendrá cierta persona al estar
en una situación de opción múltiples donde tenga que elegir la mejor opción para no salir
perjudicado en base a la respuesta que podría tener el contrincante, sin poder llegar a un
acuerdo, sino tomar la decisión por intuición, llegando a un equilibro conocido como
“Equilibrio de Nash”.
La mínima entropía está íntimamente relacionada con la desviación con la desviación estándar,
es decir, a menor desviación estándar existe la menor entropía, y a su vez en el Equilibrio de
Nash se encuentro el punto inferior de entropía.
estrategia mixta del equilibrio de Nash. El programa de minimización de entropía
es igual al programa de minimización de desviación estándar
, cuando tiene función de densidad gaussiana o logit

multinomial.
Según Hayek, el equilibrio se refiere al estado de orden o entropía mínima. El estado del orden
es lo opuesto a la entropía (medida del desorden). Hay algunas influencias intelectuales y
acontecimientos históricos que inspiraron a Hayek a desarrollar la idea de un orden espontáneo.
Aquí presentamos las herramientas técnicas necesarias para estudiar el estado del pedido.
Caso 1 Si la densidad de probabilidad de una variable X es normal: , entonces su
entropía es mínima para la desviación estándar mínima
Prueba. Dejando a la función de entropía y la función de

densidad normal. Escribiendo esta función de entropía en términos de la desviación estándar
mínima, tenemos.
desarrollando la integral tenemos
Para un juego de n jugadores la entropía total puede ser escrita como sigue:
después de hacer algunos cálculos más, es posible demostrar que
La entropía o medida del desorden es directamente proporcional a la desviación estándar o

medida de la incertidumbre. Clausius quien descubrió la idea de la entropía, la presenta como
una medida evolutiva y como la caracterización de procesos reversibles e irreversibles.
Caso 2 Si la función de probabilidad de es un logit multinomial del parámetro
λ (parámetro de racionalidad), entonces su entropía es mínima y su desviación estándar es
mínima para
Prueba. Dejen como la probabilidad de que
donde representa la función de utilidad de partición
La entropía , utilidad esperada , y la varianza
serán diferentes para cada jugador k.
Utilizando la forma explícita de , podemos obtener la entropía, la utilidad esperada y la

varianza:
La ecuación se puede obtener usando las últimas siete ecuaciones; explica

que, cuando la entropía disminuye, el parámetro (racionalidad) λ aumenta.
La racionalidad aumenta de un valor inicial de cero cuando la entropía es máxima, y baja a su
valor mínimo cuando la racionalidad hacia el valor infinito:
La desviación estándar es mínima en los equilibrios de Nash
Si la racionalidad aumenta, entonces los equilibrios de Nash pueden ser alcanzados cuando la
racionalidad se extiende hacia el infinito .

Utilizando la cadena lógica que se acaba de demostrar, podemos concluir que la entropía
disminuye cuando la desviación estándar disminuye:
después de hacer algunos cálculos más, es posible demostrar que
Observación 1 La entropía Hk para la densidad de probabilidad gaussiana y el logit
multinomial se escriben como
Caso 3 El caso especial de Entropía Mínima es cuando y el valor de la función de
utilidad de cada estrategia , es el mismo para todos los jk, y para todos
los k
En el caso especial de la Entropía Mínima cuando, la función de densidad gaussiana puede ser
aproximada por el Delta de Dirac
La función se llama "función de Dirac". La función de Dirac no es una
función en el sentido habitual. Representa un impulso infinitamente corto e
infinitamente fuerte de una unidad de área. Satisface y se

puede obtener en el límite de la función
Caso 4 Si podemos medir la desviación estándar, entonces el equilibrio de Nash representa la

desviación estándar mínima
4. Diferencia entre estado puro y estado mixto (Estrategia Mixta)

Un estado puro es un ensamble de sistemas cuánticos que puede ser descrito por un vector de
estado único, a diferencia de un estado mixto, en el que varios vectores de estado, no
necesariamente ortogonales entre sí, deben ser tomados como base (por ejemplo debido a
interacciones con el entorno del sistema).
Un elemento cuántico que está en estado mixto se basa en el principio probabilístico
superpuesto de estados puros. En mecánica cuántica se llama estado mezcla, estado
mixto o mezcla estadística de estados puros, por contraposición a estado puro, a un estado
cuántico que no está máximamente determinado. En otras palabras; se dice que un sistema se
encuentra en un estado mezcla cuando no se dispone del máximo grado de información que
puede obtener sobre sus propiedades u observables. Esta información se encuentra limitada por
la existencia, incluso en un estado puro, de incompatibilidades entre ciertos observables
(relación de indeterminación de Heisenberg), pero en un estado mezcla nuestra falta de
información es superior a la exigida por la teoría cuántica.
Los estados mixtos surgen en situaciones donde el observador no sabe qué estados particulares
están siendo manipulados. Un ejemplo son los sistemas en equilibrio térmico, equilibrio
químico adicional o sistemas que han sido preparados mediante un procedimiento variable o
aleatorio (por lo que no es posible saber en qué estado puro se encuentra el sistema). Además, si
un sistema cuántico tiene dos o más subsistemas entrelazados, entonces cada subsistema debe
tratarse como un estado mixto, incluso si el sistema completo está en estado puro, por ejemplo
en los sistemas de partículas idénticas.
En teoría de juegos cuando un jugador que usa una estrategia mixta respeta la función vNM
(Von Newmann y Morgenstern) o la superposición probabilística de estrategias puras según
Binmore. La comparación entre Teoría de juegos y Mecánica cuántica se puede mostrar de
forma explícita en la Tabla 1. Si la definición de racionalidad en Teoría de juegos representa un
proceso de optimización, podemos decir que los procesos cuánticos son esencialmente óptimos,
por lo tanto, la naturaleza de ambos procesos es similar.
5. Operadores de Evolución y Densidad en Juegos Simétricos de Dos Jugadores
Comencemos por escribir la utilidad esperada 𝐸(𝑢) = 𝑢̅ del operador A (matriz simétrica) que
representa las utilidades. Aquí, usamos la notación de Dirac (corchete), donde |. ⟩, representa un
vector de columna y ⟨.| es un vector de fila |. ⟩ = (⟨.|)∗
𝐸(𝑢) = 𝑢̅ = 〈𝐴〉𝑁 = 〈𝑝|𝐴|𝑝〉

La ecuación del replicador dinámico en forma de matriz es:
𝑢̅ − 𝑢1 0 0 0
𝑑|𝑝⟩ ⋯ ⋯ ⋯ ⋯
=( 0 0 𝑢̅ − 𝑢1 0 ) |𝑝⟩
𝑑𝑡
0 0 0 𝑢̅ − 𝑢1
𝑑|𝑝⟩
= 𝑈|𝑝⟩
𝑑𝑡
Escribamos la derivada total del valor esperado 〈𝐴〉𝑁
𝑑〈𝐴〉𝑁 𝑑⟨𝑝| ∂A 𝑑|𝑝⟩
=( ) 𝐴|𝑝⟩ + ⟨𝑝| |( ) |𝑝⟩ + ⟨𝑝| 𝐴 ( )
𝑑𝑡 𝑑𝑡 ∂t 𝑑𝑡
𝑑|𝑝⟩ 𝑑⟨𝑝|
usando la forma explícita de 𝑑𝑡
= 𝑈|𝑝⟩, 𝑑𝑡
= ⟨𝑝|𝑈 ∗, entonces tenemos que 𝑈 = 𝑈 ∗
𝑑〈𝐴〉𝑁 ∂A
= ⟨𝑝|𝑈𝐴|𝑝⟩ + ⟨𝑝| ( ) |𝑝⟩ + ⟨𝑝|𝐴𝑈|𝑝⟩
𝑑𝑡 ∂t
= ⟨𝑝|𝑈𝐴 + 𝐴𝑈|𝑝⟩ + ⟨𝑝| ( ) |𝑝⟩
𝑑𝑡 ∂t
usando la nomenclatura de un anticommutador {𝑈, 𝐴} = 𝑈𝐴 + 𝐴𝑈
= 〈{𝑈, 𝐴}〉 + 〈 〉
𝑑𝑡 ∂t
De manera similar, podemos encontrar la ecuación de evolución de la densidad
𝜌 = |𝑝⟩⟨𝑝|
𝑑𝜌 𝑑|𝑝⟩ 𝑑⟨𝑝|
=( ) ⟨𝑝| + |𝑝⟩ ( )
𝑑𝑡 𝑑𝑡 𝑑𝑡
𝑑𝜌
= 𝑈|𝑝⟩⟨𝑝|+|𝑝⟩⟨𝑝|𝑈
𝑑𝑡
𝑑𝜌
= {𝑈, 𝜌}
𝑑𝑡
La evolución del operador ha integrado las propiedades de los juegos simétricos en forma
estratégica y la dinámica del replicador en forma de matriz.
Replicador dinámico
El método del replicador dinámico es una variante de los modelos de juego evolutivos donde lo que
interesa es conocer cuál es la tasa diferencial con que los individuos de las diferentes estrategias se
replican (reproducen), más que buscar la estrategia para lograr un óptimo en el beneficio. En ciertos
casos los individuos asumen estrategias que aportan al bien común, la sobrevivencia de la especie, más
que a la optimización del beneficio individual.
Si x es el vector de las fracciones de individuos en que está dividida la población según la

característica de interés, se quiere conocer cómo se replican los individuos de estos grupos:
𝑑𝑥/𝑑𝑡
Se tiene una población de individuos en que cada uno sigue una de n estrategias puras si. El juego se
repite en el tiempo t (donde t = 1,2,3...) y llamamos xti a la fracción o parte de la población que utiliza
la estrategia si en el periodo de tiempo t, tal que Σi xti = 1.
Sea Pti el pago obtenido por la porción de la población xti que utilizó la estrategia si en el tiempo t. El
pago a la estrategia depende, entre otros factores, de qué fracción de la población escoja tal
estrategia5 Pti = Pi (xti, t).
El modelo indica que en cada intervalo de tiempo dt algunos individuos del grupo i, se enteran de la
estrategia utilizada por algún otro individuo, y por ende una parte del grupo de individuos con
estrategia i escogido aleatoriamente con probabilidad αxidt > 0 cambia su estrategia a la de los
individuos grupo j si percibe que los individuos de la estrategia sj obtienen un mayor beneficio; pero
como la información que tienen no es perfecta, tampoco lo es la diferencia percibida, por lo que es
más probable que el individuo i cambie su estrategia cuanto mayor sea la diferencia real entre su
beneficio y el obtenido por el grupo j. La probabilidad que un individuo con estrategia si cambie a la
estrategia sj está dada por qij.
(El valor del parámetro β debe ser tal que siempre qij < 1 para todo i y todo j).
La fracción de la población esperada que usará la estrategia sj en el periodo t + dt será xt+dti estará dada
por
donde αi será una variable aleatoria que determina la porción de los individuos de estrategia si que se
encuentran con individuos con estrategia sj en este intervalo dt. Este parámetro también posibilita que
cada uno de los grupos cambie de estrategia con diferente periodicidad, por lo tanto en cada intervalo
dt, cada grupo puede evaluar si le conviene o no cambiar de estrategia, y lo hará solamente si αi ≠ 0.
β es un parámetro que está más relacionado con la percepción con que los individuos de un grupo
valoran el éxito o beneficio –fitness en inglés– del otro grupo. Si se rescribe la ecuación anterior se
puede tener la variación en el intervalo dt
y tomando el límite cuando t → 0
que es la ecuación del replicador dinámico y, expresada en forma vectorial
La implementación de la ecuación del replicador dinámico se realiza transformando la ecuación

diferencial en una ecuación en diferencias que va calculando las variaciones de la proporción de
individuos que utiliza cada una de las estrategias para cada intervalo de tiempo dt; el comportamiento
simultáneo, expresado en el vector x, de las distintas estrategias muestra la evolución de la población
solamente como la distribución de la población, pero no permite seguir a los individuos particulares.
BIBLIOGRAFIA:
(1) Quintas. I. (2013). Implementación del algoritmo del replicador dinámico en Lenguaje R:
Recuperado de: www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-
77422013000100013
(2) Jimenez, E. (2012). Hidden Optimal Principle in Quantum Mechanics and Quantum Chemistry.
International Journal of Theoretical and Mathematical Physics. 2(4), 51-60

Deber Teoria de Juegos

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Deber Teoria de Juegos

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE INGENIERIA QUÍMICA

Nombre: Brenda Serrano

1. Resolución de la matriz por equilibrio de Nash en estado mixto

Aplicar el solver del software Winqsb 2.0

Decision Solution Total

𝑃 = (𝑃1 , 𝑃2 , … . , 𝑃𝑛 ) 𝑐𝑜𝑛 𝑃𝑖 ∈ [1, 0] 𝑦 ∑ 𝑃𝑖 = 1

- Jugador 1 (B), juega con Bi con probabilidad pi (P)

𝐸(𝑃, 𝑄) = ∑ 𝐸 (𝐵⁄𝐿𝑗) 𝑞𝑗 = ∑ 𝐸 (𝐿⁄𝐵𝑖 ) 𝑝𝑖 = ∑ ∑ 𝜋𝑖𝑗 𝑝𝑖 𝑞𝑗

- Jugada con una probabilidad P=1

es igual al programa de minimización de desviación estándar

, cuando tiene función de densidad gaussiana o logit

Caso 1 Si la densidad de probabilidad de una variable X es normal: , entonces su

entropía es mínima para la desviación estándar mínima

Prueba. Dejando a la función de entropía y la función de

desarrollando la integral tenemos

después de hacer algunos cálculos más, es posible demostrar que

La entropía o medida del desorden es directamente proporcional a la desviación estándar o

Prueba. Dejen como la probabilidad de que

donde representa la función de utilidad de partición

La entropía , utilidad esperada , y la varianza

serán diferentes para cada jugador k.

Utilizando la forma explícita de , podemos obtener la entropía, la utilidad esperada y la

La ecuación se puede obtener usando las últimas siete ecuaciones; explica

racionalidad se extiende hacia el infinito .

después de hacer algunos cálculos más, es posible demostrar que

Observación 1 La entropía Hk para la densidad de probabilidad gaussiana y el logit

multinomial se escriben como

Caso 3 El caso especial de Entropía Mínima es cuando y el valor de la función de

infinitamente fuerte de una unidad de área. Satisface y se

Caso 4 Si podemos medir la desviación estándar, entonces el equilibrio de Nash representa la

4. Diferencia entre estado puro y estado mixto (Estrategia Mixta)

𝐸(𝑢) = 𝑢̅ = 〈𝐴〉𝑁 = 〈𝑝|𝐴|𝑝〉

Si x es el vector de las fracciones de individuos en que está dividida la población según la

y tomando el límite cuando t → 0

que es la ecuación del replicador dinámico y, expresada en forma vectorial

La implementación de la ecuación del replicador dinámico se realiza transformando la ecuación

Você também pode gostar