Escolar Documentos
Profissional Documentos
Cultura Documentos
𝑞1 + 𝑞2 + 𝑞3 = 1
𝑝1 + 𝑝2 + 𝑝3 = 1
El equilibrio mixto
𝐴+𝑘 = 𝐵
𝑘= 5
6 7 8
𝐵 = (7 4 9)
8 9 4
Sistemas de ecuaciones
max(𝐵) = 𝑦1 + 𝑦2 + 𝑦3
6𝑦1 + 7𝑦2 + 8𝑦3 ≤ 1
7𝑦1 + 4𝑦2 + 9𝑦3 ≤ 1
8𝑦1 + 9𝑦2 + 4𝑦3 ≤ 1
𝑦1 + 𝑦2 + 𝑦3 ≥ 0
1
𝑣∗ = −𝑘
𝑤
1
𝑣∗ = −5
0,1446
Cálculo de las probabilidades
Jugador 2
𝑦1 0,0602
𝑞1 = = = 0,416
𝑤 0,1446
𝑦2 0,0361
𝑞2 = = = 0,250
𝑤 0,1446
𝑦3 0,0482
𝑞3 = = = 0,333
𝑤 0,1446
𝑞1 + 𝑞2 + 𝑞3 = 1
Jugador 1
𝑧 = 𝑤 = 0,1446
𝑥1 = 0,0482
𝑥2 = 0,0361
𝑥3 = 0,0602
𝑥1 0,0482
𝑝1 = = = 0,333
𝑤 0,1446
𝑥2 0,0361
𝑝2 = = = 0,250
𝑤 0,1446
𝑥3 0,0602
𝑝3 = = = 0,416
𝑤 0,1446
𝑝1 + 𝑝2 + 𝑝3 = 1
2. Diferencia entre estrategias puras y estrategias mixtas o mezcladas
- Jugada con una distribución de probabilidad asociada con el conjunto de estrategias
puras de un jugador.
Estrategias puras
La diferencia erradica en: la estrategia pura indica al jugador o limita al jugador a realizar un
movimiento establecido, el cual será el mismo en cada jugada; mientras que la estrategia mixta
es una seria de movimientos elegidos al azar en cada jugada esperando un resultado.
3. ¿Qué es mínima entropía?
Entonces; la mínima entropía es el menor desorden existente, es decir, el punto mínimo en que
puede estar compactado u ordenado cualquier sistema.
Los juegos cuánticos hacen referencia a la actitud o respuesta que tendrá cierta persona al estar
en una situación de opción múltiples donde tenga que elegir la mejor opción para no salir
perjudicado en base a la respuesta que podría tener el contrincante, sin poder llegar a un
acuerdo, sino tomar la decisión por intuición, llegando a un equilibro conocido como
“Equilibrio de Nash”.
La mínima entropía está íntimamente relacionada con la desviación con la desviación estándar,
es decir, a menor desviación estándar existe la menor entropía, y a su vez en el Equilibrio de
Nash se encuentro el punto inferior de entropía.
estrategia mixta del equilibrio de Nash. El programa de minimización de entropía
Para un juego de n jugadores la entropía total puede ser escrita como sigue:
utilidad de cada estrategia , es el mismo para todos los jk, y para todos
los k
En el caso especial de la Entropía Mínima cuando, la función de densidad gaussiana puede ser
aproximada por el Delta de Dirac
La función se llama "función de Dirac". La función de Dirac no es una
función en el sentido habitual. Representa un impulso infinitamente corto e
Replicador dinámico
El método del replicador dinámico es una variante de los modelos de juego evolutivos donde lo que
interesa es conocer cuál es la tasa diferencial con que los individuos de las diferentes estrategias se
replican (reproducen), más que buscar la estrategia para lograr un óptimo en el beneficio. En ciertos
casos los individuos asumen estrategias que aportan al bien común, la sobrevivencia de la especie, más
que a la optimización del beneficio individual.
𝑑𝑥/𝑑𝑡
Se tiene una población de individuos en que cada uno sigue una de n estrategias puras si. El juego se
repite en el tiempo t (donde t = 1,2,3...) y llamamos xti a la fracción o parte de la población que utiliza
la estrategia si en el periodo de tiempo t, tal que Σi xti = 1.
Sea Pti el pago obtenido por la porción de la población xti que utilizó la estrategia si en el tiempo t. El
pago a la estrategia depende, entre otros factores, de qué fracción de la población escoja tal
estrategia5 Pti = Pi (xti, t).
El modelo indica que en cada intervalo de tiempo dt algunos individuos del grupo i, se enteran de la
estrategia utilizada por algún otro individuo, y por ende una parte del grupo de individuos con
estrategia i escogido aleatoriamente con probabilidad αxidt > 0 cambia su estrategia a la de los
individuos grupo j si percibe que los individuos de la estrategia sj obtienen un mayor beneficio; pero
como la información que tienen no es perfecta, tampoco lo es la diferencia percibida, por lo que es
más probable que el individuo i cambie su estrategia cuanto mayor sea la diferencia real entre su
beneficio y el obtenido por el grupo j. La probabilidad que un individuo con estrategia si cambie a la
estrategia sj está dada por qij.
(El valor del parámetro β debe ser tal que siempre qij < 1 para todo i y todo j).
La fracción de la población esperada que usará la estrategia sj en el periodo t + dt será xt+dti estará dada
por
donde αi será una variable aleatoria que determina la porción de los individuos de estrategia si que se
encuentran con individuos con estrategia sj en este intervalo dt. Este parámetro también posibilita que
cada uno de los grupos cambie de estrategia con diferente periodicidad, por lo tanto en cada intervalo
dt, cada grupo puede evaluar si le conviene o no cambiar de estrategia, y lo hará solamente si αi ≠ 0.
β es un parámetro que está más relacionado con la percepción con que los individuos de un grupo
valoran el éxito o beneficio –fitness en inglés– del otro grupo. Si se rescribe la ecuación anterior se
puede tener la variación en el intervalo dt
(1) Quintas. I. (2013). Implementación del algoritmo del replicador dinámico en Lenguaje R:
Recuperado de: www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-
77422013000100013
(2) Jimenez, E. (2012). Hidden Optimal Principle in Quantum Mechanics and Quantum Chemistry.
International Journal of Theoretical and Mathematical Physics. 2(4), 51-60