NotasInvOpII PDF

Índice general
1. Modelos de redes 1
1.1. Algoritmos de optimización en redes . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Introducción y conceptos básicos . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2. Árbol de expansión mı́nima . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3. Algoritmo de flujo máximo . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.4. Algoritmo de Dijkstra (ruta más corta) . . . . . . . . . . . . . . . . . . 23
1.1.5. Algoritmo de Floyd (ruta más corta) . . . . . . . . . . . . . . . . . . . . 29
1.2. Redes y algoritmos para la administración de proyectos . . . . . . . . . . . . . 33
1.2.1. Construcción de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2.2. Algoritmo de la ruta crı́tica (CPM) . . . . . . . . . . . . . . . . . . . . . 36
1.2.3. Diagramas de Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.2.4. Análisis de la ruta crı́tica con PERT . . . . . . . . . . . . . . . . . . . . 43
1.2.5. Optimización en la reducción de la duración del proyecto . . . . . . . . 46
2. Teorı́a de decisiones 51
2.1. Teorı́a de juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.1.1. Formulación de juegos de dos personas y suma cero . . . . . . . . . . . . 51
2.1.2. Estrategia dominada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.1.3. Criterio minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.4. Juegos con estrategia mixta . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2. Análisis de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.2.1. Toma de decisiones sin experimentación . . . . . . . . . . . . . . . . . . 65
2.2.2. Toma de decisiones con experimentación . . . . . . . . . . . . . . . . . . 69
2.2.3. Árboles de decisión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.3. Cadenas de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.1. Procesos estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.2. Procesos de estados discreto . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.3. Cadenas de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.4. Ecuaciones de Chapman-Kolmogorov . . . . . . . . . . . . . . . . . . . . 81
2.3.5. Propiedades a largo plazo de las cadenas de Markov . . . . . . . . . . . 81
Bibliografı́a 83
i
ÍNDICE GENERAL
ii
Capı́tulo 1
Modelos de redes
1.1. Algoritmos de optimización en redes

1.1.1. Introducción y conceptos básicos
En la vida diaria se presentan diversas situaciones que requieren de una solución que
minimice el uso de algún material, o que determine la ruta más corta entre un origen y
uno o más destinos, o que proporcione la capacidad máxima de alguna sustancia que se
necesita transportar a través de una red. Las situaciones antes mencionadas son problemas
de optimización y pueden resolverse utilizando modelos de programación lineal, sin embargo,
algunas de estas situaciones contemplan demasiadas variables y se necesita de mucho tiempo
para hallar una solución. Los algoritmos de optimización de redes son computacionalmente
más sencillos y por lo tanto son capaces de resolver modelos que involucren una gran cantidad
de variables.
A continuación se presentan algunos ejemplos de aplicación a los modelos de redes [3].
1. Diseño de una red de oleoductos para gas natural a una determinada distancia de la costa
para conectar los cabezales de los pozoz en el Golfo de México a un punto de distribución
costero con el objetivo de minimizar el costo de construcción de los oleoductos.
2. Determinación de la ruta más corta entre dos ciudades en una red existente de carreteras.
3. Determinación de la capacidad máxima (en toneladas por año) de una red de oleoductos
para lodos de carbón que unen minas de carbón en Wyoming con plantas eléctricas en
Houston (los oleoductos para lodos transportan carbón al bombear agua a través de
tuberı́as especialmente diseñadas).
4. Determinación del cronograma (fechas de inicio y terminación) para las actividades de

un proyecto de construcción.
Una gráfica o red, se define mediante dos conjuntos, uno de nodos o vértices y otro de
lı́neas o arcos que unen vértices. Los arcos se definen mencionando el par de nodos que une,
asimismo los arcos pueden tener un peso o flujo (una cantidad que indique lo que se necesita
para realizar la transición de un nodo a otro) y una dirección. Si el flujo a través de un arco
1
1. MODELOS DE REDES
Figura 1.1: Red de nodos y arcos.
Figura 1.2: Red dirigida de nodos y arcos.
se permite sólo en una dirección se dice que es un arco dirigido. La dirección se indica con
una flecha en la lı́nea que representa el arco. Cuando se etiqueta un arco se pone primero de
dónde viene y luego hacia a dónde va.
Una red que tiene arcos dirigidos, se llama red dirigida.
Una trayectoria entre dos nodos es una sucesión de arcos distintos que conectan estos dos
nodos. Una trayectoria dirigida del nodo i al nodo j, es una sucesión de arcos cuya dirección
es hacia el nodo j.
En la red que se muestra en la Fig. 1.1, se pueden identificar 12 trayectorias diferentes que
conectan el nodo O y el nodo T . Una de dichas trayectorias es O −A−B −E −D −T . En la red
dirigida de la Fig. 1.2, una trayectoria dirigida del nodo A al nodo E es A → B → C → E, sin
embargo no hay una trayectoria dirigida del nodo E al nodo A. A continuación, se presentan
las definiciones de ciclo, red conexa y árbol.
Definición 1.1 (Ciclo) Un ciclo es una trayectoria que comienza y termina en el mismo
2
1.1. ALGORITMOS DE OPTIMIZACIÓN EN REDES
nodo. En una red dirigida, un ciclo puede ser dirigido o no según la trayectoria en cuestión.
Definición 1.2 (Red conexa) Se dice que dos nodos están conectados si la red contiene al
menos una trayectoria no dirigida entre ellos. Una red conexa es una red en la que cada par
de nodos está conectado.
Definición 1.3 Un árbol es una red conexa para algún subconjunto de nodos que no contiene
ciclos. Un árbol de expansión es una red conexa que contiene a los n nodos y no contiene
ciclos. Todo árbol de expansión tiene n − 1 arcos.
1.1.2. Árbol de expansión mı́nima

El algoritmo para hallar el árbol de expansión mı́nima de una red se utiliza cuando surge
la necesidad de que todos los nodos de la red esten conectados a un costo mı́nimo.
Algunas de las situaciones en las que se presenta son: pavimentación de carreteras que
unen poblaciones, proporcionar servicio de televisión por cable a una ciudad, diseño de una
red de lı́neas de transmisión de energı́a eléctrica de alto voltaje, entre otras.
Algoritmo del problema del árbol de expansión mı́nima [2]

1. Se selecciona, de manera arbitraria, cualquier nodo y se conecta, es decir, se agrega una
ligadura a un nodo distinto más cercano.
2. Se identifica el nodo no conectado más cercano a un nodo conectado y se conectan estos

dos nodos, esto es, se agrega una ligadura entre ellos. Este paso se repite hasta que todos
los nodos se encuentren conectados.
3. Rompiendo empates: los empates del nodo más cercano distinto (paso 1) o del nodo
conectado más cercano (paso 2), se pueden romper en forma arbitraria, pero el algoritmo
debe llegar a una solución óptima. No obstante, estos empates son señal de que pueden
existir (pero no necesariamente) soluciones óptimas múltiples.
Ejemplo 1.1 (Tomado de Hillier [2]) La administración de Seervada Park debe determi-
nar los caminos bajo los cuales se deben tender las lı́neas telefónicas para conectar todas las
estaciones con una longitud total mı́nima de cable.
Solución. En la siguiente figura, se resumen los nodos y las distancias entre las diferentes
estaciones de la reserva de Seervada Park. Cada lı́nea representa una ligadura potencial.
3
1. MODELOS DE REDES
Como lo indica el algoritmo, se inicia seleccionando de manera arbitraria un nodo, sea O.

Observe que el nodo seleccionado se conecta con los nodos A, B y C con longitudes 2, 5 y 4
respectivamente. Se conecta el nodo O con el nodo A, debido a que es la longitud más corta.
En la siguiente figura se muestra como empieza a formarse el árbol de expansión al conectar
los primeros dos nodos.
Se observa que de los nodos conectados (O y A), las conexiones con los nodos no conectados
son (A, D) con longitud de 7, (A, B) con longitud de 2, (O, B) con longitud de 5 y (O, C) con
longitud de 4. La longitud más corta es la (A, B) con longitud de 2, por lo que el nodo B es
el siguiente en conectarse. En la siguiente figura se muestran los tres nodos conectados que
están construyendo el árbol de mı́nima expansión.
El nodo no conectado más cercano a los nodos O, A, o B es el nodo C (conectando con

B) con una longitud de 1. Se conecta el nodo C con el nodo B.
El nodo no conectado más cercano a los nodos O, A, B o C, es el nodo E (conectando

con B) con una longitud de 3. Se conecta el nodo E con el nodo B.
4
El nodo no conectado más cercano a los nodos O, A, B, C o E es el nodo D (conectando

con E) con una longitud de 1. Se conecta el nodo D con el nodo E.
El único nodo no conectado es el nodo T y el nodo más cercano es el nodo D con una
longitud de 5. Se conecta el nodo T con el nodo D. Al encontrarse todos los nodos conecta-
dos, se ha encontrado el árbol de expansión mı́nima que resuelve el problema de cablear las
estaciones de Seervada Park con una cantidad mı́nima de cable de 14 km. A continuación se
muestran todos los nodos conectados y como queda finalmente el árbol de expansión mı́nima.
Ejemplo 1.2 La maderera Wirehouse talará árboles en ocho zonas de la misma área. Pero
antes debe desarrollar un sistema de caminos de tierra para tener acceso a cualquier zona
desde cualquier otra. La distancia (en kilómetros) entre cada par de zonas es:
5
1. MODELOS DE REDES
Solución. En este ejemplo se presenta la red en forma matricial, donde las filas y columnas
son los nodos de la red y las entradas de la matriz representan los pesos de los arcos de un nodo
a otro. El objetivo es conocer los caminos que se deben construir de tal forma que se minimice
el número de kilómetros construidos y que cada par de zonas se encuentren conectadas. Se
utilizará la aplicación Mı́nima Expansión ?? para obtener el resultado de este problema.
La aplicación Mı́nima Expansión trabaja con cantidades enteras por lo que el primer paso
es escalar los valores proporcionados en el ejemplo para obtener valores enteros (multiplicando
por 10) y posteriormente introducirlos en la aplicación como se muestra en la siguiente figura:
A continuación se hace click en el botón ejecutar y se obtienen los resultados del algoritmo
de árbol de expansión mı́nima. En la Iteración 1, la única zona conectada es la 1, y se puede
conectar con cualquiera de las otras zonas. Se conecta con la zona 5 que es con la que tiene
la distancia mı́nima (valor 11).
En la Iteración 2, se encuentran conectadas las zonas 1 y 5, y la distancia mı́nima a las

zonas no conectadas es de 11 de la zona 5 a la zona 4.
6
En la Iteración 3, se encuentran conectadas las zonas 1, 5 y 4, y la distancia mı́nima a las

zonas no conectadas es de 13 de la zona 5 a la zona 8.
En la Iteración 4, se encuentran conectadas las zonas 1, 5, 4 y 8, y la distancia mı́nima a

las zonas no conectadas es de 8 de la zona 8 a la zona 7.
En la Iteración 5, se encuentran conectadas las zonas 1, 5, 4, 8 y 7, y la distancia mı́nima

a las zonas no conectadas es de 10 de la zona 7 a la zona 6.
7
1. MODELOS DE REDES
En la Iteración 6, se encuentran conectadas las zonas 1, 5, 4, 8, 7 y 6, y la distancia mı́nima

a las zonas no conectadas es de 16 de la zona 8 a la zona 3.
En la Iteración 7, se encuentran conectadas las zonas 1, 5, 4, 8, 7, 6 y 3, y la distancia

mı́nima a las zonas no conectadas es de 14 de la zona 3 a la zona 2.
Finalmente quedan todos los nodos conectados como se indica en la siguiente figura y se
concluye que la maderera Wirehouse necesitará construir 8.3km de caminos. Los caminos a
construir son entre las siguiente zonas: (1,5), (5,4), (5,8), (8,7), (7,6), (8,3) y (3,2).
8
1.1.3. Algoritmo de flujo máximo

En una empresa, los empleados necesitan que el flujo de datos a través de la red aumente,
debido a que ahora realizan videollamadas con otras empresas para cerrar tratos de negocios,
capacitan a su personal utilizando video tutoriales almacenados en la nube, permiten que
sus empleados trabajen en un ambiente confortable al escuchar música utilizando un servicio
como el que proporciona Spotify. Para resolver el problema anterior, es necesario determinar
la cantidad máxima de datos que fluyen a través de la red empresarial. Este tipo de problema
se conoce como problema de flujo máximo
En términos generales, el problema de flujo máximo se puede describir de la siguiente
manera [2].
1. Todo flujo a través de una red conexa dirigida se origina en un nodo, llamado origen,
y termina en otro nodo llamado destino.
2. Los nodos restantes son nodos de trasbordo.
3. Se permite el flujo a través de un arco sólo en la dirección indicada por la flecha, donde
la cantidad máxima de flujo está dada por la capacidad del arco. En el origen, todos los
arcos señalan hacia afuera. En el destino, todos señalan hacia el nodo.
4. El objetivo es maximizar la cantidad total de flujo del origen al destino. Esta cantidad
se mide en cualquiera de las dos maneras equivalentes, esto es, la cantidad que sale del
origen o la que entra al destino.
En otras palabras, este algoritmo se basa en encontrar rutas que permitan llevar un flujo
positivo desde el nodo origen hasta un nodo destino; a éstas se les llama rutas de avance.
Cada ruta destina al flujo total de la red, una parte o toda la capacidad de cada arco por el
que pasa la ruta. Finalmente, la suma de las capacidades de cada una de las rutas encontradas,
constituyen el flujo máximo de la red.
Considere una red de oleoductos que transporta petróleo crudo desde pozos hasta refi-
nerı́as. Se instalan estaciones intermedias de reforzamiento y bombeo a distancias apropiadas
para mover el crudo en la red. Cada segmento de tuberı́a tiene una velocidad de descarga
finita (o capacidad) de flujo de crudo. Un segmento de tuberı́a puede ser unidireccional o
9
1. MODELOS DE REDES
bidireccional, según su diseño [3]. En la Fig. 1.3, se muestra una red que conecta pozos pe-
troleros con las refinerı́as utilizando estaciones de redistribución intermedias. En esta red, las
flechas indican la dirección del flujo y los arcos que no tienen flecha son bidireccionales.
7
1 4
3 6 8 Destino
Origen
2 5
9
Estaciones de
Pozos Refinerías
redistribución
Figura 1.3: Red que conecta pozos petroleros y refineı́as por medio de estaciones de redistribución.
La solución del problema propuesto requiere agregar un solo origen y un solo destino,
utilizando arcos de capacidad infinita unidireccionales, como se muestra en la Fig. 1.3.
Para el arco (i, j), la notación (C ij , C ji )
proporciona las capacidades de flujo iniciales
en las dos direcciones i → j y j → i. Para eli-
minar la ambigüedad, colocamos a C ij junto
al nodo i y a C ji junto al nodo j, como se
muestra en la Fig. 1.4.
El objetivo de este algoritmo es encontrar
todas las rutas de avance, es decir, rutas que
lleven cierto flujo del origen al destino, con
el fin de obtener la capacidad máxima de la Figura 1.4: Flujos de arcos Cij de i → j y Cji de j → i.
red sumando las capacidades de cada ruta de
avance encontrada.
En primera instancia, es necesario identificar las capacidades de diseño para cada nodo en
la red inicial. Para un arco (i, j) su capacidad de diseño bidireccional es (C ij , C ji ). Debido a
que no siempre se utiliza la capacidad máxima en cada arco para llevar un flujo, las capacidades
residuales se actualizan en cada arco. Se utiliza la notación (cij , cji ) para representar las
capacidades residuales de cada arco (i, j).
En la construcción de una ruta de avance se etiquetan los nodos. Para un nodo j que
recibe flujo del nodo i, anexamos la etiqueta [aj , i] donde aj es el flujo del nodo i al nodo j.
A continuación se describen los pasos del algoritmo de flujo máximo.
Paso 1. a) Para todos los arcos, iguale la capacidad residual a la capacidad de diseño, esto es
(cij , cji ) = (C ij , C ji ).
b) Hacer a1 = ∞ y etiquetar el nodo origen con [∞, −].
c) Designe i = 1, y continúe con el paso 2. El nodo i representa al nodo actual.
10
Paso 2. a) Determine Si el conjunto de nodos no etiquetados j al que se puede llegar direc-

tamente desde i por medio de arcos con capacidades residuales positivas (es decir
cij > 0 para todas las j ∈ Si ).
b) Si Si 6= ∅, continúe con el paso 3. De lo contrario, una ruta parcial termina en el
nodo i. Continúe con el paso 4
Paso 3. a) Determine k ∈ Si de modo que
cik = máx {cij }

j∈Si
b) Designe ak = cik y etiquete el nodo k con [ak , i].

c) Si k = n, se ha etiquetado al nodo destino, y se ha encontrado una ruta de avance,
continúe con el paso 5. De lo contrario, designe i = k, y vaya al paso 2.
Paso 4. (Retroceso).
a) Si i = 1 (el conjunto S1 = ∅), no es posible avanzar; continúe al paso 6. De lo

contrario: Defina r, el nodo (en la ruta parcial) que se etiquetó inmediatamente
antes del nodo actual i, y elimine i del conjunto de nodos adyacentes al nodo r, es
decir, haga Sr = Sr − {i}.
b) Designe i = r, y regrese al paso 2.
Paso 5. (Determinación de las capacidades residuales).
a) Defina los nodos de la ruta de avance p−ésima del nodo 1 al nodo n como Np =
(1, k1 , k2 , · · · , n). Entonces el flujo máximo a lo largo de la ruta Np , representado
por la mı́nima de todas las capacidades residuales a lo largo de la ruta Np , y se
calcula como
fp = mín {a1 , ak1 , ak2 , · · · , an }
b) Actualizar las capacidades residuales de la ruta Np reduciendo en fp la capacidad

en la dirección del flujo e incrementando en fp en la dirección inversa, es decir,
para los nodos i y j en la ruta, la capacidad residual actual (cij , cji ) cambia a:
1) (cij − fp , cji + fp ) si el flujo es de i a j
2) (cij + fp , cji − fp ) si el flujo es de j a i
c) Se eliminan las etiquetas de los nodos y se restauran todos los nodos eliminados en
el paso 4.
d ) Haga i = 1 y regrese al paso 2.
Paso 6. a) Como fueron determinadas m rutas de avance, el flujo máximo en la red está
determinado por la suma de los flujos de cada ruta de avance fp , es decir:
F = f1 + f2 + · · · + fm
11
1. MODELOS DE REDES
b) Finalmente se calculan los flujos óptimos en cada arco, los cuales indican la cantidad
de flujo que realmente fluye a través de cada arco y la dirección en la que fluye. Los
flujos óptimos se calculan utilizando las capacidades de diseño (C ij , C ji ) (iniciales)
y las capacidades residuales(cij , cji ) finales del arco (i, j).
El flujo óptimo para el arco (i, j) se determina calculando
(α, β) = (C ij − cij , C ji − cji )
Si α < 0, el flujo óptimo es α en dirección i → j. Por otra parte si β > 0,

el flujo óptimo es β en dirección de j → i. Es imposible que α y β sean
positivos al mismo tiempo.
Ejemplo 1.3 Determine el flujo máximo y los flujos óptimos para la red que se muestra en
la Fig. 1.5.
0 4 20
5
10 0
1 30 0 5
20
0
10
30 0
0 20
2 40 3
0
Figura 1.5: Red de flujo.
Solución.
Iteración 1. Iguale las capacidades residuales iniciales (cij , cji ) a las capacidades de diseño (C ij , C ji ).
0 4 20
[ ,-]
10 0 [20,3]
1 30 0 5
20
0
10
30 0
0 20
2 40
3
0
[30,1]
Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.
12
Paso 2. S1 = {2, 3, 4} (6= ∅).

Paso 3. k = 3, porque c13 = máx {c12 , c13 , c14 } = máx {20, 30, 10}. Establezca a3 = c13 =
30 y etiquete el nodo 3 con [30, 1]. Establezca i = 3 y repita el paso 2.
Paso 2. S3 = {4, 5}
Paso 3. k = 5, y a5 = c35 = máx {10, 20}. Etiquete el nodo 5 con [20, 3]. Establezca i = 5.
Como i = 5, se ha encontrado una ruta de avance. Continúe con el paso 5.
Paso 5. La ruta de avance se determina a partir de las etiquetas iniciando en el nodo 5
y regresando al nodo 1; es decir, (5) → [20, 3] → (3) → [30, 1] → (1). De este
modo, N1 = [1, 3, 5] y f1 = mín {a1 , a3 , a5 } = {∞, 30, 20} = 20. Las capacidades
residuales a lo largo de la ruta N1 son:
(c13 , c31 ) = (30 − 20, 0 + 20) = (10, 20)

(c35 , c53 ) = (20 − 20, 0 + 20) = (0, 20)
Iteración 2 .
[10,3]
0 4 20
[ ,-]
10 0
[20,4]
1 10 0 5
20
20
10
30 20
0 0
2 40
3
0
[20,1] [40,2]

Paso 2. S1 = {2, 3, 4}.
Paso 3. k = 2, y a2 = c12 = máx {20, 10, 10}. Etiquete el nodo 2 con [20, 1]. Establezca
i = 2 y repita el paso 2.
Paso 2. S2 = {3, 5}.
Paso 3. k = 3, y a3 = c23 = 40. Etiquete el nodo 3 con [40, 2]. Establezca i = 3 y repita el
paso 2.
Paso 2. S3 = {4}.
paso 2.
Paso 2. S4 = {5}. (Debido a que los nodos 1 y 3 ya están etiquetados, no se incluyen en
S4 ).
13
1. MODELOS DE REDES
Paso 3. k = 5, y a5 = c45 = 20. Etiquete el nodo 5 con [20, 4]. Se ha encontrado una ruta
de avance. Continúe con el paso 5.
Paso 5. N2 = [1, 2, 3, 4, 5] y f2 = mín {∞, 20, 40, 10, 20} = 10. Las capacidades residuales a
lo largo de la ruta N2 son:
(c12 , c21 ) = (20 − 10, 0 + 10) = (10, 10)
(c23 , c32 ) = (40 − 10, 0 + 10) = (30, 10)
(c34 , c43 ) = (10 − 10, 5 + 10) = (0, 15)
(c45 , c54 ) = (20 − 10, 0 + 10) = (10, 10)
Iteración 3 .
0 4 10
15
[ ,-]
10 10
[30,2]
1 10 0 5
10
20
0
30 20
10 0
2 30
3
10
[10,1] [30,2]

Paso 2. S1 = {2, 3, 4}.
Paso 3. k = 2 y a2 = c12 = máx {10, 10, 10} y etiquete el nodo 2 con [10, 1]. Establezca
i = 2 y repita el paso 2.
Paso 2. S2 = {3, 5}.
Paso 3. k = 3 y a3 = c23 = 30 y etiquete el nodo 3 con [30, 2]. Establezca i = 3 y repita el
paso 2.
Paso 2. S3 = ∅. Vaya al paso 4.
Paso 4. Retroceso. La etiqueta [30, 2] en el nodo 3, proporciona el nodo inmediatamente
anterior r = 2. Elimine el nodo 3 tachándolo para no considerarlo en esta iteración.
Establezca i = r = 2, y repita el paso 2.
Paso 2. S2 = {5}.
Paso 5. N3 = [1, 2, 5] y f3 = mín {∞, 10, 30} = 10. Las capacidades residuales a lo largo de
la ruta N3 son:
(c12 , c21 ) = (10 − 10, 10 + 10) = (0, 20)
(c25 , c52 ) = (30 − 10, 0 + 10) = (20, 10)
14
Iteración 4 .
0 4 10
15
[ ,-] 10 10
[20,2]
1 10 10 5
0
20
0
20 20
20 0
2 30
3
10
[10,3] [10,1]
Paso 2. S1 = {3, 4}.
paso 2.
Paso 2. S3 = {2}.
paso 2.
Paso 2. S2 = {5}.
Paso 5. N4 = [1, 3, 2, 5] y f4 = mín {∞, 10, 10, 20} = 10. Las capacidades residuales a lo
largo de la ruta N4 son:
(c13 , c31 ) = (10 − 10, 20 + 10) = (0, 30)

(c32 , c23 ) = (10 − 10, 30 + 10) = (0, 40)
(c25 , c52 ) = (20 − 10, 10 + 10) = (10, 20)
Iteración 5 .
15
1. MODELOS DE REDES
[10,1]
0 4 10
15
[ ,-]
10 10
[10,4]
1 0 20 5
0
20
0
10 30
20 0
2 40
3
0 [15,4]
Paso 2. S1 = {4}.

paso 2.
Paso 2. S4 = {3, 5}.

paso 2.
Paso 2. S3 = ∅. Vaya al paso 4.
Paso 4. Retroceso. La etiqueta [15, 4] en el nodo 3, proporciona el nodo inmediatamente

anterior r = 4. Elimine el nodo 3 tachándolo para no considerarlo en esta iteración.
Establezca i = r = 4, y repita el paso 2.
Paso 2. S4 = {5}.
Paso 5. N5 = [1, 4, 5] y f5 = mín {∞, 10, 10} = 10. Las capacidades residuales a lo largo de
la ruta N5 son:
(c14 , c41 ) = (10 − 10, 0 + 10) = (0, 10)

(c45 , c54 ) = (10 − 10, 10 + 10) = (0, 20)
Iteración 6 .
16
10 4 0
15
0 20
1 0 20 5
0
20
0
10 30
20 0
2 40
3
0
Paso 2. S1 = ∅). Como no se puede ir a otro nodo desde el origen, no es posible encontrar
otra ruta de avance. Continúe con el paso 6.
Paso 6. El flujo máximo en la red es F = f1 + f2 + f3 + f4 + f5 = 20 + 10 + 10 + 10 + 10 = 60

unidades. El flujo óptimo en los arcos individuales se calcula restando las cacidades
residuales en la red de la iteración 6 (cij , cji ) de las capacidades residuales de la red
inicial o capacidades de diseño (C ij , C ji ), como se muestra en la siguiente tabla.
Arco (C ij , C ji ) − (cij , cji )6 Cantidad de flujo Dirección
(1, 2) (20, 0) − (0, 20) = (20, −20) 20 1→2
(1, 3) (30, 0) − (0, 30) = (30, −30) 30 1→3
(1, 4) (10, 0) − (0, 10) = (10, −10) 10 1→4
(2, 3) (40, 0) − (40, 0) = (0, 0) 0 −
(2, 5) (30, 0) − (10, 20) = (20, −20) 20 2→5
(3, 4) (10, 5) − (0, 15) = (10, −10) 10 3→4
(3, 5) (20, 0) − (0, 20) = (20, −20) 20 3→5
(4, 3) (5, 10) − (15, 0) = (−10, 10) 10 3→4
(4, 5) (20, 0) − (0, 20) = (20, −20) 20 4→5
Ejemplo 1.4 (Flujo de aerolı́nea máximo) Las aerolı́neas Fly-by-Night deben determni-
nar cuántos vuelos de conexión diarios se pueden concretar entre Juneau, Alaska y Dallas,
Texas. Los vuelos de conexión deben deternerse en Seattle y después parar en Los Ángeles o
Denver. Debido al espacio de aterrizaje limitado, Fly-by-Night está limitado a hacer el número
de vuelos diarios entre los pares de ciudades que se muestran en la siguiente tabla. Establezca
un problema de flujo cuya solución le permita saber a la aerolı́nea cómo maximizar el número
de vuelos de conexión diarios de Juneau a Dallas. (Tomado de Winston [5])
17
1. MODELOS DE REDES
Ciudades Número máximo de vuelos diarios

Juneau-Seattle 3
Seattle-L.A. 2
Seattle-Denver 3
L.A.-Dallas 1
Denver-Dallas 2
Solución. El objetivo es conocer el número máximo de vuelos diarios que se pueden realizar
entre las ciudades de Juneau y Dallas. El primer paso para conocer este número, es construir
una red que represente el problema. Esta red se puede representar gráficamente como se
muestra en la Fig. 1.6, o bien en forma matricial. Posteriormente se utiliza la aplicación Flujo
Máximo referencia a descarga, para obtener los resultados del algoritmo, mismos que se
muestran en la Fig. 1.7.
Los Ángeles
2 1
3 3 2
1 2 3 5
Juneau Seattle Denver Dallas
Figura 1.6: Red que representa los Figura 1.7: Solución al problema de la aerolı́nea Fly-by-Night.
viajes entre Juneau y Dallas.
De acuerdo a los resultados del algoritmo se concluye que se pueden realizar un máximo de
3 vuelos diarios entre Juneau y Dallas (Flujo Máximo), de los cuales, 1 vuelo sigue la ruta
Juneau-Seattle-L.A.-Dallas(Flujo óptimo en los arcos (1,3),(2,4),(4,5) con 3,1,1 respectiva-
mente) y 2 vuelos siguen la ruta Juneau-Seattle-Denver-Dallas (Flujos óptimos en los arcos
(1,2),(2,3),(3,5) con 3,2,2 respectivamente).
Ejemplo 1.5 En fecha reciente se reservó el área de SEERVADA PARK para paseos y campa-
mentos. No se permite la entrada de automóviles, pero existe un sistema de caminos angostos
y sinuosos para tranvı́as y para “jeeps” conducidos por los guardabosques. En la Fig. 1.8 se
muestra este sistema de caminos, (sin las curvas) en donde O es la entrada al parque; las
otras letras representan la localización de las casetas de los guardabosques y otras instalacio-
nes de servicio. El parque contiene un mirador a un hermoso paisaje en la estación T. Algunos
tranvı́as transportan a los visitantes desde la entrada a la estación T y viceversa. Durante la
temporada pico, hay más personas que quieren tomar un tranvı́a a la estación T que aquellas
a las que se les puede dar servicio. Para evitar la perturbación indebida de la ecologı́a y de la
vida silvestre de la región, se ha impuesto un racionamiento estricto al número de viajes al
dı́a que pueden hacer los tranvı́as en cada camino. De esta forma, durante la temporada pico,
se pueden seguir varias rutas, sin tomar en cuenta la distancia, para aumentar el número de
viajes de tranvı́a diarios. La pregunta es cómo planear las rutas de los distintos viajes, de
manera que se maximice el número total de viajes que se pueden hacer al dı́a, sin violar los
lı́mites impuestos sobre cada camino. Tomado de Hillier [2]
Solución. El objetivo es conocer el número máximo de viajes diarios que se pueden realizar
entre la entrada al parque y el mirador. El primer paso para conocer este número representar
18
A 3
1
5
T
7 4 9
O B D
4 5
1
6
C E
4
Figura 1.8: Red que conecta pozos petroleros y refineı́as por medio de estaciones de redistribución.
la red de estaciones del parque en forma matricial. Posteriormente se utiliza la aplicación

Flujo Máximo referencia a descarga. A continuacin se muestran las iteraciones realizadas
por el algoritmo y los resultados obtenidos al final.
En la Fig. 1.9, se muestra como se obtuvo la primera ruta de avance, obteniendo un flujo
f1 = 5. En la Fig. 1.10 se muestran las capacidades residuales actualizadas a través de la ruta
de avance de la iteración.
Figura 1.9: Ruta de avance obtenida en la iteración 1. Figura 1.10: Actualización de las capacidades resi-
duales.
duales.
duales.
19
1. MODELOS DE REDES
duales.
duales.
Se observa en las figuras 1.11, 1.13, 1.15 y 1.17, las diferentes rutas de avance obtenidas
con sus flujos correspondientes f2 = 3, f3 = 4, f4 = 1 y f5 = 1. En las figuras 1.12, 1.14, 1.16
y 1.18, se muestra como se actualizan las capacidades residuales en cada iteración. Finalmente
en la Fig. 1.19, se puede observar que el conjunto de nodos alcanzables desde el origen (nodo 1)
es vacı́o, el cual es el indicador de que no es posible encontrar más rutas de avance y finalizan
las iteraciones del algoritmo dando lugar al cálculo del flujo máximo y los flujos óptimos.
Figura 1.19: Iteración 6, no se encontró ruta de avance.
En la Fig. 1.20, se muestran los resultados obtenidos al utilizar la aplicación Flujo Máxi-
mo observando que el máximo de viajes diarios al mirador de Seervada Park es de 14 y la
distribución de viajes a través de las estaciones se observa en los flujos óptimos. Los 14 viajes
diarios, salen del origen y se distribuyen en 4 a la estación A, 6 a la B y 4 a la C y de ahı́ a
20
las otras estaciones y finalmente al mirador.
Figura 1.20: Solución al problema de los viajes al mirador en Seervada Park..
Ejercicios
Ejercicio 1.1 Tres refinerı́as envı́an un producto de gasolina a dos terminales de distribución
a través de una red de oleoductos. Cualquier demanda que no puede ser satisfecha por medio
de la red se adquiere de otras fuentes. Tres estaciones de bombeo le dan servicio a la red, como
se muestra en la siguiente figura.
1 7
20 10
4
20 10 50
10
2 50 6
20 30 20
5
15 30
3 8
Estaciones de
Refinerías Terminales
bombeo
El producto fluye en la red en la dirección indicada por las flechas. La capacidad de cada
segmento de ducto (mostrada directamente en los arcos) está en millones de barriles por dı́a.
Determine lo siguiente:
a) La producción diaria en cada refinerı́a que iguala la capacidad máxima de la red.
b) La demanda diaria en cada terminal que iguala la capacidad máxima de la red.
21
1. MODELOS DE REDES
c) La capacidad diaria en cada bomba que iguala la capacidad máxima de la red.
d) Suponga que la capacidad diaria máxima de la bomba 6 en la red está limitada a 50 mi-
llones de barriles por dı́a. Remodele la red para incluir esta restricción. Luego determine
la capacidad máxima de la red.
Ejercicio 1.2 Se transporta alimento para gallinas por medio de camiones desde tres silos
hasta cuatro granjas. Algunos de los silos no pueden mandar los envı́os directamente a al-
gunas de las granjas. Las capacidades de las demás rutas están limitadas por la cantidad de
camiones disponibles y el número de viajes realizados diariamente. La siguiente tabla muestra
las cantidades diarias de abasto en silos y la demanda en las granjas (en miles de pesos). Las
entradas en las celdas de la tabla especifican las capacidades diarias de las rutas asociadas.
Granja
1 2 3 4
1 30 5 0 40 20
Silo 2 0 5 5 90 20
3 100 40 30 40 200
200 10 60 20
a) Determine el programa que satisface la demanda máxima.
b) ¿Satisfará el programa propuesto toda la demanda de las granjas?
c) Suponga que se permite el transbordo entre los silos 1 y 2 y los silos 2 y 3. Suponga
además que se permite el transbordo entre las granjas 1 y 2, 2 y 3 y 3 y 4. Las capacidad
diaria (en dos direcciones) máxima en las rutas de transbordo propuestas es de 50 (mil)
pesos. ¿Cuál es el efecto del transbordo en las demandas no satisfechas en las granjas?
Ejercicio 1.3 Un padre tiene cinco hijos (adolescentes) y cinco tareas domésticas que en-
comendarles. La experiencia pasada ha demostrado que obligar a un hijo a que realice una
tarea es contraproducente. Con esto en mente, el padre le pide a sus hijos que enumeren sus
preferencias entre las cinco tareas, como lo muestra la siguiente tabla:
Hijo Tarea preferida

Rif 3, 4 o 5
Mai 1
Ben 1o2
Kim 1, 2 o 5
Ken 2
El objetivo del padre ahora es terminar la mayor parte posible de tareas, al tiempo que respeta
las preferencias de los hijos, teniendo en cuenta que:
a) Cada hijo puede realizar sólo 1 tarea.
b) Cada hijo puede realizar más de 1 tarea.
22
Ejercicio 1.4 Cuatro fábricas producen cuatro tipos de juguetes. La siguiente tabla da una
lista de los juguetes que cada fábrica puede producir.
Fábrica Combinación de producciones de juguetes

1 1, 2, 3
2 2, 3
3 1, 4
4 3, 4
Todos los juguetes requieren de alguna manera la misma mano de obra y material por unidad.
Las capacidades diarias de las cuatro fábricas son de 250, 180, 300 y 100 juguetes, respec-
tivamente. Las demandas diarias de los cuatro juguetes son 200, 150, 350 y 100 unidades,
respectivamente. Determine los programas de producción de las fábrica que más satisfarán las
demandas de los cuatro juguetes.
Ejercicio 1.5 El consejo acádemico de la Universidad de Arkansas está buscando represen-

tantes entre seis estudiantes que estén afiliados a sociedades honorı́ficas. La representación
ante el consejo académico incluye tres áreas: matemáticas, arte e ingenierı́a. Cuando mu-
cho dos estudiantes de cada área pueden estar en el consejo. La siguiente tabla muestra la
membresı́a de los seis estudiantes en las cuatro sociedades honorı́ficas:
Sociedad Estudiantes afiliados

1 1, 2, 3
2 1, 3, 5
3 3, 4, 5
4 1, 2, 4, 6
Los estudiantes calificados en las áreas de matemáticas, arte e ingenierı́a se muestran en la

siguiente tabla:
Área Estudiantes calificados

Matemáticas 1, 2, 4
Arte 3, 4
Ingenierı́a 4, 5, 6
Un estudiante capacitado en más de un área debe ser asignado exclusivamente a sólo un área.
¿Pueden estar representadas las cuatro sociedades honorı́ficas en el consejo?
Ejercicio 1.6 Cinco camiones entregan siete tipos de paquetes. Hay tres paquetes de cada
tipo, y las capacidades de los cinco camiones son 6, 4, 5, 4 y 3 paquetes, respectivamente.
Prepare un problema de problema de flujo máximo que se pueda usar para determinar si
pueden cargarse los paquetes de modo que ningún camión lleve dos paquetes del mismo tipo.
1.1.4. Algoritmo de Dijkstra (ruta más corta)

Este algoritmo tiene como objetivo encontrar la ruta más corta de un origen establecido a
cualquiera de los destinos posibles en la red. A diferencia del algoritmo de expansión mı́nima
23
1. MODELOS DE REDES
no es necesario que cada par de nodos se encuentre conectado, además que con este algoritmo
no se busca el diseño de una red, sino encontrar el camino óptimo (con menor distancia,
tiempo o costo) que nos lleve de un origen a cualquier destino en la red.
Algoritmo de Dijkstra [3]. Sea ui la distancia más corta del nodo identificado como
origen (puede ser cualquier nodo de la red) al nodo i, y defina dij (≥ 0) como la longitud del
arco (i, j). El algoritmo define la etiqueta para un nodo j que sigue inmediatamente como:
[uj , i] = [ui + dij , i] , dij ≥ 0
La etiqueta para el nodo de inicio es [0, −], que indica que el nodo no tiene predecesor.
Las etiquetas de nodo en el algoritmo de dijkstra son de dos tipos: temporales y permanentes.
Una etiqueta temporal en un nodo se modifica si puede hallarse una ruta más corta al nodo.
De lo contrario, el estado temporal cambia a permanente.
Paso 0. Etiquete el nodo de origen con la etiqueta permanente [0, −]. Establezca i = 1.
Paso general i: a) Calcule las etiquetas temporales [ui + dij , i] para cada nodo j con dij > 0, siempre
que j no esté etiquetado permanentemente. Si el nodo j ya tiene una etiqueta
temporal existente [uj , k] hasto otro nodo k y si ui + dij < uj , reemplace [uj , k] con
[ui + dij , i].
b) Si todos los nodos etiquetados tienen etiquetas permanentes deténgase. De lo con-
trario, seleccione la etiqueta [ur , s] que tenga la distancia más corta (= ur ) entre
toras las etiquetas temporales. En caso de empate se anexa la otra etiqueta al nodo
para de esta forma poder obtener todas las posibles rutas más cortas. Establezca
i = r y repita el paso i.
Ejemplo 1.6 (Tomado de [3]) La red de la Fig. 1.21 proporciona las rutas permisibles y sus
longitudes en millas entre la ciudad 1 (nodo 1) y las otras ciudades (nodos 2 a 5). Determine
las rutas más cortas entre la ciudad 1 y cada una de las cuatro ciudades restantes.
2
15
4
100
20
50
10
1 30 3 60 5
Figura 1.21: Red de ciudades para ejemplo del algoritmo de Dijkstra.
Solución. El algoritmo de Dijkstra encuentra las rutas más cortas entre un nodo origen a
cualquier otro nodo de una red, por lo que es el que utilizaremos para encontrar las rutas
más cortas de la ciudad 1 a las otras ciudades. A continuación, se describen las iteraciones
del algoritmo. En las figuras se usa un superı́ndice en las etiquetas de los nodos para indicar
la iteración en la que la etiqueta cambió a estado permanente.
24
Iteración 0. Asigne la etiqueta permanente [0, −] al nodo inicial (nodo 1).
2
15
100
4 Nodo Estado Iteración Etiqueta
20
1 P 0 [0, −]
50
10
1 30 3 60 5
[0,-]
Iteración 1 . El nodo actual es el nodo que cambió su estado a permanente en la iteración an-
terior (nodo 1). Se observa que desde el nodo actual, se puede llegar a los nodos 2
y 3, por lo que se procede a etiquetarlos (debido a que no tienen ninguna etiqueta).
[100,1]
2
15
Nodo Estado It. Etiqueta
4 1 P 0 [0, −]
100
20
2 T [0 + 100, 1] = [100, 1]
50
10
1 30 3 60 5 3 T [0 + 30, 1] = [30, 1]
0
[0,-] [30,1]
Después de etiquetar se observa que se tienen dos etiquetas temporales, la del nodo 2
con una distancia de 100 y la del nodo 3 con una distancia de 30. Se cambia el estado
del nodo 3 a permanente ya que cuenta con la distancia mı́nima (u3 = 30).
Iteración 2 . Se observa que desde el nodo 3 (actual), se puede llegar a los nodos 4 y 5, por lo que
se procede a etiquetarlos.
[100,1]
2
15
[40,3] 1 P 0 [0, −]
4 2 T [100, 1]
100
20
[90,3] 3 P 1 [30, 1]
50
10
1 30 3 60 5 4 T [30 + 10, 3] = [40, 3]

[0,-]
0
[30,1]
1 5 T [30 + 60, 3] = [90, 3]
Se cambia el estado a permanente de la etiqueta [40, 3] correspondiente al nodo 4 (u4 =

40).
Iteración 3 . Desde el nodo 4 se puede llegar a los nodos 2 y 5, por lo que se procede a revisar sus
etiquetas con el objetivo saber si las conservan, se anexa alguna etiqueta con la misma
distancia pero de diferente nodo o se reemplaza la etiqueta por una de menor distancia.
25
1. MODELOS DE REDES
[100,1][55,4] Nodo
EtiquetaEstado It.
2 [40,3]
2 [0, −]
1 P 0
15
4
2
[40 T
+ 15, 4] = [55, 4]
100 3
1 [30, 1] P
20
[90,4]
[90,3]
50
10
4
2 [40, 3] P
1 30 3 60 5
[90, 3]
[0,-]
0
[30,1] 5
1 T
[40 + 50, 4] = [90, 4]
Se cambia el estado a permanente de la etiqueta [55, 4] correspondiente al nodo 2 (u2 =
55).
Iteración 4 . Desde el nodo 2, no es posible llegar a nodos sin etiquetas o con etiquetas temporales.
3
[55,4] Nodo
Etiqueta Estado It.
2 [40,3]
2 [0, −]
1 P 0
15
4
[55,24] P 3
3
[30, 1] P 1
100
20
[90,4]
[90,3]
50
10
4
[40, 3] P 2
1 30 3 60 5
[90, 3]
[0,-]
0
[30,1] 5
1 T
[90, 4]
La única etiqueta temporal es la correspondiente al nodo 5. Se cambia el estado a
permanente de la etiqueta correspondiente al nodo 5. (u5 = 90).
Ahora que todos los nodos tienen estado permante, termina el algoritmo y la red queda como
se muestra a continuación.
3
[55,4]
2 2
15
[40,3]
1 P 0 [0, −]
4
[90,4]
2 P 3 [55, 4]
4
100
20
[90,3] 3 P 1 [30, 1]
4
50
10
1 30 3 60 5 4 P 2 [40, 3]
0
[0,-] [30,1]
1 5 P 4 [90, 3] [90, 4]
La ruta más corta entre el nodo 1 y cualquier otro nodo de la red se determina partiendo del
nodo destino deseado y retrocediendo hasta el nodo de inicio utilizando la información en las
etiquetas permanentes [3]. Por ejemplo, la siguiente secuencia determina la ruta más corta del
nodo 1 al nodo 2:
(2) → [55, 4] → (4) → [40, 3] → (3) → [30, 1] → (1)

Por lo tanto, la ruta deseada es 1 → 3 → 4 → 2 con una distancia de 55 millas.
Ejemplo 1.7 (Reemplazo de equipo. Tomado de [5]) Acabo de comprar (en el tiempo
0) un automóvil nuevo por $12000. El costo de mantener un automóvil durante un año de-
pende de su edad al comienzo del año, como se da en la tabla 1.1. Para evitar costos de
mantenimiento altos con un automóvil más antiguo, podrı́a entregar a cuenta mi automóvil y
comprar uno nuevo. El precio que recibo por dejar a cuenta mi automóvil, depende de la edad
del automóvil al momento del intercambio (véase la tabla 1.2). Para simplificar los cálculos,
suponga que en cualquier instante el costo de un automóvil nuevo son $12000. El objetivo es
26
minimizar el costo neto (costos de compra + costos de mantenimiento - dinero recibido por
intercambio) en que se incurre en los cinco años siguientes. Formule este problema como uno
de ruta más corta.
Edad del Costos de Edad del

Precio del in-
automóvil mantenimiento automóvil
tercambio
(años) anual (años)
0 2000 1 7000
1 4000 2 6000
2 5000 3 2000
3 9000 4 1000
4 12000 5 0
Tabla 1.1: Costos de mantenimiento del automóvil. Tabla 1.2: Precios de intercambio del automóvil.
Solución. Este problema de reemplazo de equipo se modela como sigue: La red tendrá seis
nodos. Cada nodo representa el comienzo del año correspondiente, en otras palabras, el nodo i
es el comienzo del año i. Para i < j, un arco (i, j) corresponde a comprar un automóvil nuevo
al comienzo del año i y conservarlo hasta el comienzo del año j. La longitud del arco (i, j)
(llámela cij ) es el costo neto total en que se incurre por tener y operar un automóvil desde el
comienzo del año i al comienzo del año j si se compra un automóvil nuevo al comienzo del
año i y este automóvil se intercambia por uno nuevo al comienzo del año j. Ası́,
cij = costo de mantenimiento en que se incurrió durante los añosi, i + 1, . . . , j − 1

+ costo de comprar automóvil al comienzo del añoi
− valor de intercambio recibido al comienzo del añoj
Al aplicar esta fórmula a la información del problema, se obtiene (los costos están en miles)
c12 = 2 + 12 − 7 = 7 c26 = 2 + 4 + 5 + 9 + 12 − 1 = 31
c13 = 2 + 4 + 5 + 12 − 6 = 12 c34 = 2 + 12 − 7 = 7
c14 = 2 + 4 + 5 + 12 − 2 = 21 c35 = 2 + 4 + 12 − 6 = 12
c15 = 2 + 4 + 5 + 9 + 12 − 1 = 31 c36 = 2 + 4 + 5 + 12 − 2 = 21
c16 = 2 + 4 + 5 + 9 + 12 + 12 − 0 = 44 c45 = 2 + 12 − 7 = 7
c23 = 2 + 12 − 7 = 7 c46 = 2 + 4 + 12 − 6 = 12
c24 = 2 + 4 + 12 − 6 = 12 c56 = 2 + 12 − 7 = 7
c25 = 2 + 4 + 5 + 12 − 2 = 21
Ahora se ve que la longitud de cualquier trayectoria del nodo 1 al nodo 6 es el costo neto en
que se incurrió durante los siguientes cinco años correspondientes a una estrategia particular
de intercambio. Ası́, la longitud de la trayectoria más corta del nodo 1 al nodo 6 en la Fig.
1.22 es el costo neto mı́nimo en que se incurre al operar un automóvil los siguientes cinco
años.
Se utiliza la aplicación Algoritmo de Dijkstra referencia a descarga, para obtener la
ruta más corta en este problema. Se captura la red en forma matricial como se muestra en la
siguiente Fig. 1.23, las iteraciones en las figuras 1.24, 1.25, 1.26, 1.27 y 1.28.
27
1. MODELOS DE REDES
44
31
31
21
21
12 12
1 7 2 7 3 7 4 7 5 7 6
12 12
21
Figura 1.22: Red del problema de reemplazo de equipo
Figura 1.23: Representación matricial de la red de reemplazo de equipo
Figura 1.25: Iteración 2


28
En la Fig. 1.29, se muestra la tabla de los nodos de la red con las etiquetas permanentes,
de las cuales se pueden obtener las distancias del nodo inicial al nodo destino y las rutas.
También se muestran todas las posibles rutas desde el nodo inicial hasta todos los otros nodos
de la red.
Figura 1.29: Resultados del algoritmo de Dijkstra
1.1.5. Algoritmo de Floyd (ruta más corta)
Este algoritmo te permite conocer la distancia más cor-

ta entre un par cualesquiera de nodos en una red, a diferen- k
cia del algoritmo de Dijkstra que solamente te proporciona

j
la distancia más corta entre un nodo origen y los nodos
i
restantes de la red. Para este algoritmo, es necesario repre-
sentar la red como una matriz (llamada matriz de distan- Figura 1.30: Operación triple de Floyd
cias) de n × n, donde n es el número de nodos. La entrada
(i, j) de la matriz proporciona la distancia dij del nodo i al nodo j, la cual es finita si i está
vinculado directamente a j, e infinita en caso contrario.
La idea general del algoritmo de Floyd es verificar si es más corto llegar de un nodo i a
un nodo j pasando por un nodo intermedio k, que ir directamente de i a j (ver Fig. 1.30). De
otra forma, es más corto llegar de i a j pasando por k si
dik + dkj < dij
En este caso se reemplaza la ruta directa i → j con la ruta indirecta i → k → j. A esta

comparación e intercambio se le llama operación triple y se aplica como se describe en los
siguientes pasos [3].
Paso 0. Defina la matriz de la distancia de inicio D0 y la matriz de secuencia de nodos S0

(matriz en la que se almacenan las rutas directas e indirectas entre cada par de nodos).
29
1. MODELOS DE REDES
Establezca k = 1.
1 2 ... j ... n 1 2 ... j ... n
1 − d12 . . . d1j . . . d1n 1 − 2 ... j ... n
2 d21 − . . . d2j . . . d2n 2 1 − ... j ... n
. .. .. .. .. .. .. . . . .. .. .. ..
D0 = .. . . . . . . S0 = .. .. .. . . . .
i di1 di2 . . . dij . . . din i 1 2 ... j ... n
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . . . .
n dn1 dn2 . . . dnj ... − n 1 2 ... j ... −
Paso general k: Defina la fila k y la columna k como fila pivote y columna pivote. Aplique la operación
triple a cada elemento dij en Dk−1 , para todas las i y j diferentes de k. Si la condición
dik + dkj < dij , (i 6= k, j 6= k y i 6= j)
se satisface, realice los siguientes cambios:
a) Cree Dk reemplazando dij en Dk−1 con dik + dkj

b) Cree Sk reemplazando sij con k. Establezca k = k + 1. Si k = n + 1 deténgase: de
lo contrario repita el paso k.
Al finalizar las n iteraciones del algoritmo, es posible determinar la ruta más corta entre los
nodos i y j a partir de las matrices Dn y Sn aplicando las siguientes reglas:
1. dij a partir de Dn determina la distancia de la ruta más corta entre los nodos i y j.
2. A partir de Sn , determine el nodo intermedio k = sij que da en resultado la ruta

i → k → j. Si sik = k y skj = j, deténgase; todos los nodos intermedios de la ruta
han sido encontrados. De lo contrario, encuentre todos los nodos intermedios de la ruta
repitiendo este procedimiento cada vez que se encuentre un nodo intermedio k.
Ejemplo 1.8 Para la red de la Fig. 1.31, halle las rutas más cortas entre cada par de nodos.
Las distancias (en millas) se dan en los arcos. El arco (3, 5) es direccional, es decir, no se
permite el tráfico del nodo 5 al nodo 3. Todos los demás arcos permiten el tráfico en dos
direcciones.
2 5 4
3
1 10 3 15 5
Figura 1.31: Red para el ejemplo del algoritmo de Floyd
30
Solución. Utilizando la aplicación AlgoritmoFloyd referencia a descarga, se resuelve este

problema y se observan los cambios que se dan a través de las iteraciones del algoritmo. Al
final se mostrará como obtener la ruta más corta entre un par de nodos y su distancia.
Iteración 0. Se representa la red con las matrices D0 y S0 .
Iteración 1. Establezca k = 1. La fila y columnas pivote, son la fila y columna 1 de la matriz y se

muestran sombreadas en color verde en la matriz D0 . Las celdas d23 y d32 son las únicas
que la operación triple puede mejorar. Por lo tanto, D1 y S1 se obtienen a partir de D0
y S0 aplicando las siguientes acciones:
1. Reemplace d23 con d21 + d13 = 3 + 10 = 13 y establezca s23 = 1.

2. Reemplace d32 con d31 + d12 = 10 + 3 = 13 y establezca s32 = 1.
Estos cambios se muestran en negritas en las matrices D1 y S1 .
Iteración 2. Establezca k = 2 y ahora la fila y columna pivote son la fila y columna 2 en la matriz
D1 . La operación triple se aplica a las celdas sombreadas en azul que no pertenecen a
la fila y columna pivote.
Iteración 3. Establezca k = 3, como se muestra por la fila y la columna sombreadas en D2 . Las

nuevas matrices son D3 y S3
31
1. MODELOS DE REDES
Iteración 4. Establezca k = 4, como se muestra por la fila y la columna sombreadas en D3 . Las

nuevas matrices son D4 y S4
Iteración 5. Establezca k = 5, como se muestra por la fila y la columna sombreadas en D4 .No son
posibles más mejoras en esta iteración.D5 = D4 y S5 = S4
Ahora se utilizan las matrices D5 y S5 para determinar las distancias y obtener la ruta más
corta entre cada par de nodos de la red. La distancia más corta del nodo 1 al nodo 5 es
d15 = 12millas. Para determinar la ruta asociada, se verifica si la ruta es directa (la ruta
es directa si s15 = 5), como s15 = 4, del nodo 1 al nodo 5 se pasa primero por el nodo 4,
quedando
1→4→5
Ahora sigue verificar si las rutas 14 y 45 son directas. s14 = 2 6= 4 por lo que la ruta de 1 a 4
pasa por el nodo 2 por lo que la ruta queda como sigue:
1→2→4→5
Ahora como s12 = 2, s24 y s45 = 5 son rutas directas, la ruta más corta se define como:
1→2→4→5
Ejercicio 1.7 Seis niños, Joe, Kay, Jim, Bob, Rae y Kim juegan una variante del juego
infantil de las escondidas. Sólo algunos de los niños conocen el escondite de un niño. Luego
un niño hace pareja con otro con el objetivo de encontrar el escondite del compañero. Esto
puede lograrse mediante una cadena de otros niños que finalmente permitirá descubrir el
escondite del niño designado. Por ejemplo, suponga que Joe tiene que encontrar a Kim y que
Joe sabe dónde está escondido Jim, quien a su vez sabe dónde está escondido Kim. Por lo
tanto, Joe puede encontrar a Kim si halla primero a Jim, quien a su vez conducirá a Joe al
escondite de Kim. La siguiente lista proporciona los paraderos de los niños:
Joe conoce los escondites de Bob y Kim.
Kay conoce los escondites de Bob, Jim y Rae
32
1.2. REDES Y ALGORITMOS PARA LA ADMINISTRACIÓN DE PROYECTOS
Jim y Bob conocen sólo el escondite de Kay
Rae conoce el escondite de Kim
Kim conoce los escondites de Joe y Bob
Idee un plan para que cada ninõ encuentre a todos los demás ninõs utilizando el número
mı́nimo de contactos. ¿Cuál es el número máximo de contactos?
1.2. Redes y algoritmos para la administración de proyectos

La administración de proyectos es un trabajo que requiere monitorear y controlar el de-
sarrollo de muchas actividades, algunas que se realizan en paralelo, por lo cual es necesario
utilizar herramientas que nos apoyen a lograr este objetivo. La técnica de revisión y eva-
luación de programas (PERT por sus siglas en inglés) y el método de la ruta crı́tica (CPM
por sus siglas en inglés) son dos técnicas de investigación de operaciones que mantienen una
estrecha relación y son adecuadas para apoyar al administrador de proyectos. Entre los tipos
de proyectos que han sido administrados utilizando PERT y CPM se pueden mencionar los
siguientes[2]:
1. Construcción de una planta industrial.
2. Investigación y desarrollo de un nuevo producto.
3. Proyectos de exploración espacial de la NASA.
4. Producciones de cine.
5. Construcción de un barco.
6. Reubicación de una importante instalación en una empresa.
7. Mantenimiento de un reactor nuclear
8. Instalación y administración de un sistema de información.
9. Realizar una campaña publicitaria.
PERT fue desarrollado a finales de los años cincuenta (1958) por la Marina de los Estados
Unidos de América en cooperación con la firma asesora en administración Booz, Allen y
Hamilton para su uso en el programa de ingenierı́a y desarrollo del misil Polaris. Por otra
parte, CPM fue desarrollado en 1957 por J.E. Kelly de Remington Rand y M.R. Walker de
Dupont para ayudar en la construcción y mantenimiento de las plantas quı́micas de duPont.
Estas dos técnicas difieren en que CPM asume duraciones de actividad determinı́sticas
(supone que se sabe con certeza la duración de cada actividad) y PERT supone duracio-
nes probabilı́sticas proporcionando tres estimaciones de duración para cada actividad. Sin
embargo, ambas siguen estos seis pasos[1]:
1. Definir el proyecto y preparar la estructura de desglose del trabajo.
33
1. MODELOS DE REDES
2. Desarrollar las relaciones entre las actividades. Decidir qué actividad debe preceder y
cuál debe seguir a otras.
3. Dibujar la red que conecta todas las actividades.
4. Asignar estimaciones de tiempo y/o costo a cada actividad.
5. Calcular el tiempo de la ruta más larga a través de la red. Ésta se denomina la ruta
crı́tica.
6. Usar la red como ayuda para planear, programar, supervisar y controlar el proyecto.
Finalmente, ambas técnicas son importantes porque facilitan la respuesta a preguntas

como las siguientes:
1. ¿Cuándo concluirá el proyecto?
2. ¿Cuáles son las actividades o tareas crı́ticas del proyecto –es decir, qué actividades
retrasarán todo el proyecto si se demoran?
3. ¿Cuáles son las actividades no crı́ticas –aquellas que pueden retrasarse sin detener la
conclusión de todo el proyecto?
4. ¿Cuál es la probabilidad de terminar el proyecto en una fecha especı́fica?
5. Para una fecha en particular, ¿el proyecto está a tiempo, retrasado o adelantado con
respecto al programa?
6. Para una fecha dada, ¿el dinero es igual, menor o mayor que la cantidad presupuestada?
7. ¿Se dispone de suficientes recursos para terminar el proyecto a tiempo?
8. Si el proyecto debe terminar en menor tiempo, ¿cuál es la mejor manera de lograr esta
meta al menor costo?
En la siguiente sección se analizará como construir la red de un proyecto dadas las activi-
dades y precedencias de cada actividad, utilizando la técnica de actividad en nodo.
1.2.1. Construcción de la red

Para poder aplicar las técnicas de administración de proyectos PERT/CPM es necesario
representar el proyecto en forma de red (un conjunto de nodos y arcos que unen dichos
nodos). El primer paso para construir dicha red consiste en dividir el proyecto en actividades
significativas de acuerdo con la estructura de desglose del trabajo. La información necesaria
en cada activdad para describir el proyecto es la siguiente:
1. Relaciones de Precedencia: Identifique los predecesores inmediatos para cada actividad.
2. Duración de la actividad: Estime la duración de cada actividad.
34
Existen dos formas de construir la red de un proyecto:Colocando las actividades en los

arcos (AEA) y colocando las actividades en los nodos (AEN). En las redes AEA se utilizan los
nodos para separar las actividades y los arcos consumen tiempo y recursos. En las redes AEN
los nodos representan las actividades y los arcos indican la precedencia de cada actividad. Las
versiones originales de PERT y CPM usaron redes AEA, sin embargo, las redes de proyectos
con AEN poseen algunas ventajas importantes sobre las redes de proyectos con AEA.
Las redes de proyectos AEN son mucho más sencillas de construir que las que tienen
AEA.
Las redes de proyectos AEN son más sencillas de entender para los usuarios inexpertos,
incluyendo algunos gerentes.
Las redes de proyectos AEN son más fáciles de revisar que las AEA cuando ocurren
cambios en el proyecto.
Ejemplo 1.9 (Tomado de [1]) La empresa Milwaukee Paper Manufacturing, Inc., ubicada
cerca del centro de la ciuidad de Milwaukee, ha tratado de evitar durante mucho tiempo el gasto
de instalar en su planta equipo para el control de la contaminación del aire. Recientemente,
la Oficina para la Protección del Medio Ambiente de Estados Unidos (EPA) le ha dado 16
semanas para que instale un complejo sistema para filtrar el aire. Milwaukee Paper recibió
la advertencia de que tendrá que cerrar su fábrica a menos que instale el dispositivo en el
periodo especificado. Joni Steinber, administradora de la planta, quiere asegurarse de que la
instalación del sistema de filtrado avance sin complicaciones y termine a tiempo.
Solución. Milwaukee Paper ha identificado las ocho actividades que deben realizarse para
terminar el proyecto. Cuando el proyecto comience, se pueden realizar dos actividades en
forma simultánea: construir los componentes internos para el dispositivo (actividad A) y hacer
las modificaciones necesarias en pisos y techos (actividad B). La construcción de la pila de
recolección (actividad C) puede comenzar cuando los componentes internos estén instalados.
El vaciado del piso de concreto y la instalación del marco (actividad D) pueden comenzar
tan pronto como los componentes internos estén completos y los techos y pisos hayan sido
modificados. Después de construir la pila de recolección, pueden comenzar dos actividades
más: la construcción del horno de alta temperatura (actividad E) y la instalación del sistema
de control de contaminacón (actividad F). El dispositivo para el aire contaminado puede
instalarse (actividad G) después de vaciar el piso de concreto, instalar el marco y construir el
horno de alta temperatura. Por último, una vez instalado el sistema de control y el dispositivo
para el aire contaminado, se puede inspeccionar y probar el sistema (actividad H).
Sin embargo, presentar las actividades y relaciones de esta forma puede resultar confuso,
por lo tanto, es conveniente registrar todas las actividades en una tabla, como se muestra en
la tabla 1.3.
La red AEN que representa la tabla 1.3 queda como sigue:
35
1. MODELOS DE REDES
Actividad Descripción Precedentes

inmediatos
A Construir componentes internos –
B Modificar pisos y techos –
C Construir pila de recolección A
D Vaciar concreto e instalar marco A, B
E Constuir horno de alta temperatura C
F Instalar sistema de control de contaminación C
G Instalar dispositivo para aire contaminado D, E
H Inspeccionar y probar F, G
Tabla 1.3: Actividades para el proyecto de Milwaukee Paper
F
A C
Inicio E H Fin
B D G
1.2.2. Algoritmo de la ruta crı́tica (CPM)

En una red AEN existen varias rutas que van del inicio al final de proyecto. La ruta que
determina la duración del proyecto es la de mayor duración. A esta ruta se le llama ruta
crı́tica y las actividades que se encuentran en ella son actividades crı́ticas. El algoritmo que
determina la(s) ruta(s) crı́tica(s) en un proyecto también determinan en que momento debe
de iniciar y finalizar cada actividad, y si alguna actividad pudiera retrasarse sin afectar la
duración del proyecto.
Para calcular la ruta crı́tica calculamos dos tiempos distintos de inicio y terminación para
cada actividad. Dichos tiempos se definen de la manera siguiente:
Inicio más próximo (IP ) =el tiempo más cercano en que puede empezar
una actividad, suponiendo que todas las activi-
dades precedentes han sido completadas.
Finalización más próxima (F P ) =el tiempo más cercano en que una actividad
puede terminar.
Inicio más lejano (IL) =tiempo más lejano en que una actividad puede
comenzar sin retrasar el tiempo de terminación
de todo el proyecto.
Finalización más lejana (F L) =tiempo más lejano en que una actividad puede
terminar sin retrasar el tiempo de terminación
de todo el proyecto.
36
Para determinar el programa de tiempos para cada actividad se usa un proceso de dos
pasadas, el cual consiste en una pasada hacia adelante y una pasada hacia atrás. Los tiempos
más próximos para iniciar y terminar (IP y F P ) se determinan durante la pasada hacia
adelante. Los tiempos más lejanos para iniciar y terminar (IL y F L) se determinan durante
la pasada hacia atrás.
Pasada hacia adelante

Comienza con las actividades que inician el proyecto. Para cada actividad se calculan los
tiempos de inicio y finalización más próximos (IP y F P ). Regla del tiempo de inicio
más próximo: Antes de iniciar una actividad, todos sus precedentes inmediatos deben haber
terminado.
Si una actividad tiene sólo un precedente inmediato, su IP es igual al F P de su prece-

dente.
Si una actividad tiene múltiples precedentes inmediatos, su IP es el máximo de todos

los valores de F P de sus precedentes. Es decir,
IP = máx {F P de todos los precedentes inmediatos}
Regla del tiempo de finalización más próximo: El tiempo de finalización más próximo
(F P ) de una actividad se define como sigue:
F P = IP + duración de la actividad
Pasada hacia atrás

Empieza con las actividades que finalizan el proyecto. Para cada actividad, primero deter-
minamos su valor de F L, seguido por su valor de IL. En este proceso se usan las siguientes
dos reglas. Regla del tiempo de finalización más lejano:
Si una actividad tiene un solo sucesor (dicho de otra forma, es precedente inmediato de
una sola actividad), su F L es igual al IL de su único sucesor.
Si una actividad tiene múltiples sucesores (o bien, es precedente inmediato de múltiples

actividades), su F L es el mı́nimo de todos los valores IL de sus sucesores. Es decir,
F L = mı́n {ILde todos los sucesores de la actividad}
Regla del tiempo de inicio más lejano: De manera similar al cálculo de F P , el tiempo
IL se calcula como sigue:
IL = F L − duración de la actividad
Una vez se calcularon los tiempos más próximos y más lejanos de cada actividad, es
momento de calcular la holgura e identificar la ruta crı́tica.
37
1. MODELOS DE REDES
Cálculo de la holgura de cada actividad

Después de calcular los tiempos más próximos y más lejanos, es sencillo calcular la holgura
de cadad actividad. La holgura es la cantidad de tiempo que una actividad se puede demorar
si afectar la duración total del proyecto. La holgura se calcula como sigue:
H = IL − IP o bien, H = T L − T P
Las actividades con holgura(H) igual a cero se llaman actividades crı́ticas y por lo tanto
son las que forman la ruta crı́tica del proyecto. Estas actividades deben de monitorearse
cuidadosamente debido a que un retraso en ellas retrasa todo el proyecto. La ruta crı́tica es
una trayectoria continua a través de la red del proyecto que:
Empieza en la primera actividad del proyecto.
Termina en la última actividad del proyecto.
Incluye sólo actividades crı́ticas.
Finalmente es importante mencionar que puede existir más de una ruta crı́tica en nuestro
proyecto.
Ejemplo 1.10 (Tomado de [2]) La compañı́a de construcción “El muro” ha ganado una
licitación por $5.4 millones para construir un nueva planta para una empresa importante a
nivel nacional. La empresa necesita que la planta inicie operaciones dentro de un aõ. Sin
embargo, el contrato incluye las siguientes cláusulas:
Una penalización de $300, 000 si “El muro” no ha terminado la construcción para la

fecha de entrega en la semana 47, después de inciado el proyecto.
Para proporcionar un incentivo por terminar antes, un bono de $150, 000 se pagará a
“El muro” si la planta se termina en 40 semanas.
“El muro” asignó al proyecto a su mejor administrador, David Rojas, para asegurarse que
se mantenga de acuerdo a lo planeado. Él tiene como objetivo mantener el proyecto dentro
de agenda, y posiblemente terminarlo antes. Sin embargo, piensa que no es factible terminar
en 40 semanas sin incurrir en costos excesivos, por lo que ha decidido enfocarse en el plan
inicial de 47 semanas.
El Sr. Rojas necesitará organizar diversos equipos para realizar las diversas actividades
de construcción a tiempos diferentes. La tabla 1.4 muestra su lista de actividades. La ter-
cera columna proporciona información adicional importante para coordinar la agenda de los
equipos.
Utilice el algoritmo de la ruta crı́tica para hallar, los tiempos más próximos y más lejanos
de cada actividad, la holgura y la ruta crı́tica.
Solución. De acuerdo al algoritmo de la ruta crı́tica (CPM), es necesario conocer los prede-
cesores y los sucesores de cada actividad. Para facilitar esta tarea, se construye la red de este
proyecto quedando como sigue.
38
Actividad Descripción Predecesores Duracióin

inmediatos estimada
A Excavar – 2 semanas
B Hacer los cimientos A 4 semanas
C Levantar las paredes B 10 semanas
D Colar el techo C 6 semanas
E Instalar la plomerı́a exterior C 4 semanas
F Instalar la plomerı́a interior E 5 semanas
G Colocar el recubrimiento exterior D 7 semanas
H Aplicar la pintura exterior E, G 9 semanas
I Hacer la instalación eléctrica C 7 semanas
J Instalar la tablaroca F, I 8 semanas
K Colocar el piso J 4 semanas
L Aplicar la pintura interior J 5 semanas
M Instalar los accesorios externos H 2 semanas
N Instalar los accesorios internos K, L 6 semanas
Tabla 1.4: Lista de actividades del proyecto para el “El muro”
Inicio 0
A 2
B 4
10
C
D 6 I 7
E 4
G 7 F 5
H 9 J 8
K 4 L 5
M 2
N 6
Fin 0
39
1. MODELOS DE REDES
En la red de la figura anterior se observa un número a un costado de cada actividad, este

número es la duración de la actividad. Se iniciar la pasada hacia adelante para obtener los
tiempos de inicio y finalización más próximos, mismos que se registrarán a un costado del
nodo con la notación T P (IP, F P ). Los T P de los nodos A, B, C, D, E, G y H son:
NodoA : IP = 0; F P = 0 + 2 = 2
NodoB : IP = 2; F P = 2 + 4 = 6
NodoC : IP = 6; F P = 6 + 10 = 16
NodoD : IP = 16; F P = 16 + 6 = 22
NodoE : IP = 16; F P = 16 + 4 = 20
NodoG : IP = 22; F P = 22 + 7 = 29
NodoH : IP = máx 29, 20; F P = 29 + 9 = 38
Inicio 0 TP(0,0)
A 2 TP(0,2)
B 4 TP(2,6)
10 TP(6,16)
C
D 6 TP(16,22) I 7 TP(16,23)
E 4 TP(16,20)
G 7 TP(22,29) TP(20,25) F 5
H 9 TP(29,38) TP(25,33) J 8
TP(33,37) K 4 TP(33,38) L 5
TP(38,40) M 2
N 6 TP(38,44)
Fin 0 TP(44,44)
Figura 1.32: Tiempos más próximos para todas las actividades.
En la Fig. 1.32 se muestran los tiempos más próximos de todas las actividades. Ahora,
40
continuaremos con la pasada hacia atrás. Los tiempos más lejanos (T L) de los nodos N , K,
L y J son:
NodoN : F L = 44; IL = 44 − 6 = 38
NodoK : F L = 38; F P = 38 − 4 = 34
NodoL : F L = 38; F P = 38 − 5 = 33
NodoJ : F L = mı́n 34, 33; F P = 33 − 8 = 25
Inicio 0 TP(0,0)
TF(0,0)
TP(0,2)
A 2 TF(0,2)
B 4 TP(2,6)
TF(2,6)
10 TP(6,16)
TF(6,16)
C
TP(16,23)
D I 7TF(18,25)
6 TP(16,22) TP(16,20)
TF(20,26)
E 4 TF(16,20)
TP(20,25)
7 TP(22,29)
F 5 TF(20,25)
G TF(26,33)
TP(25,33) 8
H 9 TP(29,38)
TF(33,42) TF(25,33) J
TP(33,38)
TF(33,38)
TP(33,37)
TP(38,40) TF(34,38) K 4 L 5
TF(42,44) M 2
N 6TP(38,44)
TF(38,44)
Fin 0 TP(44,44)
TF(44,44)
Figura 1.33: Tiempos más lejanos y más próximos para todas las actividades.
En la Fig. 1.33 se muestran los tiempos más próximos y más lejanos de todas las activi-
dades. Para terminar se calcula la holgura de cada actividad y se obtiene la ruta crı́tica del
proyecto. En la Fig. se muestran las holguras y las actividades crı́ticas:
41
1. MODELOS DE REDES
Figura 1.34: Tiempos más lejanos y más próximos para todas las actividades.
La ruta crı́tica del proyecto es:
A→B→C→E→F →J →L→N
con una duración de 44 semanas.

Antes de analizar la variabilidad que pudiera existir en la duración de las actividades
de nuestro proyecto, se revisará como representar gráficamente el mismo en un diagrama de
Gant.
1.2.3. Diagramas de Gantt

La gráfica de Gantt fue desarrollada por Henry L. Gantt en 1918 y sigue siendo una he-
rramienta popular en la administración de proyectos debido a que es un medio de bajo costo
con el que los gerentes se aseguran de que: se planeen todas las actividades, se tome en cuen-
ta el orden de desempeño, se registren las estimaciones de tiempo para cada actividad y se
desarrolle el tiempo global del proyecto.
Figura 1.35: Gráfica de Gantt del ejemplo 1.10
En una gráfica de Gantt, el eje horizontal representa el tiempo de desarrollo del proyecto
y en el eje vertical se ubican todas las actividades del proyecto. Para construirla, se dibujan
42
barras horizontales para cada actividad del proyecto. Es necesario conocer el momento en
el que inicia cada actividad y su duración. CPM nos proporciona la información necesaria
para poder construir una gráfica de Gantt. En la Fig. 1.35 se muestra la gráfica de Gantt
correspondiente al Ejemplo 1.10. En la gráfica se puede observar en rojo las actividades
crı́ticas y en azul las actividades no crı́ticas de acuerdo a los tiempos más próximos obtenidos
con CPM. En un azul más claro con un entramado diagonal se muestran las actividades no
crı́ticas de acuerdo a los tiempos más lejanos. Las holguras se pueden observar de donde
termina la actividad no crı́tica en su tiempo de finalización más próximo hasta donde termina
la actividad en su tiempo de finalización más lejano.
Otra de las ventajas de utilizar gráficas de Gantt radica en que es muy sencillo visualizar
las actividades que se desarrollan en paralelo, ası́ como determinar el porcentaje de avance
de cada actividad en determinado momento del proyecto. En la Fig. 1.35, se observa que el
proyecto se encuentra en la semana 6; a esta semana el avance es del 100 % para las actividades
Excavar (A) y Hacer los cimientos (B). Para calcular el porcentaje de avance de cada actividad
puede hacer uso Excel.
1.2.4. Análisis de la ruta crı́tica con PERT
Hasta ahora, la duración de las actividades se ha establecido como un tiempo determinı́sti-

co, es decir, el tiempo es fijo y no contempla variación alguna. Sin embargo, si quisieramos
responder a la pregunta:¿Cuál es la variabilidad potencial en la fecha esperada de termina-
ción del proyecto? es necesario considerar los tiempos de las actividades como una variable
aleatoria con una distribución de probabilidad. El análisis PERT considera este problema.
En el análisis PERT empleamos una distribución de probabilidad con base en tres estima-
ciones de tiempo para cada actividad, de la manera siguiente:
Tiempo optimista (o) =tiempo que tomará una actividad si todo sa-
le como se planeó. Al estimar este valor, debe
haber sólo una pequeña probabilidad (digamos,
1/100) de que el tiempo de la actividad sea me-
nor que o.
Tiempo pesimista (p) =tiempo que tomaraá una actividad suponiendo
condiciones muy desfavorables. Al estimar este
valor, también debe haber sólo una pequeña pro-
babilidad de que el tiempo de la actividad sea
mayor que p.
Tiempo más factible (m) =La estimación más realista del tiempo reque-
rido para terminar la actividad.
43
1. MODELOS DE REDES
Figura 1.36: Distribución de probabilidad beeta con tres estimaciones de tiempo
La distribución de probabilidad que se utiliza en PERT para la duración de las actividades

es la beta (como se muestra en la Fig. 1.36), debido a su naturaleza sesgada se considera que
la mayor probabilidad se encuentra entre el tiempo optimista y el más factible, ya que los
administradores enfocarán todo su esfuerzo en terminar en esos tiempos. en esta distribución
la media (µ) y la varianza (σ 2 ) se determinan como sigue:
2
p−o
σ2 =
6
o + 4m + p
µ=
6
El hecho de que los tiempos sean variables aleatorias implica que el tiempo de terminación
del proyecto es también una variable aleatoria. Esto quiere decir que aunque se esperarı́a que
un proyecto termine en un determinado número de semanas, no hay garantı́a de que será
terminado en ese tiempo. En general, serı́a útil conocer la probabilidad de que el proyecto sea
terminado dentro de un tiempo especı́fico.
Ahora, para hallar la probabilidad de que el proyecto termine en determinado tiempo o
menos, se tienen que cumplir los siguientes supuestos:
1. Sea T el tiempo total de duración del proyecto.
2. Sea t la duración deseada del proyecto, entonces P (T ≤ t) se calcula con facilidad si:
a) Los tiempos de las actividades son variables aleatorias independientes.

b) La variable aleatoria T tiene una distribución aproximadamente normal. Esta
hipótesis se apoya en el teorema del lı́mite central que establece que la suma de va-
riables aleatorias independientes tiene una distribución aproximadamente normal.
Los parámetros de la distribución de la variable aleatoria T son su media µp y su varianza

σp2 . Retomando los supuestos anteriores, la suma de las medias de cada actividad (al igual
que la suma de las varianzas) en la ruta crı́tica, nos permiten obtener los parámetros de la
distribución normal de la variable T (tiempo de duración del proyecto). Una vez se obtienen
44
los parámetros, la probabilidad se puede calcular utilizando la tabla de probabilidad de la

distribución estándar normal (en este caso se tendrı́a que convertir T en una variable aleatoria
T −µ
estándar normal, Z, usando Z = σ p ) o bien, la función DISTR.NORM de Excel.
Ejemplo 1.11 Retomando el ejemplo 1.10, en el que se incurrirá en una penalización de

$300000 si no se logra entregar en 47 semanas, se quisiera conocer la probabilidad de termi-
nar en esas 47 semanas o antes. Para realizar el análisis se proporcionan las tres estimaciones
de duración de cada actividad en la siguiente tabla.
Actividad o m p
A 1 2 3
B 2 3.5 8
C 6 9 18
D 4 5.5 10
E 1 4.5 5
F 4 4 10
G 5 6.5 11
H 5 8 17
I 3 7.5 9
J 3 9 9
K 4 4 4
L 1 5.5 7
M 1 2 3
N 5 5.5 9
Solución. Primero, calcule la µ y σ 2 para cada actividad. Para determinar las actividades
que se encuentran en el camino crı́tico medio, es necesario utilizar las duraciones medias de
las actividades en CPM. Una vez que se obtuvieron, se suman las medias y las varianzas de
las actividades en el camino crı́tico medio para obterner los parámetros de la distribución de
la duración del proyecto T . En la siguiente figura, se muestran los resultados de los cálculos
mencionados y la probabilidad de terminar el proyecto en 47 semanas con un 84.13 %, lo que
nos indica que realizando un adecuado seguimiento a las actividades el Sr. Rojas no debe
incurrir en la penalización.
45
1. MODELOS DE REDES
1.2.5. Optimización en la reducción de la duración del proyecto
En la administración de proyectos con frecuencia se presentan situaciones que provocan

que el proyecto se atrase o bien que adelanten la fecha de entrega. En cualquier situación, es
necesario acelerar algunas o todas las actividades restantes para terminar el proyecto en la
fecha deseada. Al proceso mediante el cual se acorta la duración del proyecto al menor costo
se le denomina optimización en la reducción de la duración del proyecto.
El primer concepto para este enfoque es el de aceleración. Acelerar una actividad se
refiere a tomar medidas que requieran inversión de recursos para reducir la duración de una
actividad por debajo de su duración normal. Estas medidas, podrı́an incluir pagarle tiempo
extra a los trabajadores, contratar personal temporal extra, adquirir equipo especializado,
etc. Acelerar el proyecto se refiere a acelerar un número de actividades con el objetivo de
reducir la duración del proyecto por debajo de su duración normal.
El método de CPM para la optimización en la reducción de la duración del proyecto tiene
como objetivo acelerar las actividades necesarias al menor costo para alcanzar la reducción
deseada.
La información necesaria para saber cuánto acelerar una actividad esta dada por la gráfica
de tiempo-costo. Observe que en la Fig. XX, se muestran un punto normal y un punto acele-
rado. Estos representan la duración y costo normales y la duración y costos acelerados para
la actividad respectivamente. CPM asume que estos tiempos y costos pueden predecirse con
confianza sin incertidumbre significativa.
Utilizando este enfoque, el Sr. Rojas de la constructora “El muro” y su equipo de supervi-
sores obtuvieron el costo y los tiempos para acelerar cada una de las actividades del proyecto.
Por ejemplo, la actividad J (Instalar la tablaroca) se puede acelerar de 8 a 6 semanas y los
costos quedaron como sigue:
46
Tiempo normal = 8 semanas

Costo normal = $430000
Tiempo acelerado = 6 semanas
Costo acelerado = $490000
Reducción máxima de tiempo = 8 − 6 = 2 semanas
Costo acelerado por periodo ahorrado = $490000−$430000
2 = $30000
Costo
Reducción
acelerado
máxima de
Tiempo Costo por periodo
tiempo
Actividad Normal Acelerado Normal Acelerado ahorrado
A 2 semanas 1 semana $180000 $280000 1 semana $100000
B 4 semanas 2 semanas $320000 $420000 2 semanas $50000
C 10 semanas 7 semanas $620000 $860000 3 semanas $80000
D 6 semanas 4 semanas $260000 $340000 2 semanas $40000
E 4 semanas 3 semanas $410000 $570000 1 semana $160000
F 5 semanas 3 semanas $180000 $260000 2 semanas $40000
G 7 semanas 4 semanas $900000 $1020000 3 semanas $40000
H 9 semanas 6 semanas $200000 $380000 3 semanas $60000
I 7 semanas 5 semanas $210000 $270000 2 semanas $30000
J 8 semanas 6 semanas $430000 $490000 2 semanas $30000
K 4 semanas 3 semanas $1600000 $200000 1 semana $40000
L 5 semanas 3 semanas $2500000 $350000 2 semanas $50000
M 2 semanas 1 semana $100000 $200000 1 semana $100000
N 6 semanas 3 semanas $330000 $510000 3 semanas $60000
Tabla 1.5: Costos y tiempos normales y acelerados del proyecto para el “El muro”
Ahora que el Sr. Rojas ha calculado los costos y tiempos normales y acelerados para cada
actividad (ver Tabla 1.5), necesita resolver saber cuál es la forma menos costosa de terminar
el proyecto en 40 semanas, es decir que actividades acelarar y cuánto tiempo se deben de
acelerar de tal forma que el costo sea el menor. Para lograrlo se plantea este problema de
optimización como un problema de programación lineal.
La función objetivo de este modelo representa el costo total del proyecto acelerando acti-
vidades para llegar a una duración deseada. Las restricciones de inicio de cada actividad, las
restricciones de aceleracón máxima de cada actividad y la restricción de la duración máxima
del proyecto. A continuación, se definen las función objetivo, las variables y restricciones en
el modelo.
Las variables que representan la reducción en la duración de cada actividad
xj = reducción en la duración de la actividad j.
donde valores de j son cada una de las actividades del proyecto. La función objetivo queda
definida como: X
Z= cj xj
j
47
1. MODELOS DE REDES
donde cj representa el costo de ahorrar un periodo en la actividad j.

yF IN = duración total del proyecto
Las variables que representan el inicio de cada actividad.
yj = tiempo de inicio de la actividad j
En esta variable los valores posibles de j representan a todas las actividades excepto a las que
inician el proyecto.
La restricción de duración del proyecto se escribe como
yF IN ≤ T
donde T es la duración máxima del proyecto.
El tiempo de inicio de una actividad debe ser mayor o igual al tiempo de finalización de
sus predecesores inmediatos. El tiempo de finalización se calcula sumándole la duración de la
actividad al tiempo de inicio y restándole el tiempo de aceleración. Suponga que la actividad
i precede a la j, la restricción quedarı́a como sigue:
yj ≥ yi + t i − x i
donde xi es la aceleración de la actividad i y ti es la duración de la actividad i. Finalmente
las restricciones de reducción máxima de cada actividad.
xj ≤ rj
donde rj es el valor máximo en el que se puede reducir la actividad j.
En el proyecto de la constructora “El muro”, el modelo de programación lineal queda como
sigue:
MinimizarZ = 100000xA + 50000xB + · · · + 60000xN
Sujeto a las siguientes restricciones:
1. Restricciones de máxima aceleración de la actividad:
xA ≤ 1, xB ≤ 2, . . . , xN ≤ 3
2. Restricciones de no negatividad:
xA ≥ 0, xB ≥ 0, . . . , xN ≥ 0
yB ≥ 0, yC ≥ 0, . . . , yN ≥ 0, yF IN ≥ 0
3. Restricciones de tiempo de inicio de cada actividad:
Un predecesor inmediato Dos predecesores inmediatos

yB ≥ 0 + 2 − xA yH ≥ yG + 7 − xG
yC ≥ yB + 4 − xB yH ≥ yE + 4 − xE
..
yD ≥ yC + 10 − xC .
..
. yF IN ≥ yM + 2 − x M
yM ≥ yH yF IN ≥ yN + 6 − x N
48
4. Restricción de la duración máxima del proyecto:
yF IN ≥ 40
Figura 1.37: Parámetros para el solver en Excel
Figura 1.38: Restricciones para el solver en Excel
Se utiliza el complemento de Solver en Excel para resolver la pregunta que se planteó el

Sr. Rojas, acerca de si vale la pena invertir para terminar el proyecto en 40 semanas y de esta
forma acceder al bono de $150000. En la Fig. 1.37 y la Fig. 1.38, se muestran los parámetros
y las restricciones que se ingresan al solver de Excel.
En la Fig. 1.37, se muestran la función objetivo que corresponde a la celda que contiene la
suma total de los costos más el costo en el que se incurre por acelerar el proyecto; las celdas
a modificar son los rangos con los nombres StartTime (corresponde al tiempo de inicio de
cada actividad), TimeReduction (corresponde al número de periodos en los que se reduce la
actividad) y ProjectFinishTime (corresponde a el tiempo en el que finaliza el proyecto).
En la Fig. 1.38, se muestra como se agregan las restricciones al solver. Las restricciones
de inicio se ingresan utilizando los nombres de las celdas correspondientes a los tiempos de
inicio (columna Tiempo inicial en la Fig. 1.39) y el tiempo de finalización de cada actividad
tomando en cuenta la reducción de la actividad (columna Tiempo Final en la Fig. 1.39).
Las restricciones de reducción máxima de cada actividad se puede introducir al solver co-
mo una ya que se usan rangos para evaluar todas las actividades (la restricción utilizada es
TimeReduction<=MaxTimeReduction). Finalmente, la restricción de duración máxima del
proyecto se muestra como ProjectFinisTime >= MaxTime. Todos los nombres de celdas y
rangos se pueden verificar en la plantilla de Excel Plantilla CPM Tiempo-costo.xlsx.
49
1. MODELOS DE REDES
Figura 1.39: Resultados proporcionados por el solver en Excel
El Sr. Rojas obtuvo los resultados del análisis de optimización en la reducción de la

duración del proyecto y se observa en la Fig. 1.39 que se necesitan invertir $240, 000 en las
actividades B, D y J, todas acelerada 2 semanas. Debido a que el bono por terminar el proyecto
en 40 semanas es de $150000, el Sr. Rojas decide mantener el plan y enfocarse en terminar el
proyecto en 44 semanas y no llegar a la fecha lı́mite de 47 semanas.
50
Capı́tulo 2
Teorı́a de decisiones
2.1. Teorı́a de juegos

En diversas áreas profesionales se presentan situaciones de competencia en las cuales dos
o más adversarios tienen que tomar decisiones simultáneas que afectan con un determinado
pago el resultado de la competencia. Ejemplos de éstas situaciones son los combates militares,
campañas polı́ticas, competencias deportivas y campañas de publicidad. La teorı́a de juegos
es útil para tomar decisiones en casos donde dos o más personas que deciden se enfrentan a
un conflicto de intereses.
En esta unidad se estudiarán los juegos entre dos personas y suma cero, llamados de
esta forma porque sólo participan dos jugadores y un jugador gana lo que el otro pierde. A
contniuación, se muestran los componentes de los juegos de dos personas y suma cero y los
diferentes enfoques para resolver este tipo de juegos.
2.1.1. Formulación de juegos de dos personas y suma cero

Con el fin de mostrar las caracterı́sticas básicas de un modelo de juegos de dos personas
de suma cero, considere el juego llamado pares y nones. Éste consiste nada más en que los
jugadores muestran al mismo tiempo uno o dos dedos. Si el número total de dedos mostrados
suma un número par, el jugador que apuesta a pares (por ejemplo el jugador 1) gana la apuesta
(digamos 1 peso) al jugador que elige nones (jugador 2) [2]. En caso contrario, el jugador 2
le gana un peso al jugador 1. Entonces, cada jugador tiene dos opciones para jugar: mostrar
uno o dos dedos. El pago en pesos que resulta para el jugador 1 se muestra en la tabla 2.1. En
la teorı́a de juegos las opciones que tienen los jugadores para elegir se llamana estrategias y
la forma de como se obtienen las recompensas para el jugador 1 se presenta en una tabla que
es llamada matriz de pagos.
Jugador 2
Estrategia 1 2
1 1 −1
Jugador 1
2 −1 1
Tabla 2.1: Matriz de pagos del juego de pares y nones
51
2. TEORÍA DE DECISIONES
Los elementos de un juego de dos personas de suma cero son:
1. Las estrategias del jugador 1.
2. Las estrategias del jugador 2.
3. La matriz de pagos.
El juego inicia cuando ambos jugadores eligen sus estrategias de forma simultánea. Antes
de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente
y la matriz de pagos. Una jugada consiste en que los dos jugadores elijan al mismo tiempo una
estrategia sin saber cuál es la elección de su oponente. Existen juegos que se pueden realizar
en múltiples ocasiones y algunos sólo se pueden jugar una vez.
Una estrategia es una regla predeterminada que especifica por completo cómo se intenta
responder a cada circunstancia posible en cada etapa del juego. La matriz de pagos muestra
la ganancia (positiva o negativa) del jugador 1, que resultarı́a con cada combinación de estra-
tegias de los dos jugadores. La ganancia establecida en la matriz de pagos no necesariamente
es dinero, también se puede ver reflejada como número de votos, fichas, ventas obtenidas o
una determinada probabilidad de obtener algo.
Un objetivo primordial en la teorı́a de juegos es desarrollar criterios racionales para selec-
cionar una estrategia, los cuales implican dos supuestos importantes:
1. Ambos jugadores son racionales, es decir, ambos poseen la inteligencia para decidir cual
es su mejor opción.
2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin
compasión para el oponente).
2.1.2. Estrategia dominada

Una de las técnicas empleadas en teorı́a de juegos para determinar la estrategia que debe
de elegir cada jugador es la denomidada estrategia dominada. Esta técnica consiste en
elminar las estrategias inferiores hasta que quede sólo quede una que se pueda elegir.
Una estrategia es dominada por segunda estrategia si esta última es siempre al menos tan
buena (y algunas veces mejor) como la primera, sin que importe lo que haga el oponente. Una
estrategia dominada se puede eliminar de inmediato de la matriz de pagos para consideracio-
nes posteriores. Es importante observar que no existe un orden para eliminar las estrategias
dominadas y que no es necesario alternar entre jugadores.
Desde el punto de vista del jugador 1, una estrategia domina a otra si los pagos de la
estrategia en cuestión para cada estrategia elegida por el jugador 2, son mayores o iguales que
los correspondientes a la estrategia dominada. Con respecto al Jugador 2, se debe verificar que
los pagos sean menores o iguales. Lo anterior es debido a que el jugador 1 busca maximizar
sus ganancias y el jugador 2 minimizar sus pérdidas, por lo que números más grandes son
mejores para el jugador 1 y más pequeños son mejores para el jugador 2.
Ejemplo 2.1 Dos polı́ticos contienden entre sı́ por un lugar en la Cámara de Diputados Fe-
derales de México por el distrito IX del estado de Yucatán. En este momento elaboran sus
52
2.1. TEORÍA DE JUEGOS
planes de campaña para los dos últimos dı́as antes de las elecciones; se espera que dichos dı́as
sean cruciales debido a que están muy próximos al dı́a de la votación. Por esta circunstancia,
ambos quieren emplearlos para hacer campaña en dos ciudades importantes: Motul y Progreso.
Para evitar pérdidas de tiempo, planean viajar en la noche y pasar un dı́a completo en cada
ciudad o dos dı́as en sólo una de ellas. Como deben de hacer los arreglos necesarios por ade-
lantado, ninguno de los dos conocerá lo que su oponente tiene planaeado hacer hasta después
de concretar sus propios planes. Cada polı́tico tiene un jefe de campaña en cada ciudad para
asesorarlo sobre el efecto que tendrán (en términos de votos ganados o perdidos) las combi-
naciones posibles de los dı́as dedicados a cada ciudad por ellos o sus oponentes. Por tanto,
quieren emplear esta información para elegir su mejor estrategia para estos dos dı́as. En la
tabla 2.2 se muestran los votos (en miles) ganados o perdidos para el polı́tico 1.
Polı́tico 2
Estrategia 1 2 3
1 1 2 4
Polı́tico 1 2 1 0 5
3 0 1 −1
Tabla 2.2: Matriz de pagos del problema de la campaña polı́tica para estrategias dominadas
Solución. Para formular este problema como un juego de dos personas y suma cero, se
identifican sus elementos principales: jugadores, estrategias y matriz de pagos. Los jugadores
son: Polı́tico 1 y Polı́tico 2. Las estrategias son:
1. Estrategia 1: pasar un dı́a en cada ciudad
2. Estrategia 2: pasar dos dı́as en Motul
3. Estrategia 3: pasar dos dı́as en Progreso
La matriz de pagos se muestra en la tabla 2.2. En principio, no se observan estrategias
dominadas del jugador 2; sin embargo, para el jugador 1 la estrategia 3 está dominada por la
estrategia 1 (o bien, la estrategia 1 domina a la 3) ya que tiene pagos más altos (1 > 0, 2 > 1,
4 > −1), independientemente de lo que haga el jugador 2. Despúes de eliminar la estrategia
dominada (3), se obtiene la matriz de pagos reducida:
1 2 3
1 1 2 4
2 1 0 5
Ahora, después de que fue eliminada una estrategia del jugador 1, el jugador 2 se da cuenta
que el jugador 1 sólo dispones de dos estrategias y observa que su estrategia 3 está dominada
tanto por la estrategia 1 como por la 2. Esto es, con respecto a la matriz de pagos reducida
con anterioridad para la estrategia 1: 1 < 4, 1 < 5; para la estrategia 2:2 < 4, 0 < 5. Al
eliminar la estrategia dominada se obtiene
1 2
1 1 2
2 1 0
53
Ahora, se observa que la estrategia 2 del jugador 1 se encuentra dominada por la estrategia
1, puesto que 2 > 0 en la columna 2 y 1 = 1 para la coulumna 1. Al eliminar la estrategia
dominada obtenemos la siguiente matriz de pagos reducida
1 2
1 1 2
Finalmente el jugador 2 observa que su estrategia 2 se encuentra dominada por la estrategia

1, debido a que 1 < 2. Al eliminar esta última estrategia, ambos jugadores se quedan con sólo
una estrategia. En consecuencia, la solución de este problema es que ambos polı́ticos deben
de elegir la estrategia 1, es decir, ambos deben de pasar un dı́a en cada ciudad
Antes de continuar con la siguiente sección, se definen dos conceptos: valor del juego y
juego justo. El valor del juego es el pago que recibe el jugador 1 cuando ambos jugadores
operan de manera óptima y un se dice de un juego justo cuando el el valor de dicho juego
es 0.
Es importante aclarar que en muy raras ocasiones la matriz de pagos se reduce de tal
forma hasta obtener una única estrategia para ambos jugadores, sin embargo, es muy útil
para reducir la matriz de pagos y posteriormente aplicar otro método para resolver el juego.
2.1.3. Criterio minimax

Otro criterio para resolver juegos de suma cero con dos jugadores, es el criterio minimax.
Retomando el ejemplo de los polı́ticos (ver Ej. 2.1), supongamos que la matriz de pagos para
la campaña polı́tica es
Polı́tico 2
Estrategia 1 2 3
1 −3 −2 6
Polı́tico 1 2 2 0 2
3 5 −2 −4
Tabla 2.3: Matriz de pagos del problema de la campaña polı́tica para criterio minimax
En la Tabla 2.4, observe que en este caso el juego no tiene estrategias dominadas, por
lo que no es obvio que deben hacer los jugadores. ¿Qué deberı́an hacer los jugadores en este
caso?
Supongamos que el polı́tico 1 desea aplicar la estrategia 1 (pasar un dı́a en cada ciudad),
1 2 3
1 −3 −2 6 ← Se puede ganar 6. Ganancia máxima
↑
Se puede perder 3. Pérdida máxima
En este caso el polı́tico 2, optarı́a por usar la estrategia 1, ya que evitarı́a hacer pagos al
polı́tico 1. Utilizando esta combinación de estrategias, el polı́tico 2 tratará de minimizar la
pérdida máxima y el polı́tico 1 tratará de maximizar las ganancias mı́nimas. Este método es
conocido como criterio minimax.
54
El criterio minimax es un criterio estándar para elegir una estrategia. Este criterio sostiene
que sabe seleccionar la mejor estrategia, aun cuando esta elección se anuncie al oponente antes
de que éste elija su propia estrategia de respuesta. El jugador 1 debe elegir aquella estrategia
cuyo pago mı́nimo sea el mayor, mientras que el jugador 2 debe elegir la estrategia cuyo pago
máximo a su oponente sea el menor.
En términos de la matriz de pagos correspondiente a la Tabla 2.4, se procede de la siguiente
manera:
Jugador 1. debe seleccionar el pago mı́nimo de cada una de sus estrategias (el mı́nimo de cada fila).
A continuación, selecciona el valor máximo de esos pagos. Esta es la estrategia que debe
utilizar.
Jugador 2. debe seleccionar el máximo de cada uno de los pagos a realizar al jugador 1 (el máximo de
cada columna). A continuación, debe seleccionar el mı́nimo de esos pagos. Esta columna
con el valor mı́nimo de los valores máximos elegidos previamente será la estrategia a
seleccionar.
Polı́tico 2
Estrategia 1 2 3
1 −3 −2 6 −3
Polı́tico 1 2 2 0 2 0 ← Maximin
3 5 −2 −4 −4
5 0 6
↑
Minimax
Tabla 2.4: Solución utilizando el criterio minimax
Bajo este criterio, se dice que el jugador 1 aplica la estrategia maximin y que el jugador 2
aplica la estrategia minimax. Si el valor minimax y maximin coinciden, entonces la solución
es estable y el valor maximin/minimax se llama punto silla o punto de equilibrio. Ningún
jugador tiene motivos para considerar un cambio de estrategia, ya que ninguno quedará en
ventaja aun conociendo la elección de su oponente. Por tanto, cada jugador debe emplear su
respectiva estrategia maximin y minimax.
Finalmente observe que, el juego es justo, ya que valor del juego (valor en donde se
intersectan el valor maximin y el valor minimax) es cero. En otro caso el juego no serı́a justo
ya que alguno de los jugadores obtiene ganancias y el otro pérdidas.
2.1.4. Juegos con estrategia mixta

Cuando un juego no tiene punto silla (como se observa en la Tabla 2.5), es decir, el valor
minimax es diferente al valor maximin, se aconseja asignar una distribución de probabilidad
sobre su conjunto de estrategias.
55
Polı́tico 2
Estrategia 1 2 3
1 0 −2 2 −2 ← Maximin
Polı́tico 1 2 5 4 −3 −3
3 2 3 −4 −4
5 4 2
↑
Minimax
Tabla 2.5: Solución sin punto silla (inestable) del ejemplo de los polı́ticos
Esto es que cada una de las estrategias se eligirá con una determinada probabilidad, a
diferencia de los juegos con punto silla donde cada jugador elige una única estrategia como
su mejor opción. Matemáticamente este consejo se expresa como,
xi = probabilidad de que el jugador 1 use la estrategia i(i = 1, 2, . . . , m)

yj = probabilidad de que el jugador 2 use la estrategia j(j = 1, 2, . . . , n)
donde m y n son el número de estrategias disponibles para cada jugador, respectivamente.

De esta manera, el jugador 1 definirá su estrategia al encontrar los valores de x1 , x2 , . . . , xm de
tal forma que obtenga su ganancia máxima. Como estos valores son probabilidades, tendrı́an
que ser no negativos y sumar 1. De igual manera, el plan de juego del jugador 2 (su estrategia)
se describe al encontrar los valores correspondientes a y1 , y2 , . . . , yn . Los planes de juego,
(x1 , x2 , . . . , xm ) y (y1 , y2 , . . . , yn ) se les conoce como estrategias mixtas y las estrategias
obtenidas cuando un juego es estable (tiene punto silla) se llaman estrategias puras.
Ambos jugadores pudieran elegir los valores para sus estrategias utilizando diversos cri-
terios, por ejemplo al azar. Sin embargo, de esta forma no se garantiza obtener los mejores
resultados para ambos jugadores. Una medida de desempeño muy útil para evaluar las estra-
tegias mixtas es el pago esperado. Al aplicar la definición de valor esperado de la teorı́a de
probabilidad, el pago esperado para el jugador 1 (P EJ1) queda como sigue:
m X
X n
P EJ1 = pij xi yj (2.1)
i=1 j=1
donde pij es el pago si el jugador 1 usa la estrategia i y el jugador 2 usa la estrategia j.

Esta medida de desempeño no revela nada sobre riesgos inherentes al juego, pero indica a qué
cantidad tenderı́a el pago promedio si el juego se efectuara muchas veces.
Con esta medida, la teorı́a de juegos puede el concepto del criterio minimax a juegos que
no tienen punto silla y que, por lo tanto, necesitan estrategias mixtas. En la teorı́a de juegos,
cuando el enfoque es en el jugador 1, se aplica el criterio maximin, el cual busca maximizar
las ganancias mı́nimas obtenidas; para el jugador 2 se aplica el criterio minimax, el cual busca
minimizar las pérdidas máximas obtenidas. Con respecto a las estrategias mixtas lo que busca
el criterio maximin(minimax) es maximizar(minimizar) el pago esperado mı́nimo(máximo),
obteniendo de esta manera el valor óptimo del pago esperado para el jugador 1 (jugador 2)
llamado el valor maximin(minimax) v(v).
56
Teorema 2.1 (Teorema minimax [2]) Si se permiten estrategias mixtas, el par de estra-
tegias que es óptimo de acuerdo con el criterio minimax proporciona una solución estable con
v = v = v (el valor del juego), de manera que ninguno de los dos jugadores puede mejorar si
cambia de manera unilateral su estrategia.
A continuación se mostrará cómo cada jugador encuentra su estrategia mixta óptima. Se

dispone de varios métodos. Uno es un procedimiento gráfico que se puede usar siempre que
uno de los jugadores tenga sólo dos estrategias puras (no dominadas); este enfoque se describe
en la siguiente sección. Cuando se trata de juegos con un mayor número de estrategias en
ambos jugadores, el método que más se emplea consiste en transformar el problema en uno
de programación lineal que se pueda resolver por el método sı́mplex en una computadora, por
ejemplo, utilizando el solver de Excel.
Método gráfico
Este método se utiliza para resolver juegos de suma cero con estrategias mixtas. El requisito
para poder utilizarlo es que uno de los dos jugadores tenga únicamente dos estrategias, puede
ser el jugador 1 o el jugador 2, y el otro jugador deberı́a tener más de dos estrategias. Se
puede llegar a esta situación eliminando las estrategias dominadas en la matriz de pagos.
Considere el caso en el que el jugador 1 es el que se queda con dos estrategias, entonces
sus estrategias mixtas son (x1 , x2 ) y x2 = 1 − x1 . Ahora, resulta sencillo hacer la gráfica del
pago esperado como una función de x1 , para cada una de las estrategias de su oponente.
Para ilustrar este procedimiento, considere los valores de la matriz de pagos que se mues-
tran en la Tabla 2.5. Observe que la tercera estrategia pura del jugador 1 está dominada por
la segunda, por lo que la matriz de pagos se puede reducir a la forma dada en la Tabla 2.6
Polı́tico 2
Probabilidad y1 y2 y3
Estrategia
Probabilidad Pura 1 2 3
x1 1 0 −2 2
Polı́tico 1
1 − x1 2 5 4 −3
Tabla 2.6: Matriz de pagos reducida del jugador 1 del problema de los polı́ticos
El pago esperado para el jugador 1 (tomando los datos en la Tabla 2.6), de acuerdo a la
ecuación 2.1 queda como sigue:
2 X
X 3
P EJ1 = pij xi yj
i=1 j=1
= 0x1 y1 + (−2)x1 y2 + 2x1 y3 + 5x2 y1 + 4x2 y2 − 3x2 y3

= 0x1 y1 + (−2)x1 y2 + 2x1 y3 + 5(1 − x1 )y1 + 4(1 − x1 )y2 − 3(1 − x1 )y3
= (5 − 5x1 )y1 + (4 − 6x1 )y2 + (−3 + 5x1 )y3 (2.2)
57
Una vez se tiene el pago esperado para el jugador 1 (P EJ1), se procede a calcular el pago
esperado de cada alternativa del jugador 2. El pago esperado del jugador 1 para la alternativa
1 del jugador 2 (P EJ1y1 ) se obtiene cuando y1 = 1, y2 = 0, y3 = 0, sustituyendo en la ecuación
2.1.4 nos queda
P EJ1y1 = (5 − 5x1 )(1) + (4 − 6x1 )(0) + (−3 + 5x1 )(0)

= 5 − 5x1
Resolviendo para las otras dos alternativas del jugador 2, los pagos esperados quedan como
se muestra en la Tabla 2.7.
(y1 , y2 , y3 ) Pago esperado

(1, 0, 0) 0x1 + 5(1 − x1 ) = 5 − 5x1
(0, 1, 0) −2x1 + 4(1 − x1 ) = 4 − 6x1
(0, 0, 1) 2x1 − 3(1 − x1 ) = −3 + 5x1
Tabla 2.7: Pago esperado del jugador 1 para cada alternativa del jugador 2
A continuación se grafican las rectas del pago esperado que acabamos de obtener como se
muestra en la Fig. 2.1. Observe que como los valores en el je x son probabilidades, las rectas
se grafican en el dominio [0, 1].
Figura 2.1: Procedimiento gráfico para la solución de los juegos.
Debido a que el jugador 1 tiene como objetivo maximizar sus ganancias mı́nimas, debe
ubicar un punto en la gráfica donde se logre este objetivo, punto maximin. Este punto, es
el más alto de la región mı́nima delimitada en la Fig. 2.1. Esta regı́n se forma con los puntos
que se encuetran más abajo en la gráfica delimitando una región mı́nima(vea también Fig.
2.2). En el caso de que el método gráfico sea enfocado en el jugador 2, se busca el punto más
58
bajo de la región máxima, punto minimax, como se muestra en la Fig. 2.3
Figura 2.2: Punto maximin en la región mı́nima de la gráfi- Figura 2.3: Punto minimax en la región máxima de la
ca. gráfica.
El jugador 1 quiere maximizar el pago esperado mı́nimo, en consecuencia, debe elegir

el valor máximo de x1 entre las intersecciones ubicadas en la región mı́nima, es decir, la
intersección entre las rectas −3 + 5x1 y 4 − 6x1 , de donde se obtiene el valor maximin (que
por el teorema minimax) es el valor del juego y pago esperado para el jugador 1. Igualando
las rectas que se intersectan en el punto maximin tenemos
−3 + 5x1 = 4 − 6x1
5x1 + 6x1 = 4 + 3
7
x1 =
11
4 7 4
Entonces x2 = 1 − x1 = 11 y de esta forma ( 11 , 11 ) es la estrategia mixta óptima del jugador
1, lo que indica que el jugador 1 deberá elegir la estrategia 1 con una probalidad de 0.6364 y
la estrategia x2 con una probabilidad de 0.3636. Una vez se obtuvo el valor de x1 , es posible
obtener el valor del juego (que es el valor maximin) con el punto maximin sustituyendo en
cualquiera de las rectas que intersectan al punto maximin.

7 2
v = v = −3 + 5 =
11 11
Para encontrar la estrategia mixta óptima para el jugador 2 el razonamiento es el siguiente.
De acuerdo con la definición del valor minimax v y el teorema minimax, el pago esperado que
se obtiene con la estrategia (y1 , y2 , y3 ) tendrá que satisfacer la condición
2
y1 (5 − 5x1 ) + y2 (4 − 6x1 ) + y3 (−3 + 5x1 ) ≤ vv =
11
para todos los valores x1 (0 ≤ x1 ≤ 1). Cuando el jugador 1 juega de manera óptima (cuando
7
x1 = 11 ), la desigualdad anterior, se convierte en una igualdad por el teorema minimax, de
manera que
20 2 2 2
y1 + y2 + y3 = v = (2.3)
11 11 11 11
Por lo tanto, y1 = 0, puesto que un valor de y1 > 0 vioları́a la ecución 2.1.4; es decir, en la
7
gráfica, el pago esperado en el punto x1 = 11 estarı́a por el punto maximin. En general, a
59
cualquier recta que no pasa por el punto maximin(o minimax si se enfoca en el jugador 2) se
le debe de asignar un peso de cero para evitar que el pago esperado tenga un valor máyor que
éste. Por esta razón, el pago esperado del jugador 1 queda como sigue
2
y2 (4 − 6x1 ) + y3 (−3 + 5x1 ) =
11
Entonce, para obtener los valores de y2 y y3 se seleccionan dos valores para x1 (0 ≤ x1 ≤ 1),
con el objetivo de obtener un sistema de dos ecuaciones con dos incógnitas. Sean estos valores
x1 = 0 y x1 = 1 (por practicidad se seleccionan estos valores). Ası́
2
4y2 − 3y3 =
11
2
−2y2 + 2y 3 =
11
5 6
Resolviendo el sistema de ecuaciones, se obtiene que y2 = 11 y y3 = 11 . Por lo tanto, la
5 6
estrategia mixta óptima del jugador 2 es (y1 , y2 , y3 ) = (0, 11 , 11 ).
Programación lineal
Cualquier juego de estrategias mixtas se puede resolver en forma muy sencilla si se lo
transforma en un problema de programación lineal. Como se verá, esta transformación requiere
apenas un poco más que la aplicación del teorema minimax y el uso de la definición del valor
maximin v y valor minimax v.
Primero considere cómo se encuentra la estrategia mixta del jugador 1. Como se indicó en
la sección 14.3,
m X
X n
PAgo esperado para el jugador 1 = pij xi yj
i=1 j=1
y la estrategia (x1 , x2 , . . . , xm ) es óptima si

m X
X n
pij xi yj ≥ v = v
i=1 j=1
para todas las estrategias del oponente (y1 , y2 , . . . , yn ). Entonces, esta desigualdad se debe
cumplir, por ejemplo, para cada una de las estrategias puras del jugador 2, es decir, para cada
una de las estrategias (y1 , y2 , . . . , yn ) donde yj = 1 y el resto es igual a 0. Al sustituir estos
valores en la desigualdad se obtiene
m
X
pij xi ≥ v para j = 1, 2, . . . n,
i=1
de manera que la desigualdad implica este conjunto de n desigualdades. Aún más, este
conjunto de n desigualdades implica la desigualdad original (escrita de otra forma)
60
n m n
!
X X X
yj pij xi ≥ yj v = v,
j=1 i=1 j=1
porque
n
X
yj = 1
j=1
.
Como la implicación va en ambas direcciones, se concluye que imponer este conjunto de
n desigualdades lineales es equivalente a requerir que la desigualdad original se cimpla para
todas las estrategias (y1 , y2 , . . . , yn ). Pero estas n desigualdades son restricciones válidas en
programación lineal, como son las restricciones adicionales
x1 + x2 + · · · + xm = 1
xi ≥ 0, para i = 1.2, . . . , m
que se necesitan para asegurar que las xi sean probabilidades. Por esta razón, cualquier
solución (x1 , x2 , . . . , xm ) que satisfaga este conjunto completo de restricciones de programación
lineal es la estrategia mixta óptima deseada.
En consecuencia, el problema de encontrar una estrategia mixta óptima se ha reducido a
encontrar una solución factible para un problema de programación lineal, lo que se puede hacer
según se describió en el capı́tulo 4. Las dos dificultades que quedan por resolver son que: 1) se
desconoce v, y 2) el problema de programación lineal no tiene función objetivo. Por fortuna,
ambos obstáculos se pueden salvar al mismo tiempo si se sustituye la constante desconocida v
por la variable xm+1 y después se maximiza xm+1 , de manera que en forma automática xm+1
será igual a v (por definición) en la solución óptima del problema de programación lineal.
2.1.4.1. La formulación de la programación lineal

Para resumir, el jugador 1 encontrará su estrategia mixta óptima al emplear el método
sı́mplex para resolver el problema de programación lineal:
Maximizar xm+1 ,
sujeta a
p11 x1 + p21 x2 + · · · + pm1 xm − xm+1 ≥ 0

p12 x1 + p22 x2 + · · · + pm2 xm − xm+1 ≥ 0
..
.
p1n x1 + p2n x2 + · · · + pmn xm − xm+1 ≥ 0
x1 + x2 + · · · + xm = 1
xi ≥ 0, para i = 1, 2, . . . , m
61
.
Observe que xm+1 no está restringida a ser no negativa, mientras que el método sı́mplex
sólo puede aplicar una vez que todas las variables tienen la restricción de no negatividad. Este
asunto puede resolverse con facilidad como se verá en seguida.
Ahora considere al jugador 2. Éste puede encontrar su estrategia óptima mixta si reescribe
la matriz de pagos como los pagos a sı́ mismo en lugar de al jugador 1 y procediendo exac-
tamente como se acaba de describir. Sin embargo, resulta ilustrativo resumir su formulación
en términos de la matriz de pagos original. So se sigue un procedimiento análogo al decrito,
el jugador 2 concluirá que su estrategia mixta óptima está dada por la solución óptima del
problema de programación lineal:
Minimizar yn+1 ,
sujeta a
p11 y1 + p12 y2 + · · · + p1n yn − yn+1 ≤ 0

p21 y1 + p22 y2 + · · · + p2n yn − yn+1 ≤ 0
..
.
pm1 y1 + pm2 y2 + · · · + pmn yn − yn+1 ≤ 0
y1 + y2 + · · · + yn = 1
yj ≥ 0, para j = 1, 2, . . . , n
.
Es sencillo demostrar que este problema de programación lineal y el dado para el jugador 1
son duales uno del otro en el sentido descrito en las secciones 6.1 y 6.4. Este hecho tiene varias
implicaciones importantes. Una es que se pueden encontrar las estrategias mixtas óptimas para
los dos jugadores mediante la resolución de sólo uno de los problemas de programación lineal
puesto que la solución óptima dual es un producto complementario automático de los cálculos
del método sı́mplex para encontrar la solución óptima primal. Una segunda implicación es
que esto trae consigo toda la teorı́a de la dualidad para fundamentar en ella la interpretación
y el análisis de los juegos.
Una implicación relacionada es que proporciona una prueba muy sencilla del teorema
minimax. Sean x∗m+1 y yn+1 ∗ los valores de xm+1 y yn+1 en la solución óptima de los respectivos
problemas de programación lineal. Se sabe, por la propiedad de dualidad fuerte que se presentó
en la sección 6.1, que −x∗m+1 = −yn+1
∗ , de manera que x∗ ∗
m+1 = yn+1 . Sin embargo, es evidente
que la definición de v y v que v = x∗m+1 y que v = yn+1 ∗ , lo que conduce a la conclusión de
que v = v, como lo establece el teorema minimax.

Queda un cabo suelto por atar, esto es, cómo proceder si xm+1 y yn+1 no están restringidas
en signo en sus formulaciones de programación lineal. Si es evidente que v ≥ 0 para que los
valores óptimos de xm+1 y yn+1 sean no negativos, entonces no hay peligro si se introducen
las restricciones de no negatividad sobre estas variables con el propósito de aplicar el método
sı́mplex. No obstante, si v < 0, entonces debe hacerse un ajuste. Una posibilidad es emplear
62
el enfoque descrito en la sección 4.6 en el que se sustituye una variable no restringida por
la diferencia de dos variables no negativas. Otra posibilidad es invertir a los jugadores 1 y
2 para que la matriz de pagos se reescriba como el pago al jugador 2 original, lo que harı́a
que el valor correspondiente de v fuera positivo. Un tercer procedimiento, y el que más se
usa en la práctica, es agregar una constante fija grande a todos los elementos de la matriz de
pagos para que el nuevo valor del juego sea positivo. (Por ejemplo, bastarı́a con igualar esta
constante al valor absoluto del elemento más negativo.) Como la misma constante se agrega
a todos los elementos, este ajuste no puede alterar de ninguna manera las estrategias mixtas
óptimas, por lo cual ahora se pueden obtener en forma normal. El valor indicado del juego se
aumentará en la cantidad constante, pero se puede reajustar después de obtener la solución.
2.1.4.2. Aplicación a la variación 3 del problema de las campañas polı́ticas

Para ilustrar este enfoque de programación lineal, considere de nuevo la variación 3 del
problema de la campaña polı́tica después de eliminar la estrategia dominada 3 del jugador 1
(vea la tabla 14.6). Como existen algunos elementos negativos en la matriz de pagos reducida,
no es evidente si el valor del juego v es no negativo (ocurre que sı́ lo es). Por el momento,
suponga que v ≥ 0 y proceda sin hacer ninguno de los ajustes mencionados.
Para escribir el modelo de programación lineal del jugador 1 de este ejemplo, observe que
pij en el modelo general es el elemento del renglón i y la columna j de la tabla 14.6, para
i = 1, 2 y j = 1, 2, 3. El modelo que se obtiene es
Maximizar x3 ,
sujeta a
5x2 − x3 ≥ 0
−2x1 + 4x2 − x3 ≥ 0
2x1 − 3x2 − x3 ≥ 0
x1 + x2 = 1
x1 ≥ 0, x2 ≥ 0
.
La aplicación del método sı́mplez a este problema de programación lineal (después de
agregar la restricción x3 ≥ 0) da x∗1 = 11 7
, x∗2 = 11
4
, x∗3 = 11
2
como solución óptima. En
consecuencia, la estrategia mixta óptima del jugador 1 de acuerdo al criterio minimax es
(x1 , x2 ) = ( 11 , 11 ) y el valor del juego es v = x∗3 = 11
7 4 2
. El método sı́mplez también produce
la solución óptima del dual (que se proporciona en seguida) de este problema, ésta es, y1∗ =
0, y2∗ = 115
, y3∗ = 116
, y4∗ = 11
2
, con lo que la estrategia mixta óptima del jugador 2 es (y1 , y2 , y3 ) =
5 6
(0, 11 , 11 ).
El dual del problema anterior es el modelo de programación lineal del jugador 2 (el que
tiene las variables y1 , y2 , . . . , yn , yn+1 ) que se mostró antes en esta misma sección. Al sustituir
los valores de pij , dados en la tabla 14.6, este modelo es
63
Minimizar y4 ,
sujeta a
−2y2 + 2y3 − y4 ≤ 0
5y1 + 4y5 − 3y3 − y4 ≤ 0
y1 + y2 + y3 = 1
y1 ≥ 0, y2 ≥ 0, y3 ≥ 0
.
Si se aplica el método sı́mplex directamente a este modelo (después de agregar la restricción
y4 ≥ 0), se obtiene la solución óptima y1∗ = 0, y2∗ = 11 5
, y3∗ = 11
6
, y4∗ = 11
2
(al igual que la
∗ 7 ∗ 4 ∗ 2
solución óptima dual, x1 = 11 , x2 = 11 , x3 = 11 ). En consecuencia, la estrategia mixta óptima
5 6
del jugador 2 es (y1 , y2 , y3 ) = (0, 11 , 11 ) y de nuevo se puede ver que el valor del juego es
2
v = y4 = 11 .
Como ya se habı́a determinado la estrategia mixta óptima del jugador 2 cuando se re-
solvió el primer modelo, no fue necesario resolver el segundo. En general, siempre se pueden
encontrar las estrategias mixtas óptimas de ambos jugadores con sólo elegir uno de los mo-
delos (cualquiera) y usar el método sı́mplex para obtener una solución óptima y una solución
óptima dual.
Cuando se aplicó el método sı́mplex a estos dos modelos de programación lineal, se agregó
una restricción de no negatividad que suponı́a que v ≥ 0. Si este supuesto se violara, ninguno
de los dos modelos tendrı́a soluciones factibles, y el método śimplex se detendrı́a con rapidez
con este mensaje. Para evitar este riesgo se pudo haber agregado una constante positiva,
como 3 (el valor absoluto del elemento más negativo), a todos los elementos de la tabla 14.6.
Esto habrı́a aumentado en 3 todos los coeficientes de x1 , x2 , y1 , y2 y y3 en las restricciones de
desigualdad de los dos modelos.
2.2. Análisis de decisiones

El capı́tulo anterior se estudió la teorı́a de juegos para tomar decisiones. En este tipo de
escenario es necesario cierto grado de certidumbre, que en este caso, es saber que tu oponente
eleigirá la acción que más le beneficie. En este capı́tulo se analizará el escenario cuando existe
incertidumbre, esto es, nuestro oponente ahora es la naturaleza, por lo que no tenemos la
certeza de cómo reaccionará a nuestras decisiones. Afortunadamente, es posible estimar con
suficiente exactitud el comportamiento de los sucesos inciertos, por lo que es posible utilizar
modelos como los que se exploran en este capı́tulo.
A continuación se describen algunos ejemplos de situaciones con mayor incertidumbre en
las cuales es necesario tomar decisiones.
1. Un fabricante introduce un nuevo producto al mercado. ¿Cuál será la probable reacción

de los consumidores? ¿Cuánto debe producir? ¿Debe probar el producto en una región
64
2.2. ANÁLISIS DE DECISIONES
pequeña antes de decidir la distribución integral? ¿Cuánta publicidad necesita para

lanzar el producto con éxito?
2. Una empresa financiera invierte en certificados. ¿Cuáles son los mejores prospectos de
certificados de sectores del mercado e individuales? ¿Cómo afectan estos factores las
decisiones de la inversión?
3. Un contratista del gobierno se presenta a una licitación. ¿Cuáles serán los costos reales
del proyecto? ¿Qué otras compañı́as se han presentado? ¿Cuál es su presupuesto proba-
ble?
4. Una empresa agrı́cola selecciona la mezcla de cosechas y ganado para la próxima tem-
porada. ¿Cuáles serán las condiciones climáticas?¿Hacia dónde van los precios? ¿Cuáles
serán los costos?
5. Una compañı́a decide perforar en cierta región. ¿Cuán probable es que haya petróleo
en ella? ¿Cuánto? ¿Cuán profundo tendrá que perforar? ¿Deben los geólogos investigar
más el sitio antes de perforar?
El análisis de decisiones se diseño para estudiar los tipos de decisiones que se deben tomar
en un ambiente de gran incertidumbre. Cuando es necesario tomar una decisión, surge una
pregunta importante acerca del tiempo o la información que tenemos actualmente para tomar
la decisión. Es mejor decidir ahora o después de tener los resultados de algún estudio adicional
(con cierto costo) con el objetivo de reducir la incertidumbre. A estos estudios o pruebas que
se realizan para reducir la incertidumbre se le conoce como experimentación. En consecuencia,
el análisis de decisiones divide la toma de decisiones en los casos sin experimentación y con
experimentación
Se comenzará con el caso más sencillo, el cual es la toma de decisiones sin experimentación.
2.2.1. Toma de decisiones sin experimentación

El proceso para tomar una decisión se compone de un conjunto de alternativas factibles
que indican las distintas formas de proceder en el problema en cuestión, los estados de la
naturaleza, los pagos correspondientes y la frecuencia con la que ocurren los estados de la
naturaleza. Los estados de la naturaleza, ocurren de manera aleatoria, de tal forma que no se
sabe con certeza cuál es el estado que ocurrirá. Cada combinación de una opción (alternativa
de decisión) y un estado de la naturaleza se le atribuye un pago resultante, y es un elemento
de la tabla de pagos. La tabla de pagos se crea con las alternativas de decisión (en las filas),
los estados de la naturaleza (en las columnas) y sus elementos son los pagos resultantes de
elegir una alternativa y que ocurra un determinado estado de la naturaleza.
Es común que la información acerca de la frecuencia con que ocurren los estados de la
naturaleza se pueda traducir en una distribución de probabilidad, si se piensa que el estado
de la naturaleza es una variable aleatoria, en cuyo caso esta distribución se conoce como
distribución a priori . Las probabilidades de los respectivos estados de la naturaleza se
llaman probabilidades a priori .
En esta sección, se determinan tres criterios en la toma de decisiones sin experimentación:
criterio del pago máximo, criterio de la máxima posibilidad y la regla de decisión de Bayes.
65
Criterio del pago máximo: Para cada opción posible, encuentre el pago mı́nimo sobre
todos los posibles estados de la naturaleza. Después, encuentre el máximo de estos pagos
mı́nimos. Elija la opción cuyo pago mı́nimo es el máximo. Este criterio es el mismo que se
utilizó en la sección 2.1 (Teorı́a de Juegos), criterio minimax.
Criterio de la máxima posibilidad: Identifique el estado más probable de la naturaleza

(aquel que tiene la probabilidad a priori más grande). Para este estado de la naturaleza,
encuentre la opción con el máximo pago. Elija esta alternativa de decisión.
Regla de decisión de Bayes: Se utilizan las estimaciones de las probabilidades de los

respectivos estados de la naturaleza para calcular el valor esperado de cada opción posible.
Se elige la opción con el máximo pago esperado. La teorı́a de la probabilidad define el valor
esperado E(X) (formalmente conocido como esperanza matemática) de la siguiente forma
X
E(X) = xi p(xi )
para todos los valores de i, donde xi es el pago correspondiente al estado de la naturaleza i

de la alternativa X y p(xi ) es la probabilidad de que ocurra el estado de la naturaleza i.
Ejemplo 2.2 La compañı́a petrolera PEMEX es dueña de unos terrenos en los que puede
haber petróleo. Un geólogo consultor ha informado a la administración que piensa que existe
una posibilidad de 1 entre 4 de encontrar petróleo.
Debido a esta posibilidad, otra compañı́a petrolera ha ofrecido comprar las tierras en
$900, 000. Sin embargo, PEMEX considera conservarlas para perforar ella misma. El cos-
tro de la perforación es de $1 millón de pesos. Si se encuentra petróleo, el ingreso esperado
será de $8 millones de pesos; ası́ la ganancia esperada para PEMEX será de $7 millones
de pesos. Se incurrirá en una pérdida de un millón de pesos (el costo de barrenar) si no se
encuentra petróleo.
Solución. De acuerdo con los criterios de pago máximo, máxima posibilidad y la regla de
decisión de Bayes, las alternativas a elegir quedan como sigue. Las cantidades representadas
en las tablas están en decenas de millar, es decir, se deben de multiplicar por 10000 para
obtener la cantidad real.
Criterio del pago máximo: Este criterio, indica que se debe de elegir la acción de vender
el terreno, ya que es la máxima de las ganancias mı́nimas de cada alternativa. A continuación
se muestra el criterio en la siguiente tabla.
Estado de la naturaleza
Alternativa Petróleo Seco Mı́nimo
1. Perforar en busca de petróleo 700 −100 −100
2. Vender terreno 90 90 90 ← Valor máximo
Probabilidad a priori 0.25 0.75
Criterio de la máxima posibilidad: Se selecciona primero el estado con mayor proba-

bilidad, el cual se refiere a que no se encuentra petróleo con un 0.75 de probabilidad. Ahora
66
evaluando los pagos para cada alternativa en ese estado de la naturaleza, se selecciona la
alternativa con el pago máximo, como se muestra en la siguiente tabla.
Alternativa Petróleo Seco
1. Perforar en busca de petróleo 700 −100 −100
2. Vender terreno 90 90 90 ← Valor máximo en esta
columna

↑
Máximo
Regla de decisión de Bayes: Se calcula el pago esperado para cada alternativa, y se

elige la alternativa con mayor pago esperado.
E(Perforar) = 0.25(700) + 0.75(−100)

= 100
E(Vender) = 0.25(90) + 0.75(90)
= 90
Como 100 es mayor, se elige la alternativa de perforar en busca de petróleo, la cuál es

diferente a las elecciones de los otros criterios de decisión.
La gran ventaja de la regla de decisión de Bayes es que incorpora toda la información

disponible (todos los pagos y probabilidades), en contraste con el criterio de pago máximo
que sólo toma en cuenta los pagos y el criterio de máxima posibilidad que sólo toma en
cuenta los pagos del estado de la naturaleza más probable. Sin embargo, estas decisiones
están basadas en la probabilidad, la cual es inexacta y en muchas ocasiones obtenida a partir
de la experiencia, por lo que serı́a útil realizar un análisis de sensibilidad.
Análisis de sensibilidad con la regla de decisión de Bayes

Se realiza un análisis de sensibilidad para conocer el efecto que tendrı́an datos incorrectos
en el modelo matemático que se esta resolviendo. En este caso, las probabilidades son los
datos más cuestionables en este modelo.
Como solamente se tienen dos estados de la naturaleza, es posible evaluar graficamente
lo que sucede cuando varı́an las probabilidades a priori, esto es, si una aumenta, la otra
disminuye. La administración de PEMEX cree que la posibilidad ideal de encontrar petróleo
en el área debe de estar entre 15 % y 35 %. En otras palabras, es posible que la probabilidad a
priori verdadera de encontrar petróleo oscile entre 0.15 y 0.35, de manera que encontrar que
el terreno esté seco tandrá probabilidad a priori entre 0.85 y 0.65.
Sea
p = probabilidad a priori de encontrar petróleo
el pago esperado de perforar para cualquier valor de p es
67
E(Perforar) = 700p − 100(1 − p)

= 800p − 100
Este pago esperado de ambas alternativas se muestran como dos rectas en la Fig. 2.4. El
pago esperado de perforar es la recta con pendiente positiva y el pago esperado de vender es
la recta horizontal (debido a que tiene un valor de 90 para ambos estados de la naturaleza).
También se pueden observar cuatro puntos en la Fig. 2.4, los cuales muestran el pago esperado
para las dos alternativas de decisión cuando p = 0.15 o p = 0.35. Cuando p = 0.15 la decisión
se inclina a vender el terreno, ya que se obtiene un pago esperado de 90 contra un pago
esperado de 20 para la alternativa de perforar. Por el contrario, cuando p = 0.35 la decisión
es perforar por un amplio margen (pago esperado de 180 contra sólo 90 de vender). Entonces,
la decisión es muy sensible a la probabilidad a priori de encontrar petróleo.
Figura 2.4: Cambio del pago esperado para cada acción cuando cambia la probabilidad a priori.
En la Fig. 2.4, se observa un punto en el que ambas rectas se intersectan. Este punto es el
punto de cruce y es el que determina el cambio de decisión entre ambas alternativas. Para
encontrar este punto se establece
E(P erf orar) = E(V ender)

800p − 100 = 90
190
p= = 0.2375
800
Ası́, cuando la probabilidad a priori de encontrar petróleo sea mayor a 0.2375 se debe de
perforar y cuando sea menor se debe de vender.
68
2.2.2. Toma de decisiones con experimentación

Una persona que toma decisiones, necesita tener información precisa y confiable para po-
der tomar una decisión que no se vea afectada por la falta de confiabilidad de la información.
Por lo anterior, con frecuencia se realizan pruebas adicionales (experimentación) para mejorar
las estimaciones preliminares de los respectivos estados de la naturaleza dadas por las proba-
bilidades a priori. Estas estimaciones mejoradas se llaman probabilidades a posteriori . A
continuación se retoma el contexto establecido en el ejemplo 2.2 y se le agregan datos para la
experimentación.
Probablidades a posteriori
Para el cálculo de las probabilidades a posteriori, se utiliza el teorema de Bayes y el
teorema de la probabilidad total. Ahora para las variables aleatorias A y B, donde A representa
los resultados obtenidos por la experimentación y B representa los estados de la naturaleza
(probabilidades a priori. Ahora, en términos generales, sea
n =número posible de estados de la naturaleza

P (B = bi ) =probabilidad a priori de que el estado de la naturaleza sea el i,
para i = 1, 2, · · · , n
P (A = aj ) =probabilidad de obtener el resultado j, para j = 1, 2, · · · , m
P (B = bi | A = aj ) =probabilidad a posteriori del estado de la naturaleza i
dado el resultado j de la experimentación, para i = 1, 2, · · · , n
y j = 1, 2, · · · , m
P (A = aj | B = bi ) =probabilidad condicional (obtenida por datos históricos
del resultado de la experimentación j dado el estado de la naturaleza i
de la experimentación, para i = 1, 2, · · · , n y j = 1, 2, · · · , m
P (A, B) =probabilidad conjunta de A y B
Teorema 2.2 (Regla de Bayes [4]) Si los eventos B1 , B2 , · · · , Bk constituyen una parti-
ción del espacio muestral S donde P (Bi ) 6= 0 para i = 1, 2, · · · , k, entonces para cualquier
evento A en S tal que P (A) 6= 0,
P (B = br , A) P (B = br , A)
P (B = br | A) = = k , para r = 1, 2, · · · , k
P (A) X
P (B = bi , A)
i=1
En el teorema 2.2.2, se observa que para obtener las probabilidades a posteriori, es ne-
cesario calcular la distribución de probablidad conjunta de A, B y la probabilidad de A (los
resultados de la experimentación). Los datos que se conocen son las probabilidades a priori
(B) y las probabilidades condicionales P (A|B). Para calcular la probabilidad conjunta, se
utiliza el teorema 2.2.2 y las probabilidades a priori de la siguiente manera.
P (A = ai , B = bj ) = P (A = ai |B = bj )P (B = bj )
69
para i = 1, 2, · · · , n, j = 1, 2, · · · , m; esto es, que se tiene que calcular para todas los posibles
valores de las variables aleatorias A y B.
Posteriormente, se calcula la distribución de probabilidad de los resultados de la experi-
mentación o probabilidades incondicionales, P (A), de la siguiente forma
m
X
P (A = ai ) = P (A = ai , B = bj ) (2.4)
j=1
= P (A = ai , B = b1 ) + P (A = ai , B = b2 ) + · · · + P (A = ai , B = bm ) (2.5)
Finalmente se puede utilizar el teorema 2.2.2 para calcular las probabilidades a posteriori,
utilizando la probabilidades incondicionales y la distribución de probabilidad conjunta. A
continuación se muestra un ejemplo en el que se aplican estos resultados.
Ejemplo 2.3 En el ejemplo 2.2 se tienen dos estados de la naturaleza: que el terreno se
encuentre seco o con petróleo, y las estimaciones preliminares de la probabilidad a priori de
cada estado. Ahora se tiene acceso a realizar una exploración sismológica del terreno para
obtener una mejor estimación de la probabilidad de que haya petróleo. El costo de este estudio
es de $300 mil pesos.
Una exploración sismológica obtiene sondeos sı́smicos que indican si la estructura geológica
es favorable para la presencia de petróleo. Los resultados de la exploración sismológica se
dividen en las siguientes categorı́as:
SSD: sondeos sı́smicos desfavorables; es poco probable encontrar petróleo.

SSF: sondeos sı́smicos favorables; es bastante probable encontrar petróleo.
Con base en la experiencia, si hay petróleo, la probabilidad de sondeos sı́smicos favorables

es:
P (SSF |petroleo) =0.6
P (SSD|petroleo) =1 − 0.6 = 0.4
De la misma forma, cuando el terreno se encuentra seco, la probabilidad de sondeos sı́smicos
favorables es:
P (SSF |seco) = 0.2
P (SSD|seco) = 1 − 0.2 = 0.8
Determine las probabilidades incondicionales de los resultados de la exploración sismológica,
las probabilidades a posteriori de los estados de la naturaleza y aplique la regla de decisión de
Bayes para determinar la polı́tica óptima
Solución. Sea A la probablidad de obtener sondeos sı́smicos, entonces la variable aleatoria

toma los siguientes valores A = {SSF, SSD}. En el ejemplo 2.2 se proporcionan los valores de
los estados de la naturaleza B = {petroleo, seco}, y las probabilidades a priori de los mismos,
P (petroleo) = 0.25 y P (seco) = 0.75. A continuación, se muestran los valores de las probabi-
lidades condicionales de obtener un determinado resultado de la exploración sismológica una
vez que se conoce el estado de la naturaleza.
70
P (SSF |petroleo) = 0.6 P (SSF |seco) = 0.2

P (SSD|petroleo) = 0.4 P (SSD|seco) = 0.8
Con los datos anteriores, obtenemos la distribución de probabilidad conjunta,
P (A = SSF, B = petroleo) = P (SSF, petroleo)

= P (SSF |petroleo)P (petroleo)
= (0.6)(0.25) = 0.15
P (SSF, seco) = P (SSF |seco)P (seco)
= (0.2)(0.75) = 0.15
P (SSD, petroleo) = P (SSD|petroleo)P (petroleo)
= (0.4)(0.25) = 0.1
P (SSD, seco) = P (SSD|seco)P (seco)
= (0.8)(0.75) = 0.6
Para comprobar los resultados, verificamos que la suma de todas las probabilidades ante-
riores es 1, esto es sumar la probablidad conjunta para todos los valores de A y B.
2 X
X 2
P (A = ai , B = bj ) =P (SSF, petroleo) + P (SSF, seco)
i=1 j=i
+ P (SSD, petroleo) + P (SSD, seco)

=0.15 + 0.15 + 0.1 + 0.6
=1
A continuación obtenemos los valores de las probabilidades incondicionales utilizando la ecua-

ción 2.5.
P (A = SSF ) = P (SSF, petroleo) + P (SSF, seco)

= 0.15 + 0.15 = 0.30
P (SSD) = P (SSD, petroleo) + P (SSD, seco)
= 0.10 + 0.60 = 0.70
71
Finalmente, las probabilidades a posteriori de los estados de la naturaleza quedan como sigue
P (SSF, petroleo)
P (petroleo|SSF ) =
P (SSF )
0.15
= = 0.50
0.3
P (SSF, seco)
P (seco|SSF ) =
P (SSF )
0.15
= = 0.50
0.3
P (SSD, petroleo)
P (petroleo|SSD) =
P (SSD)
0.10
= = 0.1429
0.70
P (SSD, seco)
P (seco|SSD) =
P (SSD)
0.60
= = 0.8571
0.70
Por lo que la probabilidad de encontrar petróleo una vez que se conoce el resultado del estudio
sismológico es 0.5 cuando el sondeo es favorable y 0.1429 cuando el sondeo es desfavorable.
Asimismo, la probabilidad de que el terreno se encuentre seco es 0.5 y 0.8571, cuando el sondeo
es favorable y desfavorable respectivamente.
De acuerdo a los pagos establecidos para la combinación de cada alternativa y estado de
la naturaleza, y las probabilidades a posteriori obtenidas anteriormente, se calcula el pago
esperado para cada alternativa dependiendo del resultado del estudio realizado. A este pago
esperado se resta el costo del estudio.
E(perf orar|SSF ) = P (petroleo|SSF )P ago(perf orar, petroleo) + P (seco|SSF )P ago(perf orar, seco)
= 0.5(7000000) + 0.5(−1000000) − 300000 = 2700000
E(vender|SSF ) = P (petroleo|SSF )P ago(vender, petroleo) + P (seco|SSF )P ago(vender, seco)
= 0.5(900000) + 0.5(900000) − 300000 = 600000
E(perf orar|SSD) = P (petroleo|SSD)P ago(perf orar, petroleo) + P (seco|SSD)P ago(perf orar, seco)
= 0.1429(7000000) + 0.8571(−1000000) − 300000 = -156800
E(vender|SSD) = P (petroleo|SSD)P ago(vender, petroleo) + P (seco|SSD)P ago(vender, seco)
= 0.1429(900000) + 0.8571(900000) − 300000 = 600000
Como el objetivo es maximizar el pago. Se evalúa la polı́tica óptima para cada resultado
del estudio. Entonces, cuando se obtienen sondeos sı́smicos favorables (SSF ), la alternativa
es perforar obteniendo un pago esperado de $2, 700, 000. Cuando se obtienen sondeos sı́smicos
desfavorables (SSD), la alternativa es vender con un pago esperado de $600, 000.
72
En la siguiente sección se estudiará como obtener una cantidad que representa el valor
recomendable para la experimentación, con el fin de conocer si es factible pagar por la expe-
rimentación.
El valor de la experimentación
Antes de realizar cualquier experimento, debe determinarse su valor potencial. Se pre-
sentan aquı́ dos métodos complementarios para evaluar su valor potencial. Estos métodos se
llaman Valor Esperado de la Inforamación Perfecta (V EIP ) y Valor Esperado de la Experi-
mentación (V EE). A continuación, se describe el primero.
Valor esperado de la información perfecta

En este método se supone que la experimentación elimina toda la incertidumbre (algo poco
realista) acerca de cual es el verdadero estado de la naturaleza y después realiza un cálculo
sobre la mejora en el pago esperado, ignorando el costo de la experimentación. El VEIP
establece una cota superior para el valor potencial del experimento, por lo que si el costo del
experimento se encuentra por debajo del VEIP, definitivamente debe llevarse a cabo.
Suponga ahora que el experimento puede identificar de manera definitiva cuál es el verda-
dero estado de la naturaleza y proporcionar con esto información ”perfecta. Cualquiera que
sea el estado de la naturaleza identificado, se eligirá la acción con el máximo pago para ese
estado. Al no saber en realidad, el estado que se identificará, se pondera el pago máximo para
cada estado de la naturaleza con la probabilidad a priori.
El V EIP se calcula como sigue:
V EIP = P EIP − P EsE
donde P EIP es el pago esperado con información perfecta y P EsE es el pago esperado sin
el costo de la experimentación. En la tabla 2.5 se muestra como queda el calculo para el pago
esperado con información perfecta.
Alternativa Petróleo Seco
1. Perforar en busca de petróleo 700 −100
2. Vender terreno 90 90
Pago máximo 700 90
P EIP = 0.25(700) + 0.75(90) = 242.5
Figura 2.5: Pago esperado con información perfecta para el problema de PEMEX
Anteriormente se obtuvo el pago esperado sin experimentación, utilizando la refal de de-

cisión de Bayes, con un valor de 100. Por lo tanto,
V EIP = 242.5 − 100 = 142.5

Como $1, 425, 000 excede por mucho a $300000, el costo del sondeo sı́smico, puede valer
la pena proceder con la experimentación. Para confirmar este hecho, se estudiará un segundo
método de evaluación del beneficio potencial de la experimentación.
73
Valor esperado de la experimentación

Este cálculo requiere mayor trabajo, debido a que incorpora las probabilidades a posteriori
para obtenerlo. Primero debe obtenerse el pago esperado con experimentación (P EcE) y
sustraerle el pago esperado sin experimentación (P EsE), obteniendo el valor esperado de la
experimentación (V EE).
V EE = P EcE − P EsE (2.6)

]
El cálculo del P EcE requiere realizar lo siguiente:
1. Obtener todas las probabilidades a posteriori.
2. La polı́tica óptima con experimentación.
3. El pago esperado correspondiente a la polı́tica óptima, excluyendo el costo de la experi-

mentación.
4. Ponderar cada pago esperado con la probabilidad del resultado de la experimentación

correspondiente.
n
X
P EcE = P (A = aj )E(AOpt|A = aj )
j=1
donde AOpt es la alternativa óptima para el valor correspondiente de aj (resultado de la

experimentación).
Retomando la información obtenida en el ejemplo 2.3, obtengamos el V EE. De acuerdo al
ejemplo de la compañı́a PEMEX, el pago esperado excluyendo el costo de la experimentación,
para la polı́tica óptima de los resultados se tiene que:
P (SSF ) = 0.3
P (SSD) = 0.7
E(perf orar|SSF ) = 300
E(vender|SSD) = 90
Por lo que,
P EcE = P (SSF )E(perf orar|SSF ) + P (SSD)E(vender|SSD)

= 0.3(300) + 0.7(90) = 153
En este momento se puede calcular el valor esperado de la experimentación. Utilizando la

ecuación 2.6 se tiene que:
V EE = 153 − 100 = 53
Como $530, 000 excede el costo de $300, 000 correspondiente al estudio sismológico, la expe-
rimentación debe de realizarse.
74
2.2.3. Árboles de decisión

Un árbol de decisión es un modelo gráfico, que nos proporciona un medio para tomar una
serie de decisiones, que nos pueden llevar por diferentes caminos debido a la incertidumbre
de los resultados que pueden producir cada decisión tomada. En esta sección se estudiarán
los elementos de un árbol de decisión, la forma de organizar los cálculos estudiados en las
secciones anteriores y la forma de realizar el análisis del árbol que nos indique como se deben
de tomar las decisiones y encontrar una polı́tica óptima.
Heizer [1], propone el siguiente procedimiento para formar un árbol de decisión:
1. Asegúrese de que todas las alternativas y los estados de la naturaleza posibles estén
incluidos en el árbol.
2. Los pagos se introducen al inicio de la rama apropiada y en los nodos hoja (los que
están al final del árbol), se introduce el pago de esa ruta.
3. Las probabilidades se colocan en las ramas de los nodos probabilı́sticos encerradas entre
paréntesis.
4. El objetivo es determinar el pago esperado de cada curso de acción. Lo logramos co-

menzando al final del árbol (el lado derecho) y trabajando hacia el inicio del árbol (la
izquierda), calculando los pagos esperados de cada nodo y “podando” las alternativas
que no son tan buenas como otras que salen del mismo nodo.
Los árboles de decisión están compuestos por dos elementos básicos, nodos y ramas. Los
nodos son los puntos de ramificación del árbol y los arcos que unen dos nodos son las ramas.
Los nodos se clasifican en: nodo de decisión y nodo pro-

babilı́stico. Un nodo de decisión indica que en ese punto del
proceso debe de tomarse una decisión. Un nodo probabilı́stico
indica que en ese punto ocurre un evento aleatorio. En la Fig.
2.6, se puede observar que un nodo de decisión se representa
por un cuadrado y el probabilı́stico por un cı́rculo. Además se Figura 2.6: Tipos de nodos en un
árbol de decisión.
utiliza una letra para identificar al nodo en el árbol, con el ob-
jetivo de que al realizar el análisis se pueda saber a que nodo
corresponden los cálculos realizados.
No existe un método para la construcción de la estructura de un árbol de decisión (el
orden en el que se toman las decisiones, se esperan por resultados y se toman otras decisiones),
sin embargo, por lo general cuando existe experimentación en nuestro problema deberı́a ser
la primera decisión a considerar y dependiendo de los resultados seguirı́an las decisiones
subsecuentes.
Lo que sigue después de que se construye la estrucura del árbol es colocar los pagos
correspondientes de cada decisión y al final de la ruta, el pago correspondiente a esa ruta.
Posteriormente se colocan las probabilidades correspondientes (a priori, de la experimentación
y a posteriori) en cada una de sus ramas y se procede a realizar el análisis del árbol de decisión.
75
Realización del análisis
Una vez construido el árbol de decisión con todos sus elementos, se puede analizar el
problema con el siguiente procedimiento:
Procedimiento 2.1 1. Inicie en el lado derecho del árbol de decisión y muévase a la

izquierda una columna a la vez. En cada columna, realice el paso 2 o el 3 según si los
nodos en esa columna son de probabilidad o de decisión.
2. Para cada nodo de probablidad, calcule su pago esperado. Para ello, debe de multiplicar
el pago esperado de cada rama por la probabilidad de esa rama y después sumar todos
los productos obtenidos. Coloque esta cantidad arriba del nodo.
3. En cada nodo de decisión, compare los pagos esperados de sus ramas y seleccione la
alternativa cuya rama tenga el mayor pago esperado. Las alternativas no seleccionadas
se “podan” con una doble raya como barrera.
Ejemplo 2.4 Construya el árbol de decisión del problema de PEMEX (Ej. 2.2 y Ej. 2.3).
Coloque los pagos y las probabilidades donde corresponde en el árbol, realice el análisis del
árbol y determine la polı́tica óptima.
Solución. Lo primero es construir la estructura del árbol, considerando que primero se debe
decidir si realizar o no el sondeo sı́smico, para posteriormente decidir, dependiendo del resul-
tado del sondeo, si perforar o vender el terreno. Observe que en la Fig. 2.7, la primera decisión
a considerar es si hacer o no el sondeo sı́smico. Si se decide hacer el sondeo, dependiendo del
resultado, se decide si se perfora o se vende, al igual que si no se decide hacer el sondeo.
Figura 2.7: Estructura del árbol para el problema de PEMEX
76
Ahora, se colocan los pagos correspondientes en cada rama, y al final de la ruta, la suma
de estos pagos. También se colocan las probabilidades a priori (cuando no se realiza la expe-
rimentación), de los resultados de la experimentación (encerradas en óvalos en la Fig. 2.8) y
las probabilidades a posteriori (encerradas en rectángulos en la Fig. 2.8).
Figura 2.8: Probabilidades de la experimentación y a posteriori
Se realiza el análisis del árbol calculando el pago esperado de cada nodo como se describe
en el procedimiento 2.1. Primero, se calculan los pagos de los nodos g y h.
Nodo g: P E(g) = 0.1429(6700000) + 0.8571(−1300000) = −156800
Nodo h: P E(h) = 0.5(6700000) + 0.5(−1300000) = 2700000
Estos pagos esperados se colocan en abajo a la izquierda del nodo, como se muestra en
la Fig. 2.9. A continuación se hace un movimiento una columna a la izquierda, que consiste
en los nodos d, e y f. El pago esperado de un nodo de decisión se obtiene como el mayor de
los pagos esperados de los nodos inmediatos (si la alternativa no tiene un nodo inmediato, se
toma el pago esperado al final de la rama). Por lo tanto, los pagos esperados de los nodos d,
e y f quedan como sigue.
Nodo d: Como P E(vender) > P E(perf orar), es decir 600000 > −156800, entonces el P E(d) =
600000. Se elige la alternativa de vender.
Nodo e: Como P E(perf orar) > P E(vender), es decir 2700000 > 600000, entonces el P E(e) =
2700000. Se elige la alternativa de perforar.
Nodo f: P E(f ) = 0.25(7000000) + 0.75(−1000000) = 1000000
La alternativa seleccionada en un nodo de decisión se muestra con un grosor de lı́nea mayor

y la(s) alternativa(s) rechazadas se indica(n) con la inserción de una doble raya. Después el
proceso se mueve una columna más a la izquierda para calcular los pagos esperados de los
nodos b y c, quedando como sigue:
77
Nodo b: P E(b) = 0.7(600000) + 0.3(2700000) = 1230000

Nodo c: Como P E(perf orar) > P E(vender), es decir 1000000 > 900000, entonces el P E(c) =
1000000. Se elige la alternativa de perforar.
Por último, el proceso se mueve al nodo de la izquierda a, un nodo de decisión. Con la
aplicación del paso 3 del procedimiento se obtiene
Nodo a: Como P E(Con sondeo sı́smico) > P E(Sin sondeo sı́smico), es decir 1230000 > 1000000,
entonces el P E(a) = 1230000. Se elige la alternativa de realizar el sondeo sı́smico.
Al seguir las trayectorias abiertas de izquierda a derecha en la Fig. 2.9 se llega a la siguiente
polı́tica óptima.
Polı́tica óptima: Realizar el sondeo sı́smico. Si el resultado es desfavorable (SSD), vender
el terreno. Si el resultado es favorable (SSF), perforar en busca de petróleo. El pago esperado
(que incluye los costos del sondeo) es de 123000.
TreePlan Student License 0.1429 For Education Only

Petróleo
$6,700,000.00
Perforar $8,000,000.00 $6,700,000.00
g
-$1,000,000.00 -$156,800.00 0.8571
0.7 Seco
SSD -$1,300,000.00
d $0.00 -$1,300,000.00
$0.00 $600,000.00
Vender
$600,000.00
$900,000.00 $600,000.00
Con sondeo sísmico
b 0.5
-$300,000.00 $1,230,000.00 Petróleo
$6,700,000.00
Perforar $8,000,000.00 $6,700,000.00
h
-$1,000,000.00 $2,700,000.00 0.5
0.3 Seco
SSF -$1,300,000.00
e $0.00 -$1,300,000.00
$0.00 $2,700,000.00
a Vender
$1,230,000.00 $600,000.00
$900,000.00 $600,000.00
0.25
Petróleo
$7,000,000.00
Perforar $8,000,000.00 $7,000,000.00
f
-$1,000,000.00 $1,000,000.00 0.75
Seco
Sin sondeo sísmico -$1,000,000.00
c $0.00 -$1,000,000.00
$0.00 $1,000,000.00
Vender
$900,000.00
$900,000.00 $900,000.00
Figura 2.9: Árbol de decisión final del problema de PEMEX
2.3. Cadenas de Markov

El análisis de Markov tuvo su origen en los estudios de Andrei A. Markov (1856 - 1922)
sobre la secuencia de los experimentos conectados en cadena, y en los intentos de describir
78
2.3. CADENAS DE MARKOV
matemáticamente los fenómonos fı́sicos conocidos como movimiento browniano. La primera

construccción matemática correcta de un proceso de Markov con trayectorias continuas se
debe a N. Winier en 1923. La teorı́a general de los procesos de Markov se desarrollaron en las
décadas de 1930 y 1940 por A. N. Kolmagoron, W. Feller, W. Doeblin, P. Levy, J. L. Doob
y otros.
El análisis de Markov es una forma de analizar el moviemiento actual de alguna variable,
a fin de pronosticar el movimiento futuro de la misma. Ese método ha comenzado a usarse
como instrumento de investigación de mercadotecnia, para investigar el comportamiento y
lealtad de los clientes.
2.3.1. Procesos estocásticos

Considere un sistema que puede caracterizarse por estar en cualquiera de un conjunto de
estados previamente especificado. Suponga que el sistema evoluciona o cambia de un estado
a otro a lo largo del tiempo de acuerdo con cierta ley de movimiento, sea Xt el estado del
sistema al tiempo t. Si se considera que la forma del sistema es provocado por algún mecanismo
azaroso, entonces X(t) = Xt es una variable aleatoria para cada valor del ı́ndice t. Esta
colección de variables aleatorias es la definición de un porceso estocástico y sirve como modelo
para representar la evolución aleatoria de un sistema a lo largo del tiempo.
Definición 2.1 Un proceso estocástico es una colección de variables aleatorias {Xt | t ∈ T }

parametrizado por un conjunto T , llamado espacio parametral, en donde las variables toman
valores en un conjunto S llamado espacio de estados.
Para cada instate t tendremos una variable aleatoria distinta representada por Xt , con
lo que un proceso estocástico puede interpretarse como una sucesión de variables aleatorias
cuyas caracterı́sticas pueden variar a lo largo del tiempo.
Si observamos unos valores de t tendrı́amos una imagen similar a la siguiente:
en la imagen se representa que para cada t la función de densidad correspondiente a Xt .

Aunque se presentan funciones de densidad diferentes para cada t, un proceso estocástico
no tiene porque presentar diferencias en la función de denisad de probabilidad a lo largo del
tiempo.
A los posibles valores que puede tomar una variable aleatoria se le denomina estados, por
lo que puede tener un espacio de estados discreto o es espacio de estados continuos.
79
Dependiendo de como sea el conjunto de sunı́ndices T y el tipo de variables aleatorias

dado por Xt se puede establecer la siguiente clasificación de los procesos estocásticos.
t discreta t continua
X discreta Proceso de estado discreto y tiem- Proceso de estado discreto y tiem-
po discreto (Cadena) (Unidades po continuo (proceso de saltos pu-
producidas mensualmente de un ros)(Unidades producidas al tiem-
producto) po t)
X continua Proceso de estado continuo y tiem- Proceso de estados continuo y
po discreto (Toneladas de produc- tiempo continuo (Proceso conti-
ción diaria de un producto) nuo)(Velocidad de un vehı́culo al
instante t)
2.3.2. Procesos de estados discreto

En el caso de procesos estocásticos con espacios de estados discretos, una sucesión de va-
riables que indique el valor del proceso en instantes sucesivas suele representase de la siguiente
manera:
{X0 = x0 , X1 = x1 , . . . , Xn−1 = xn−1 , Xn = xn }

en la que cada varaible Xi , i = 0, . . . .n tiene una distribución de probabilidad que, en general,
es distinta de las otras variables aunque podrı́a tener caracterı́sticas comunes.
2.3.3. Cadenas de Markov

Cadenas de Markov
2.3.4. Ecuaciones de Chapman-Kolmogorov

Las potencias
2.3.5. Propiedades a largo plazo de las cadenas de Markov

las
80
Bibliografı́a
[1] J. Heizer and B. Render. Principios de Administración de Operaciones. Pearson, 7a

edition, 2009.
[2] F. Hillier. Introduction To Operations Research. McGraw-Hill Education (India) Pvt

Limited, 2012.
[3] H. A. Taha. Operations Research: An Introduction (8th Edition). Prentice-Hall, Inc.,

Upper Saddle River, NJ, USA, 2006.
[4] R. Walpole, R. Myers, and S. Myers. Probabilidad y estadı́stica para ingenieros. Pearson:
Educación. Pearson Educación, 1999.
[5] W. Winston. Investigación de operaciones: aplicaciones y algoritmos. Thomson, 2005.
81

NotasInvOpII PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

NotasInvOpII PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Índice general

1.1. Algoritmos de optimización en redes

4. Determinación del cronograma (fechas de inicio y terminación) para las actividades de

Figura 1.1: Red de nodos y arcos.

Figura 1.2: Red dirigida de nodos y arcos.

1.1.2. Árbol de expansión mı́nima

Algoritmo del problema del árbol de expansión mı́nima [2]

2. Se identifica el nodo no conectado más cercano a un nodo conectado y se conectan estos

Como lo indica el algoritmo, se inicia seleccionando de manera arbitraria un nodo, sea O.

El nodo no conectado más cercano a los nodos O, A, o B es el nodo C (conectando con

El nodo no conectado más cercano a los nodos O, A, B o C, es el nodo E (conectando

El nodo no conectado más cercano a los nodos O, A, B, C o E es el nodo D (conectando

En la Iteración 2, se encuentran conectadas las zonas 1 y 5, y la distancia mı́nima a las

En la Iteración 3, se encuentran conectadas las zonas 1, 5 y 4, y la distancia mı́nima a las

En la Iteración 4, se encuentran conectadas las zonas 1, 5, 4 y 8, y la distancia mı́nima a

En la Iteración 5, se encuentran conectadas las zonas 1, 5, 4, 8 y 7, y la distancia mı́nima

En la Iteración 6, se encuentran conectadas las zonas 1, 5, 4, 8, 7 y 6, y la distancia mı́nima

En la Iteración 7, se encuentran conectadas las zonas 1, 5, 4, 8, 7, 6 y 3, y la distancia

1.1.3. Algoritmo de flujo máximo

2. Los nodos restantes son nodos de trasbordo.

Paso 2. a) Determine Si el conjunto de nodos no etiquetados j al que se puede llegar direc-

Paso 3. a) Determine k ∈ Si de modo que

cik = máx {cij }

b) Designe ak = cik y etiquete el nodo k con [ak , i].

a) Si i = 1 (el conjunto S1 = ∅), no es posible avanzar; continúe al paso 6. De lo

Paso 5. (Determinación de las capacidades residuales).

b) Actualizar las capacidades residuales de la ruta Np reduciendo en fp la capacidad

(α, β) = (C ij − cij , C ji − cji )

Si α < 0, el flujo óptimo es α en dirección i → j. Por otra parte si β > 0,

Figura 1.5: Red de flujo.

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 2. S1 = {2, 3, 4} (6= ∅).

(c13 , c31 ) = (30 − 20, 0 + 20) = (10, 20)

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 2. S1 = {3, 4}.

(c13 , c31 ) = (10 − 10, 20 + 10) = (0, 30)

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 3. k = 4 y a4 = c14 = 10 y etiquete el nodo 4 con [10, 1]. Establezca i = 4 y repita el

Paso 2. S4 = {3, 5}.

Paso 3. k = 3 y a3 = c43 = 15 y etiquete el nodo 3 con [15, 4]. Establezca i = 3 y repita el

Paso 2. S3 = ∅. Vaya al paso 4.

Paso 4. Retroceso. La etiqueta [15, 4] en el nodo 3, proporciona el nodo inmediatamente

(c14 , c41 ) = (10 − 10, 0 + 10) = (0, 10)

Paso 1. Establezca a1 = ∞ y etiquete el nodo 1 con [∞, −]. Establezca i = 1.

Paso 6. El flujo máximo en la red es F = f1 + f2 + f3 + f4 + f5 = 20 + 10 + 10 + 10 + 10 = 60

Ciudades Número máximo de vuelos diarios

Juneau Seattle Denver Dallas

la red de estaciones del parque en forma matricial. Posteriormente se utiliza la aplicación

Figura 1.19: Iteración 6, no se encontró ruta de avance.

las otras estaciones y finalmente al mirador.

Figura 1.20: Solución al problema de los viajes al mirador en Seervada Park..

a) La producción diaria en cada refinerı́a que iguala la capacidad máxima de la red.

b) La demanda diaria en cada terminal que iguala la capacidad máxima de la red.

c) La capacidad diaria en cada bomba que iguala la capacidad máxima de la red.

a) Determine el programa que satisface la demanda máxima.

b) ¿Satisfará el programa propuesto toda la demanda de las granjas?

Hijo Tarea preferida

a) Cada hijo puede realizar sólo 1 tarea.

b) Cada hijo puede realizar más de 1 tarea.

Fábrica Combinación de producciones de juguetes

Ejercicio 1.5 El consejo acádemico de la Universidad de Arkansas está buscando represen-